04 julio, 2012

El poder computacional del ADN

[Entrada originalmente publicada el 4 de junio de 2011]

Ayer se publicó un interesante artículo en Science el cual ha sido muy comentado por los principales blogs de ciencia (aquí, aquí y aquí, por citar algunos ejemplos). La mayoría se ha enfocado en la capacidad de unos circuitos lógicos basados en moléculas de ADN para calcular la raíz cuadrada de algunos números (0, 1, 4 y 9), cuando lo más resaltante del artículo es que Lulu Qian y Erick Winfree, investigadores del Instituto Tecnológico de California (Caltech), han desarrollado un circuito lógico basado en 130 moléculas de ADN diferentes, la más grande conseguida hasta ahora.

Durante los últimos años, los científicos han buscado la forma de cambiar la base de los circuitos lógicos de las computadoras, pasar de los transistores (unos dispositivos electrónicos que llevan más de 60 años formando parte fundamental de nuestra tecnología) a moléculas o partículas subatómicas (estados cuánticos), con el fin de desarrollar computadoras mucho más potentes y pequeñas que contribuyan con el desarrollo de la nanotecnología


Los transistores se han hecho cada vez más pequeños, permitiendo desarrollar los microprocesadores, donde millones de transistores pueden caber en un diminuto chip; sin embargo, si su tamaño se sigue reduciendo, las interferencias de un transistor provocarían fallos en los transistores adyacentes, ya que cuando se llega a la escala de nanómetros, los electrones tienden a escapar de los canales por donde deberían circular.

La molécula de ADN, la cual codifica toda la complejidad de la vida en la Tierra, es quizá la forma más poderosa y precisa de almacenamiento y procesamiento de datos conocida, y su potencial aplicación en la computación está siendo investigada. El primer paso en el desarrollo de circuitos lógicos a base del ADN se hizo en 1994, cuando el Dr. Leonard Adleman usó estas moléculas para resolver un problema matemático. El año pasado, Park et al. desarrollaron operaciones lógicas basándose en la replicación del ADN y el Tamsir et al. lo hizo usando bacterias modificadas genéticamente.

logic-gatesLa base del funcionamiento de las computadoras que usamos hoy en día es la Lógica Booleana, que no es más que un sistema que convierte una señal de entrada (input) en una respuesta definida o señal de salida (output) en función a una orden o una operación lógica llamada puerta (gate). El output de una operación lógica puede ser el input para otra operación lógica, de esta manera, se construyen los circuitos lógicos. La expresión física de este operador booleano es la puerta lógica. Por ejemplo, las puertas de este operador booleano pueden ser: YES, AND, OR;  los cuales describen el tipo de salida que es generado en función a la señal de entrada.
Para explicar mejor esto, les daré un ejemplo sencillo. ¿Cómo funcionan los motores de búsqueda?

Si ponemos en un buscador la palabra “bacteria” (input), el operador booleano YES (gate), generará una lista de documentos que tienen la palabra “bacteria” (output).

Si ahora ponemos en el buscador las palabras “bacteria” AND “patógena”, se generará una lista de documentos donde estén presentes las dos palabras al mismo tiempo, o sea “bacteria patógena”.

Si ponemos “bacteria” OR “patógena”, se generará una lista de documentos donde aparecerán al menos una de las dos palabras, o bien “bacteria”, o bien “patógena”.
Hasta ahora, los circuitos lógicos basados en el ADN eran muy sencillos y limitados como para resolver problemas más complejos. Sin embargo, Qian & Winfree desarrollaron un circuito lógico basado en 130 moléculas de ADN, cuya base bioquímica es la hibridización y desplazamiento de secuencias complementarias de ADN.
El artículo es un poco denso, así que trataré de explicarles las unidades básicas usadas para desarrollar este circuito lógico que es capaz de calcular las raíces cuadradas del 0, 1, 4 y 9.

seesaw

Esta figura, que se ve recontra compleja, es la base del funcionamiento de el circuito lógico basado en el ADN. Pero no deben asustarse que verán que es bastante sencillo de entender…
  • Primero tenemos el operador lógico (gate) unido a la señal de salida (output),representado en la figura como gate-output. Esta formado por una hebra parcialmente doble de ADN. La secuencia naranja (S5) es el dominio de reconocimiento, la secuencia azul (T y su complementario T*) son los puntos de apoyo y la secuencia verde (S6) es la señal de salida (output).
  • Luego tenemos la señal de entrada, representado en la figura como input. Está formado por el mismo dominio de reconocimiento (S5) y punto de apoyo (T) del componente anterior (gate-output). Además tiene una secuencia señal roja (S2)
  • Después tenemos el umbral, representado en la figura como (threshold). Está formato por el dominio de reconocimiento (S5) y el punto de apoyo (T), además de la misma señal S2 de la anterior pero truncada (más corta, S2*).
  • Luego tenemos al estimulante, representado en la figura como (fuel). Está formado por el dominio de reconocimiento S5, el punto de apoyo T y una secuencia señal morada (S7).
  • Finalmente tenemos al reportero, representado en la figura como (reporter). Está formado por una hebra doble de ADN (la secuencia S6 con su complementaria) y el punto de apoyo T. En una de las hebras S6 tenemos un fluoróforo F (molécula fluorescente) y en la S6 complementaria tenemos un quencher Q o extintor (molécula que captura la fluorescencia emitida por F).
Ahora que tenemos los componentes básicos, veremos las tres reacciones básicas que cumplen en un circuito lógico.

seesaw-rx

La primera reacción es conocida como “vaivén”, “columpio” o “balancín”, como ustedes gusten llamarlo. Esta reacción consiste en que la señal de entrada, quien tiene la región de reconocimiento S5, se unirá al operador lógico a través del punto de apoyo T y desplazará al S5 y T complementario que estaban ahí, liberándose así la señal de salida (S5-T-S6) y quedando la señal de entrada emparejada con el operador lógico. La reacción puede ser reversible, o sea, la señal de salida puede actuar como señal de entrada y desplazar a la señal de entrada que tomó su lugar. En resumen, la señal de entrada libera a la señal de salida, la cual puede funcionar a manera de una nueva señal de entrada, de ahí el nombre de vaivén.

tresholding

La segunda reacción es conocida como “umbralización”, pero como suena fea la traducción del inglés prefiero llamarla reacción de “superar la valla”. Esta reacción consiste en que la señal de entrada, en vez de reaccionar con el operador lógico, se une al umbral y desplaza la secuencia de reconocimiento S5. El umbral, por ser más corto y sencillo, será preferido por la señal de entrada porque la cinética de la reacción es más rápida y termodinámicamente más favorable. Sin embargo, no se generará una señal de salida y la reacción se verá terminada (reacción “pacman”). Entonces, para poder superar esta valla, la concentración de la señal de entrada debe ser superior a la del umbral, para así poder también reaccionar con el operador lógico.

El estimulante puede ayudar a superar este umbral o a generar más señales de salida S6, ya que también cuenta con la secuencia de reconocimiento S5, pero con una señal de salida diferente, que puede o no participar en futuras reacciones.

reporter

La tercera reacción conocida como “reporte” nos sirve para ver los resultados de la operación lógica y saber si fue positiva o no. Esta reacción usa la señal de salida generada en la primera reacción (la de vaivén), donde se produce una secuencia de reconocimiento S6, la cual es complementaria a la S6 que porta la molécula fluorecente. Así que la señal de salida desplazará a la secuencia de reconocimiento S6 que porta al quencher o extintor y la molécula fluorescente de la cadena complementaria podrá emitir su luz libremente.

Ahora que tenemos todos los componentes y reacciones, podemos elaborar un circuito lógico más complejo, pero para ello debemos diseñar puertas lógicas en las que participen dos señales de entrada, como son AND (que sólo genera una señal de salida cuando las dos señales de entrada están presentes al mismo tiempo) y OR (que sólo genera una señal de salida cuando al menos una de las señales está presente).

AND-OR

Para ello simplemente basta con regular la concentración del umbral. Digamos que tenemos 10 señales de entrada A, 10 señales de entada B y 10 operadores lógicos. Si ponemos 15 secuencias umbral, se requerirá que las secuencias de entrada A y B estén presentes al mismo tiempo como para que la suma de ambas secuencias supere el valor de 15, para que se de la señal de salida. Así que tenemos la puerta lógica AND. Pero, si tan sólo ponemos un umbral de menos de 10 secuencias, o simplemente no ponemos un umbral, bastará que haya la presencia de una de las dos señales de entrada para generar una señal de salida.

Ahora sí tenemos todo lo necesario para elaborar un circuito lógico complejo. Qian & Winfree usaron 130 secuencias diferentes (usando las 5 estructuras básicas que acabamos de describir) para calcular la raíz cuadrada del 0, 1, 4 y 9 (cuyas raíces son exactas). Como sólo podemos tener dos valores (1 y 0, presencia y ausencia, hay o no hay), se hizo todo a partir de los números binarios de 4 caracteres: 0000 (0), 0001 (1), 0100 (4) y 1001 (9), obteniéndose el siguiente circuito: (no se asusten, se ve muy complejo… bueno, sí, asústense, porque es recontra complejo pero fácil de entender si captaron las secuencias básicas y reacciones que acabo de describir).

circuito-logico

Bueno, disculpen por ponerles este gráfico, pero lo hago no con el fin que lo analicen y lo entiendan, sino para que vean la complejidad que se puede obtener a partir de tan sólo cinco tipos diferentes de secuencias de ADN y tres reacciones de hibridización y desplazamiento.

Si bien todo se ve muy bonito, el principal inconveniente es que estas reacciones, o sea, el desarrollo de la operación lógica completa toma hasta 10 horas, que son millones de veces el tiempo que toma una simple calculadora de bolsillo en hacer los mismos cálculos. Sin embargo, la principal ventaja de esto es que se puede integrar fácilmente en los organismos vivos, por esta razón se están estudiando sus aplicaciones en el diagnóstico de enfermedades, el seguimiento de la eficiencia de tratamientos contra el cáncer y otras patologías, en la identificación de alergias y predisposiciones a distintas enfermedades genéticas y neurodegenerativas.




Referencia:


ResearchBlogging.orgLulu Qian, & Erik Winfree (2011). Scaling Up Digital Circuit Computation with DNA Strand Displacement Cascades Science, 332 (6034), 1196-1201 DOI: 10.1126/science.1200520

No hay comentarios.:

Publicar un comentario

Por favor, se respetuoso con tus comentarios y críticas. Cualquier comentario ofensivo será eliminado.

LinkWithin

Related Posts Plugin for WordPress, Blogger...