martes, 29 de septiembre de 2009

REPRESENTACION EN FORMA DE GRAFO DE LA VARIEDAD GENETICA

INTRODUCCION

El código genético se encuentra inscrito en el ADN el cual es una cadena de base 4, siendo sus bases  las moléculas Adenosina, Citosina, Tiamina (o Uracilo) y Guanina. Un conjunto de 3 bases tomados  en orden  tiene asociado en la trascripción un aminoácido determinado que participa en la construcción de una proteína, de modo que el ADN puede simplificarse en una cadena que tiene como base 20 aminoácidos diferentes y 1 orden de parada de trascripción, 20+1.  Los aminoácidos que se encuentran entre dos órdenes de parada consecutivos se considera que pertenecen al mismo gen

En la mayor parte de los organismos complejos el código genético se encuentra dividido en múltiples cadenas de ADN, a modo de tomos de una enciclopedia, denominados cromosomas. Cada cromosoma tiene otro cromosoma homologo asociado, de modo que en un organismo complejo existen dos copias de un mismo gen, no teniendo por que ser estas copias necesariamente idénticas. Los cromosomas tienen un papel fundamental en la reproducción sexual de las especies dado que tanto el macho como la hembra aportan al azar uno de los cromosomas homólogos, permitiendo así una diversificación de los vástagos.


EL GRAFO W




El ADN completo de un organismo puede simplificarse a una  cadena continua de longitud N con una base de 21 elementos que permutan. A cada genotipo fruto de las permutaciones posibles se le puede asociar un nodo en un grafo. Cada nodo estará unido con otros nodos a través de  aristas mutagénicas, las aristas representan un proceso mutagénico sencillo como puede ser cambiar una determinado aminoácido por otro, introducir un nuevo aminoácido entre  los preexistentes o eliminar uno presente.  De modo que para un genotipo de longitud N existen 21(N+1)+(20N)+N = 42N+21 aristas mutagénicas o nodos contiguos, de los cuales 20N son entre nodos de la misma longitud y 21N+21 entre nodos de longitud superior y N entre nodos de longitud inferior.

En realidad existen otros procesos mutagénicos complejos, estos procesos no tendrán arista propia sino que estarán representados en una sucesión de aristas elementales. Se considerara que un proceso mutagénico complejo que une un nodo A y C esta compuesto por el numero mínimo de aristas mutagénicas que unen A y C.

Aparte de las aristas mutagénicas se contemplan las aristas recombinatorias, estas aristas unen 3 nodos que están vinculados por una relación de herencia. Es la representacion de la reproducción sexual entre individuos de la misma especie,  una de las cadenas origen intercambia cromosomas con la otra cadena origen dando lugar a una nueva cadena destino. Si C es el número de cromosomas, el número de aristas recombinatorias que involucran a dos nodos cualesquiera será:


Cuanto mayor sea el número de cromosomas mayor será el número de nodos destino. Del mismo modo que los procesos mutagénicos complejos, estas aristas pueden descomponerse en un conjunto mínimo de aristas mutagénicas que unen los 3 nodos.  Por tanto el conjunto de las aristas mutagénicas comprende la totalidad de alteraciones que pueden conducir de un nodo a otro cualquiera.

El grafo W es aquel que contiene la totalidad de los nodos y de las aristas mutagénicas. Es posible organizar  los nodos de modo que la distancia entre dos nodos cualesquiera sea proporcional al numero de aristas mínimas que hay que recorrer para ir de un nodo a otro si el grafo es representado en un numero suficiente de dimensiones (*). De todos modos para tener una visión intuitiva de la misma puede visualizarse en 3D, se le supondrán las siguientes características:

. Que los nodos están ordenados por proximidad.
. Que la dirección X corresponde al número de elementos N del nodo. 
. Que la dirección Y corresponde al numero de cromosomas C del nodo.
. Que la dirección Z vertical corresponde a la entropía del nodo. La entropía es una medida del número de instrucciones mínimas necesarias para construir el código al que hace referencia el nodo.


LAS ESPECIES EN EL GRAFO W

Dada la existencia real de un genotipo (nodo) en un entorno biológico, este debe de pertenecer a una especie, dicho genotipo estará sujeto además a continua variación generación tras generación. Los nodos contiguos presentaran una variación mínima con respecto al primer nodo, de modo que se puede considerar que la gran mayoría de los nodos circundantes pertenecerán a la misma especie. Extendiendo el análisis nodo por nodo se puede entender que una especie estará constituida por un conjunto de nodos los cuales se encuentran interconectados, de modo que dado un nodo cualquiera de  la especie existe un camino de aristas mutagénicas que atravesando nodos de la misma especie lo comunican con cualquier otro nodo de la especie.

Sobre el grafo W cada especie ocupara un volumen continuo y  tendrá una o varias fronteras según la topología de este volumen. La frontera de una especie puede adentrarse en el interior de otra especie, es decir pueden existir nodos que pertenezcan a 2 o mas especies diferentes. Cuanto mas alejado este un nodo de la frontera tanto mayor será el numero de aristas necesarias para conectarse con un nodo de otra especie. Todo el grafo W puede clasificarse en estos volúmenes este modo, figuraran incluso aquellas especies que aun no han existido.


En la ilustración anterior se muestra con diferentes colores las diferentes especies, se han coloreado en dos colores aquellos genotipos que pertenecerían a dos especies. Pueden existir nodos que no pertenezcan a ninguna especie, siendo estos nodos los que no tienen viabilidad biológica, siendo previsiblemente estos nodos la gran mayoría de los nodos del grafo.

(*) Se trata de una conjetura.
                                                                                  .

1 comentario:

Anónimo dijo...

no entindo un carajo