Virtual Laboratory Wiki
Advertisement

© Сергей Асташкин, 2006

Использование этой информации в коммерческих целях запрещенно. Но Вы можете копировать и перерабатывать данную статью в научных и образовательных целях, с последующим предоставлением результата на тех же правах. Для подробной информации см. Авторское право.




ЭВОЛЮЦИЯ - образование современных форм геномов

На начальной стадии развития живой материи на Земле происходил рост полимерных структур из смеси мономеров . Естественно принять , что синтез последовательностей из нуклеиновых оснований на этой стадии описывался обычным кинетическим уравнением . Закон этого роста можно описать с помощью гипотетического уравнения (1) полимеризации :

(1) a*A + b*B + c*C = AaBbCc ... Тогда скорость полимеризации представится следующим образом :

(2) V = K*[A]^a * ^b * [C]^c ... Где : V – скорость роста полимерной цепи из мономеров видов - A, B, C.. ; K – коэффициент ; [A], , [C]...- соответствующие концентрации ; a, b, c... - стехиометрические коэффициенты. Ясно , что нас интересует разница в скоростях роста в естественных условиях , когда концентрации оснований нестихеометричны. Для того чтобы исследовать поведение реакции полимеризации в этих случаях возможно принять следующие допущения : [A] = = [C] .. = [S] и

a = b = c .. = i/N тогда : (3) V(N) = K*[S]^i ; Где : [S] = гипотетическая средняя концентрация мономеров ; N = число видов нуклеиновых оснований ; i = длинна про-ДНК-РНК полимера

Когда одна из концентраций будет существенно меньше других ( например , примем – 0.5 * S ) , тогда получим : для : N(2)=2 и N(4)=4 , когда [S] = 1 при длинне ДНК-РНК = 100 оснований . Если одна концентрация будет : [C]=[0,5*S] , получим : R2/4= V(2)/V(4)= K*[S]^100 / ( [S]^75 * [0,5*S]^25 } = 1 /(0,5^25) Где : R2/4- отношение скоростей полимеризации : для N(2)=2 и N(4)=4 . Тогда : R2/4 = 1 / (0,5^25) ~ 3,3 * 10^7 Если данная концентрация будет меньше других ( например 50% [0.5*S] от других ) отношение скоростей полимеризации при прочих равных условиях будет ~ 3.3 * 10^7 как было бы , например , при вариантах : `A`+`T` и `A`+`T` + `C`+`G` или на семь порядков меньше .Таким образом,практичeски не были бы воспроизведены пары , как в нашем случае `C` +`G`. Принимая во внимание трудности связанные с естественным синтезом и стабильностью`C` , сделанное предположение является правдоподобным , в предположении естественного происхождения `C` . Таким образом ясно , что скорость полимеризации в случае двойничной модели будет на 7 порядков больше , так что, необходимо принять , первичные (архаичные) полимерные проДНК-РНК структуры - как бинарные комплементарные системы . Здесь возникает одно `НО` - мера архаичности ? Автор не считает , что простейшие (микробы) обязательно архаичны , более того , большинство из них новейшие простейшие . Статистический анализ было бы логично делать не на основе отношений `A`+`T`/`C`+`G` , а по длинне мултиплетов (A..),(T..),(C..),(G..)(A/T..)​,(C/G..) - например :АААААА. - А(6) – мультиплет . Так что , там где статистический смысл последовательностей начинает исчезать и возможно с высокой вероятностью считать их рудиментами. С другой стороны , в результате полиморфизма изофункциональных кластеров ДНК , структура также несет в себе ее историю происхождения и глубину эволюции кластеров , геномов . Ясно , что эволюционно , последующее появление еще одной пары : ` C`-`G` , позволило увеличить информационную емкость проДНК-РНК при той же термодинамической устойчивой длинне . С точки зрения последующей трансформации РНК , неоходимо признать , что эволюция нашла еще один способ `уплотнить ` ДНК информацию. Поэтому ,следует ожидать что в ( в отдельных геномах до 2-4 ) геномах , будет `чувствоваться` старая ДНК ( как `платформы` ) на которой шли активные мутационные процессы . Но это стало возможным с появлением ` собственного ` производства `- ` C` и `G `.

СРАВНЕНИЕ МУЛЬТИПЛЕТОВ ГЕНОМОВ

Таким образом, предлагается модель развития первичных живых матриц (PAM – Primary Alive Matrix ) где : `AT `-матрица была основной и древнейшей. Сохранены и биохимические ` START ` - `AUU ` и `STOP`-`UAA` кодоны . Матрица `CG` - появляется позже , когда появляется биохимический синтез этих нуклеиновых оснований . Очевидно , что когда синтез появился :`C` и `G` – начали замещать `A` и `T`- генетический материал. `CG` - матрица входила в древний геном сначала как несущественная ошибка .И наиболее древние копировали ее чисто механически. Но , когда источник – биохимические циклы синтеза `C` и `G`появились , их присутствие уже не лимитировало ( как другие ошибки ) развитие и самовоспроизводство. И новая пара нуклеиновых оснований нашла свое место в эволюции . Ясно , что мы находимся далеко от этой удивительной эпохи – ДВОЙНИЧНОЙ ЖИЗНИ . С другой стороны , мы можем наблюдать сложные эволюционные процессы :

  1. Распад `AT ` платформ ,
  2. Замещение `AT ` платформ - `CG ` платформами .
  3. Вырождение `AT ` - платформ .
  4. Вырождение `CG ` - платформ .

Распад матриц мы можем определить из следующих соображений :

Примем : Скорость распада мультиплета размера (N) - зависит от его связанности с геномом : (4) dN/dt = F(N) Где: N – размер мультиплета . F(N) - функция зависящая от `N` размера мультиплета и его `связанности`с геномом . t - `нормализованное`време. Скорость распада количества мультиплетов - (n) пропорциональна их количеству : (5) dn(N) / dt = Kn * n(N) Где: n(N) – количество мультиплетов с `N` – размерами Kn – коэффициент . Используя уравнения (5) and (6) получаем : (6) dN = F(N) * dn/(( Kn )* n(N) ) Функция F(N) – зависит от степени участия мультиплетов в жизненно-важных кластерах : как `ключей ` , ` инициирующих последовательностей` и знаков препинанния в `граматике` генома . Можно ожидать три простейших случая : (7) а) F(N) = KN* N - когда мультиплеты размера -`N` не связаны своим размером с функциями геномома ; Где: KN – Коэффициент характеризующий связь мультиплетов `N` – размера с геномом ( связь слабая ) ; б) F(N) = KN – когда мультиплеты `N` – размера связаны своими кодирующими свойствами с геномом ; в) F(N) = KN / N - когда мультиплеты размера `N` сильно связаны своим размером с функциями геномома и их приемлимая для генома мутация пропорциональна их размеру ; Соответственно получаем основные зависимости `N` от` n(N)` : (8) для 7 а Ln ( Ni/Nk ) = K1 * Ln ( n(Ni) / n(Nk) ) (9) для 7 б Ni -Nk = K1 * Ln (n(Ni) / n(Nk) ) (10) для 7 в Ni2 -Nk2 = K1 * Ln (n(Ni) / n(Nk) ) Где : К1 = KN / Kn

Можно ожидать, что разные размеры и виды мультиплетов будут находиться в различной зависимости от генома и, соответственно, описываться различными уравнениями . Эти зависимости позволяют измерять `дискретное` значение скорости мутаций в отдельных участках кластеров геномов . Ясно , что эти значения носят вероятностный характер и требуют дополнительных подтверждений. Обычно функция F(N) - имеет отрицательное значение , при ее положительном значении мы будем иметь рост размеров мультиплетов .

СТАТИСТИКА

Проведен статистический анализ геномов из различных классов живых организмов на присутствие мультиплетов из `A`, `T`, `A`+`T`, `C`+`G`, `AT`, `CG`. Статистический анализ проводился подсчетом мультиплетов (например: `А` – сумм ААА, `A`+`T` and `C`+`G` - простой суммой соответствующих размеров мультиплетов `A` и `T`, `C` и `G`- соответственно. `AT` и `CG` - заменой `T` на `A`, и `G` на `C` соответственно в исследуемом геноме. Таким образом был показан заместительный принцип роста содержания `C` + `G` во всех исследованных организмах.

FIG.1 СОВРЕМЕННыЙ (геном) A- E.Coli genome 0157-H7 , B- Encephalitozoon cuniculi Chr 4 , C - Giardia lamblia Chr 1 . FIG.2 НОВыЙ тип I – A- Condida Chr J , B- Saccharomyces cerevisiae Chr 2 , C-Yarrowia lipolica Chr f

FIG.3 НОВыЙ тип I , B- Trypanosoma brucei Chr 2 ,C- Plasmodium falciparum Chr 6. FIG.4 НОВыЙ тип I , A- Caenorhabditis Elegans Chr IV,B- Drosophila melanogaster Chr 3L , CArabidopsis thaliana Chr 1 , FIG 5 – Fugu cluster.

FIG.5 НОВыЙ тип I , B- Homo Sapiens Chr 7 , C- Mouse Chr 4 . FIG.6 Drosophila melanogaster – Chr 2L, 2R , 3L , 3L , X , 4

FIG.7 – Examples of approximation for decayed multiplets . FIG.8 – СОВРЕМЕННыЙ -S - Leishmania major (а) , Leishmania infanta (б) , Tularemia (c ).

Table 1,2 – Расчитанные коэффициенты 'K1' – для различнъх участков графиков геномов. Вычисления производились по формуле : Ni -Nk = K1 * Ln (n(Ni) / n(Nk) ).

Модель поведения AT и CG матриц

В соответствии с результатами статистической проверки предложенной `AT`- модели , были обнаружены `AT`- матрици. Наблюдается тенденция `сжатия`пространства между `AT` и `CG` - матрицами . Соответственно , мы можем наблюдать этот процесс в развитии для различных геномов . Отмеченный процесс развития геномов дает векторы их развития, которые позволяют делать вывод об относительном эволюционном уровне генома . Модель позволяет сделать генетическое сравнение развития организмов из различных классов Царств Животных и Растений. Становится возможным установить их иерархию .Скорости распада и замещений отдельных групп дают возможность расчитать региональные скорости мутаций и их векторы .Хромосомные геномы показывают коллениарное поведение хромосом . Мы наблюдаем `дирижируемое` поведение мутаций в хромосомах одного генома. На Фиг.8 показана хромосома Leishmania major (а) и Leishmania infanta (б) . Это представители новейшего типа генома , который явно образовался путем `варки` в бульоне из разрушенных ядер из представителей современных ( modern) геномов - `вивисекцией` существенных кластеров , и то `АТ ` - содержащих : например с помощью` тепловой ` обработки . Причем Leishmania infanta явно показывает тотже принцип сжатия AT – CG пространства ,но уже с `другой` стороны .

Выводы

Эволюция геномов явно указывает на общий довлеющий фактор – увеличение компактности информации в геноме . Это достигается в основном уравновешением соотношения A,T / C,G . Сам механизм `мягкого` воздействия этого фактора , лежит явно в кинетике процессов воспроизводства . Степень `информационного` совершенства : это приближение этого отношения к `1` . Кроме того , размер мультиплетов стремится к равновесным ( вероятностным) значениям мультиплета (A,T,C,G).То есть , всякий геном имеет идеальный размер основания `m`- в зависимости от его размера `N` . Соответственно можно предложить меры идеальности геномов . Первая должна отвечать за `Первый` уровень совершенства когда отношение C,G/A,T – стремится к `1` , для этого удобно сравнивать суммы логарифмов произведений размеров мультиплетов `CG и AT` на их количество `n` .

(8) Q1 = SUM(Ni*Ln(n[i]CG))/ SUM(Nk*Ln(n[k]AT))

Где : Q1 – `Первый` уровень эволюции . nAT , nCG - количество мультиплетов размером N для : i- nAT и k - nCG . Так как этот критерий содержит в себе и `рудиментарные ` признаки – большие платформы внедрений , которые сильно влияют на уровень совершенства генома .

См. также

Ссылки

Advertisement