Главная
>
Статьи
>
Из дальних странствий возвратясь, ...

Из дальних странствий возвратясь, ...

14.02.2012
24

«Мы, оглядываясь, видим лишь руины.»

© И.А.Бродский

 

 

... натыкаешься на какие-то чудеса на родине. Но про чудеса в следующий раз. Сегодня про возвращение из дальних странствий.

Во Франкфурте-на-Майне была очередная конференция по геномике и протеомике, а равно и по её приложениям к счастью человеческому. А после конференции, по сложившейся традиции, завернул я в Париж. Ну, про Париж можно много чего рассказывать. Или наоборот — ничего не рассказывать — и так полно всяческих историй. Единственное, в этот раз было очень холодно: минус десять, с жутким ветром. Всяческие торговцы хламом на набережной Сены не работали. И рынок блошиный тоже был так себе. Зато вся эта радость пришлась на первое воскресенья февраля. Тот факт, что февраля, несущественен. А вот тот факт, что на первое — очень даже существенен.

Ибо по первым воскресеньям каждого месяца вход в Лувр (и многие другие музеи) халявский. Любителей искусства в такие дни набивается просто толпы. Попали и мы в такую толпу. Фотографии Парижа просто выложу кучей, как есть, кому не интересно и кто пресыщен этим городом — может сразу пропустить.

А после походов по культурным местам и питейным заведениям — также по сложившейся традиции — прошёл маленький семинарчик в Институте Кюри. Институт Кюри — это ведущий французский раковый институт. Аналог нашего онкоцентра на Каширском. Только труба повыше и дым существенно (местами) погуще; в частности, в науке. Дело в том, что Институт Кюри заметно больше времени и сил уделяет именно научным исследованиям. И, что отрадно, в нём работают бывшие наши красноярцы. «Бывшие» — значит, работавшие здесь, в Красноярске. Вот там-то я и сделал небольшой доклад.

Не могу удержаться и не похвастаться этим самым докладом: больно уж необычный эффект я обнаружил. Ну, не только я, мне помогали в этом разные люди, но — редкий случай — и идея поиска, и первые результаты (не инструменты, а результаты) полностью «на моей совести».

Хорошо известно, что наследственная информация хранится у всех живых организмов в виде последовательности (жутко длинной), «сделанной» из четырёх букв: A, C, G и T. Коротенькие кусочки этой последовательности будем называть словами; например, очень и очень важное для биологии слово называется триплет и состоит, как легко догадаться из названия, из трёх букв.

Выберем какой-нибудь триплет; например, AGC. И ещё один, другой. Пусть будет TGC. Неважно. Теперь пойдём вдоль по исходной последовательности и будем отмечать все эти триплеты при том условии, что между первым (AGC в нашем случае) и вторым (в нашем случае — TGC) вот точно такого же, как этот «концевой» (то бишь, TGC) нету. Иными словами, отметим все такие пары, которые являются ближайшими соседями. А теперь подсчитаем число таких пар, для разных (наблюдаемых) расстояний. Ну, понятно, что чем длиннее «перегон» между парами, тем они, в общем случае, реже встречаются. Ну, а теперь, собственно главный вопрос: а как выглядит такая картина распределения «до ближайшего соседа» в целом?

Оказывается, она очень и очень немонотонная! Там есть «всплески» (высокие корреляции, говоря умными словами), и этот факт как-то до сих пор никто не наблюдал. Для того чтобы понять смысл (биологический) этих сильных корреляций, надо наблюдаемую картину распределения с чем-нибудь сравнивать. Ну, например, с аналогичным распределением, наблюдаемым на случайных последовательностях. Так вот, от случайных — и даже очень сложных и уже местами не очень случайных — реальные распределения отличаются очень сильно (см. картинку №30).

Ладно. Поскольку народ требует задач, их есть у нас. На этот раз — целиком про эту самую математику последовательностей. Задач будет две. Одна — из набора олимпиадных (поверите ли, тут таковые неоднократно уже встречались). Она представляет собой упрощённый вариант вопроса про (теоретическое) распределение.

  1. Какова вероятность того, что при бросании правильной монеты (то есть, вероятности выпадения герба и решки равны и составляют 0,5) серия из трёх гербов подряд выпадет раньше серии из двух решек подряд?
  2. Всё то же самое, только монету заменяем правильным тетраэдром. То бишь, пирамидкой, у которой все грани (их всего четыре) есть правильные треугольники. Раскрасим эти треугольники в четыре цвета — Алый, Циановый, Голубой и Тёмный. Какова вероятность того, что при бросании такого тетраэдра серия из трёх подряд ААА выпадет раньше серии из двух подряд ГГ?

Михаил Садовский

Рекомендуем почитать