«Мы, оглядываясь, видим лишь руины.»
© И.А.Бродский
... натыкаешься на какие-то чудеса на родине. Но про чудеса в следующий раз. Сегодня про возвращение из дальних странствий.
Во Франкфурте-на-Майне была очередная конференция по геномике и протеомике, а равно и по её приложениям к счастью человеческому. А после конференции, по сложившейся традиции, завернул я в Париж. Ну, про Париж можно много чего рассказывать. Или наоборот — ничего не рассказывать — и так полно всяческих историй. Единственное, в этот раз было очень холодно: минус десять, с жутким ветром. Всяческие торговцы хламом на набережной Сены не работали. И рынок блошиный тоже был так себе. Зато вся эта радость пришлась на первое воскресенья февраля. Тот факт, что февраля, несущественен. А вот тот факт, что на первое — очень даже существенен.
Ибо по первым воскресеньям каждого месяца вход в Лувр (и многие другие музеи) халявский. Любителей искусства в такие дни набивается просто толпы. Попали и мы в такую толпу. Фотографии Парижа просто выложу кучей, как есть, кому не интересно и кто пресыщен этим городом — может сразу пропустить.
А после походов по культурным местам и питейным заведениям — также по сложившейся традиции — прошёл маленький семинарчик в Институте Кюри. Институт Кюри — это ведущий французский раковый институт. Аналог нашего онкоцентра на Каширском. Только труба повыше и дым существенно (местами) погуще; в частности, в науке. Дело в том, что Институт Кюри заметно больше времени и сил уделяет именно научным исследованиям. И, что отрадно, в нём работают бывшие наши красноярцы. «Бывшие» — значит, работавшие здесь, в Красноярске. Вот там-то я и сделал небольшой доклад.
Не могу удержаться и не похвастаться этим самым докладом: больно уж необычный эффект я обнаружил. Ну, не только я, мне помогали в этом разные люди, но — редкий случай — и идея поиска, и первые результаты (не инструменты, а результаты) полностью «на моей совести».
Хорошо известно, что наследственная информация хранится у всех живых организмов в виде последовательности (жутко длинной), «сделанной» из четырёх букв: A, C, G и T. Коротенькие кусочки этой последовательности будем называть словами; например, очень и очень важное для биологии слово называется триплет и состоит, как легко догадаться из названия, из трёх букв.
Выберем какой-нибудь триплет; например, AGC. И ещё один, другой. Пусть будет TGC. Неважно. Теперь пойдём вдоль по исходной последовательности и будем отмечать все эти триплеты при том условии, что между первым (AGC в нашем случае) и вторым (в нашем случае — TGC) вот точно такого же, как этот «концевой» (то бишь, TGC) нету. Иными словами, отметим все такие пары, которые являются ближайшими соседями. А теперь подсчитаем число таких пар, для разных (наблюдаемых) расстояний. Ну, понятно, что чем длиннее «перегон» между парами, тем они, в общем случае, реже встречаются. Ну, а теперь, собственно главный вопрос: а как выглядит такая картина распределения «до ближайшего соседа» в целом?
Оказывается, она очень и очень немонотонная! Там есть «всплески» (высокие корреляции, говоря умными словами), и этот факт как-то до сих пор никто не наблюдал. Для того чтобы понять смысл (биологический) этих сильных корреляций, надо наблюдаемую картину распределения с чем-нибудь сравнивать. Ну, например, с аналогичным распределением, наблюдаемым на случайных последовательностях. Так вот, от случайных — и даже очень сложных и уже местами не очень случайных — реальные распределения отличаются очень сильно (см. картинку №30).
Ладно. Поскольку народ требует задач, их есть у нас. На этот раз — целиком про эту самую математику последовательностей. Задач будет две. Одна — из набора олимпиадных (поверите ли, тут таковые неоднократно уже встречались). Она представляет собой упрощённый вариант вопроса про (теоретическое) распределение.
- Какова вероятность того, что при бросании правильной монеты (то есть, вероятности выпадения герба и решки равны и составляют 0,5) серия из трёх гербов подряд выпадет раньше серии из двух решек подряд?
- Всё то же самое, только монету заменяем правильным тетраэдром. То бишь, пирамидкой, у которой все грани (их всего четыре) есть правильные треугольники. Раскрасим эти треугольники в четыре цвета — Алый, Циановый, Голубой и Тёмный. Какова вероятность того, что при бросании такого тетраэдра серия из трёх подряд ААА выпадет раньше серии из двух подряд ГГ?
Михаил Садовский