Аннотация. Представлен анализ данных первого выпуска базы HeteroGenome, содержащей выявленные районы скрытой периодичности в геномах ряда эукариотических организмов. Тандемные повторы с различной сохранностью копий паттерна, включая сильно размытые повторы, были идентифицированы в геномах S. cerevisiae, A. thaliana, C. elegans и D. melanogaster. Данные были получены с помощью оригинального спектрально-статистического подхода к поиску достоверных районов скрытой периодичности в последовательностях ДНК. Введение двухуровневой структуры представления данных (на первом, неизбыточном, уровне районы скрытой периодичности рассматриваются в целом, на втором уровне -консервативные фрагменты их периодической структуры) позволило оценить долю покрытия (~10% от длины генома) анализируемых геномов районами скрытой периодичности. Оценка выведена на основе данных первого уровня. Анализ количественного и качественного состава (по уровню дивергенции) районов скрытой периодичности по всем хромосомам рассматриваемых организмов выявил характеристические типы периодичности в геноме каждого организма. Получены гистограммы плотности распределения районов скрытой периодичности для каждой хромосомы рассматриваемых геномов. Выявлен репертуар длин периодов в геномах. База данных HeteroGenome предоставляет дополнительные возможности анализа содержащихся в ней данных и доступна по адресу: http://www.jcbi.ru/lp_baze/.
Ключевые слова: скрытая периодичность, тандемные повторы, анализ генома.
ВВЕДЕНИЕТандемные повторы (массивы последовательно повторяющихся копий некоторого исходного фрагмента последовательности ДНК, или паттерна) как объекты периодичной структуры генома давно находятся в фокусе внимания исследователей. C одной стороны, это внимание обусловлено стремлением понять молекулярные механизмы возникновения и эволюции повторов, их функциональное значение в геноме; с другой стороны, -возможностью разрабатывать на их основе маркеры для исследований популяционной и эволюционной генетики. Повреждение копий паттерна при замене исходных нуклеотидов, а также при вставках и делециях, как единичных, так и нескольких нуклеотидов, ведёт к образованию размытых тандемных повторов. Размытые тандемные повторы, повреждения копий паттерна в которых ограничены только заменами нуклеотидов (нукл.), принято называть нечеткими тандемными повторами. Размытые тандемные повторы, включая нечёткие повторы, являются участками скрытой периодичности в геноме. * maramaria@yandex.ru