Аннотация. Представлен анализ данных первого выпуска базы HeteroGenome, содержащей выявленные районы скрытой периодичности в геномах ряда эукариотических организмов. Тандемные повторы с различной сохранностью копий паттерна, включая сильно размытые повторы, были идентифицированы в геномах S. cerevisiae, A. thaliana, C. elegans и D. melanogaster. Данные были получены с помощью оригинального спектрально-статистического подхода к поиску достоверных районов скрытой периодичности в последовательностях ДНК. Введение двухуровневой структуры представления данных (на первом, неизбыточном, уровне районы скрытой периодичности рассматриваются в целом, на втором уровне -консервативные фрагменты их периодической структуры) позволило оценить долю покрытия (~10% от длины генома) анализируемых геномов районами скрытой периодичности. Оценка выведена на основе данных первого уровня. Анализ количественного и качественного состава (по уровню дивергенции) районов скрытой периодичности по всем хромосомам рассматриваемых организмов выявил характеристические типы периодичности в геноме каждого организма. Получены гистограммы плотности распределения районов скрытой периодичности для каждой хромосомы рассматриваемых геномов. Выявлен репертуар длин периодов в геномах. База данных HeteroGenome предоставляет дополнительные возможности анализа содержащихся в ней данных и доступна по адресу: http://www.jcbi.ru/lp_baze/.
Ключевые слова: скрытая периодичность, тандемные повторы, анализ генома.
ВВЕДЕНИЕТандемные повторы (массивы последовательно повторяющихся копий некоторого исходного фрагмента последовательности ДНК, или паттерна) как объекты периодичной структуры генома давно находятся в фокусе внимания исследователей. C одной стороны, это внимание обусловлено стремлением понять молекулярные механизмы возникновения и эволюции повторов, их функциональное значение в геноме; с другой стороны, -возможностью разрабатывать на их основе маркеры для исследований популяционной и эволюционной генетики. Повреждение копий паттерна при замене исходных нуклеотидов, а также при вставках и делециях, как единичных, так и нескольких нуклеотидов, ведёт к образованию размытых тандемных повторов. Размытые тандемные повторы, повреждения копий паттерна в которых ограничены только заменами нуклеотидов (нукл.), принято называть нечеткими тандемными повторами. Размытые тандемные повторы, включая нечёткие повторы, являются участками скрытой периодичности в геноме. * maramaria@yandex.ru
The search for rotating radio transients (RRAT) at declinations from −9° to +42° was carried out based on the semi-annual monitoring data obtained on the Large Phased Array (LPA) radio telescope at a frequency of 111 MHz. A neural network was used to search for candidates. Four new RRATs were detected; they have dispersion measures of 5–16 pc cm−3. A comparison with an earlier RRAT search that was conducted using the same data shows that the neural network reduced the amount of interference by 80 times. It is now down to 1.3% of the initial amount of interference. The loss of real pulsar pulses does not exceed 6% of their total number.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.