Аннотация. Рассматривается нелинейная модель данных ДНК-микрочипов, в которой интенсивность флуоресценции проб описывается функцией Лэнгмюра. Разработан метод настройки параметров модели на основе общедоступных данных нескольких тысяч экспериментов, основанный на минимизации функции потерь из класса AB-дивергенций; для выбора оптимальных значений гиперпараметров проведены численные эксперименты. Полученная модель описывает интенсивности флуоресценции проб микрочипа точнее стандартной линейной, а полученные на её основе оценки экспрессии более устойчивы. Ключевые слова: ДНК-микрочипы, суммаризация, модель Лэнгмюра, AB-дивергенция. ВВЕДЕНИЕТехнология микрочипов ДНК позволяет получить оценку экспрессии десятков тысяч генов одновременно. Основной принцип работы микрочипов ДНК заключается в следующем. На поверхности микрочипа на известных позициях закреплены пробы -одноцепочечные фрагменты ДНК, последовательности нуклеотидов в которых известны. Исследуемый образец специально готовят таким образом, чтобы в нём находились одинарные цепочки ДНК экспрессируемых генов. Согласно принципу комплементарности, одинарные цепочки в образце вступят в реакцию гибридизации с пробами. После этого на образец наносят флуоресцентные метки, чтобы по результатам сканирования микрочипа определить, какие именно участки цепочек ДНК вступили в реакцию, и оценить концентрации соответствующих генов.В настоящее время существует несколько популярных платформ для микрочипового анализа экспрессии. Технология Affymetrix GeneChip, впервые предложенная в 1996 году, на сегодняшний день является одной из наиболее популярных. В данной работе речь пойдёт о методах анализа данных, полученных при помощи ДНК-микрочипов Affymetrix Human Gene 1.0 ST, относящихся к последнему поколению микрочипов этого производителя.Для обеспечения устойчивости оценки уровня экспрессии каждому гену на микрочипе соответствует несколько проб; их последовательности комплементарны разным участкам гена. В ходе обработки данных микрочипового анализа на этапе суммаризации интенсивности флуоресценции проб, соответствующих одному гену, обобщаются в оценку его экспрессии. Простейший метод суммаризации -усреднение интенсивностей флуоресценции проб по каждому гену. Такой подход применяется в * riabenko
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.