Более пяти тысяч экспериментов внес ученый Университета «Сириус» в отечественную базу данных геномной информации.
Отечественное хранилище геномной информации GTRD (Gene Transcription Regulatory Database) объединяет результаты десятков тысяч различных экспериментов, проведенных по всему миру, и предоставляет их в одном месте и удобной форме для анализа любому исследователю. Благодаря усилиям младшего научного сотрудника направления «Вычислительная биология» Научно-технологического университета «Сириус» Семена Колмыкова и его коллег база данных пополнилась информацией еще более пяти тысяч экспериментов. Теперь база данных стала крупнейшем в мире хранилищем регуляции транскрипции генов. Ученые смогут под разным углом изучать, как клетка реагирует на различные условия и сигналы.
Создание отечественной базы данных началось еще в 2009 году. Собрать все данные в одном месте – непростая задача. В различных открытых источниках можно найти очень много информации. Но эти данные разрозненные, плохо описаны и по-разному обработаны. Ученые Университета «Сириус» вместе с экспертами ведущих научных центров страны описали и обработали несколько десятков тысяч экспериментов. Сегодня специалисты постоянно пополняют и дорабатывают базу, чтобы она стала еще больше и удобнее.
Над своей частью проекта Семен Колмыков работал больше шести лет. Присоединился к команде еще когда работал в Новосибирске и продолжил в Сириусе. Его задачей было собрать и проанализировать имеющиеся в открытом доступе эксперименты, исследующие специальные белки-регуляторы транскрипции – факторы транскрипции – процесса, с помощью которого клетка «считывает» информацию из ДНК и использует ее для создания молекул РНК, которые затем могут стать «инструкцией» для производства белков. Когда белок-регулятор связывается с определенными участками ДНК, он буквально «включает» или «выключает» определенные гены. Это влияет на то, как клетка работает и реагирует на внешние условия. Часть этой масштабной работы Семен включил в свою диссертацию, защита которой стала первой в истории Научно-технологического университета «Сириус».
Отечественное хранилище геномной информации GTRD (Gene Transcription Regulatory Database) объединяет результаты десятков тысяч различных экспериментов, проведенных по всему миру, и предоставляет их в одном месте и удобной форме для анализа любому исследователю. Благодаря усилиям младшего научного сотрудника направления «Вычислительная биология» Научно-технологического университета «Сириус» Семена Колмыкова и его коллег база данных пополнилась информацией еще более пяти тысяч экспериментов. Теперь база данных стала крупнейшем в мире хранилищем регуляции транскрипции генов. Ученые смогут под разным углом изучать, как клетка реагирует на различные условия и сигналы.
Создание отечественной базы данных началось еще в 2009 году. Собрать все данные в одном месте – непростая задача. В различных открытых источниках можно найти очень много информации. Но эти данные разрозненные, плохо описаны и по-разному обработаны. Ученые Университета «Сириус» вместе с экспертами ведущих научных центров страны описали и обработали несколько десятков тысяч экспериментов. Сегодня специалисты постоянно пополняют и дорабатывают базу, чтобы она стала еще больше и удобнее.
Над своей частью проекта Семен Колмыков работал больше шести лет. Присоединился к команде еще когда работал в Новосибирске и продолжил в Сириусе. Его задачей было собрать и проанализировать имеющиеся в открытом доступе эксперименты, исследующие специальные белки-регуляторы транскрипции – факторы транскрипции – процесса, с помощью которого клетка «считывает» информацию из ДНК и использует ее для создания молекул РНК, которые затем могут стать «инструкцией» для производства белков. Когда белок-регулятор связывается с определенными участками ДНК, он буквально «включает» или «выключает» определенные гены. Это влияет на то, как клетка работает и реагирует на внешние условия. Часть этой масштабной работы Семен включил в свою диссертацию, защита которой стала первой в истории Научно-технологического университета «Сириус».
«Транскрипция генов в наших клетках активируется или подавляется в ответ на изменения внутренних и внешних условий. Но важно понимать, что регуляция транскрипции – это сложный процесс, который происходит на нескольких уровнях. Факторы транскрипции – одни из ключевых компонентов этой регуляции. Важной особенностью является их способность узнавать определенные последовательности ДНК (мотивы) и связываться с ними. У каждого фактора последовательность будет своя. Можно представить, что факторы транскрипции – это ключи. Оказываясь в подходящей замочной скважине они способны запирать или освобождать экспрессию генов, «включая» или «выключая» их», – объясняет Семен Колмыков.
Крупнейшее в мире хранилище информации о регуляции транскрипции GTRD включает данные для десяти модельных организмов, в частности человека и мыши. Суммарный объем данных, хранящихся в GTRD превышает 500 терабайтов. Для сравнения – размер всей библиотеки треков в Яндекс Музыке можно оценить в 300 терабайтов. Уже сегодня база данных широко востребована в биомедицинских исследованиях по всему миру. Например, две основные статьи о базе данных, опубликованные в 2019 и в 2021 году в журнале Nucleic Acids Research, суммарно процитированы уже больше 400 раз.