Автор: Плавник Лана Денисовна

Что мы делаем

Некодирующие РНК являются значительной частью транскриптома человека и играют важную роль в регуляции множества клеточных процессов. В связи с этим их филогенетический анализ и определение времени, а также механизмов возникновения этих молекул представляют собой задачу большого фундаментального значения. В рамках настоящей работы был проведён исследовательский анализ происхождения двух генов некодирующих РНК: ENSG00000214900 (LINC00243) и ENSG00000214900 (LINC00244). В ходе работы был частично реализован филогенетический подход, который позволил выявить таксономические группы организмов, в которых данные гены впервые появились в ходе эволюционного развития.


2. Объект исследования:

Гены ENSG00000214894 и ENSG00000214900.


3. Предмет исследования

Филогенетические деревья, эволюция генов ENSG00000214894 и ENSG00000214900.


4. Цель

Выяснить у какого впервые появился ген.


5. Актуальность

Выяснение хода эволюции генов поможет понять, как они изменились и как это повлияло на физиологические функции.


6. Гипотеза

Гены ENSG00000214894 и ENSG00000214900 появились впервые у приматов.


7. Задачи исследования

  1. Изучить и сравнить источники и дополнительную литературу.

  2. Выбрать животных

  3. Скачать последовательности генов

  4. Скачать геномы животных

  5. Сгенерировать hmm базы

  6. Поставить выравнивание

  7. Сделать bad файлы с гомологичными генам последовательностями

  8. Поставить множественное выравнивание

  9. Построить филогенетические деревья

  10.  Проанализировать полученные результаты.

  11.  Сформулировать выводы.


8. Обзор выбранных генов

Ген ENSG00000214894 соответствует длинной интергенной некодирующей РНК LINC00243, которая представляет собой длинную некодирующую РНК (lncRNA) с важной ролью в регуляции клеточных процессов и участием в патогенезе заболеваний, в частности онкологических.

LINC00243 не кодирует белок и функционирует как регуляторная молекула, влияющая на транскрипцию и эпигенетику. Генетические особенности и уровни экспрессии LINC00243 связаны с некоторыми видами рака, включая эндометриальный рак. В частности, присутствуют данные, что вариации в области LINC00243 и изменения в её метилировании оказывают влияние на риск развития данной опухоли и её прогрессивности. LINC00243 регулирует экспрессию других генов посредством взаимодействия с микроРНК и модификации эпигенетического статуса хроматина. Это позволяет ей участвовать в клеточной пролиферации, инвазии и других процессах, важных для роста и метастазирования опухолевых клеток. Механистические исследования указывают, что LINC00243 может действовать как «губка» для микроРНК, влияя на онкогенные пути и транскрипционные сети. Наиболее изученное заболевание, ассоциированное с LINC00243, — эндометриальный рак, где она влияет на патогенез через взаимодействие со специфическими SNP и эпигенетическими модификациями. Кроме того, LINC00243 может участвовать в других патологических состояниях, но данных пока меньше. Её уровень экспрессии и профиль метилирования имеют прогностическую ценность и потенциально могут стать биомаркерами для диагностики и мониторинга терапии.

Ген ENSG00000214900 соответствует длинной некодирующей РНК под названием LINC00244. LINC00244 — длинная некодирующая РНК (lncRNA), которая не кодирует белки, но играет важную роль в регуляции генов и клеточных процессов. Подобные lncRNA вовлечены в эпигенетическую регуляцию, транскрипционную активность и межмолекулярное взаимодействие в клетках. Исследования показывают, что lncRNA LINC00244 принимает участие в регуляции клеточной пролиферации, дифференцировки и миграции. Потенциально этот ген может играть роль в патогенезе различных заболеваний, включая злокачественные новообразования, путем влияния на сигнальные пути, контролирующие рост и выживание клеток. Данные о конкретных механизмах действия LINC00244 остаются ограниченными и требуют дальнейших исследований. Есть некоторые перспективные данные о вовлеченности LINC00244 в онкологический процесс, однако точные механизмы и клиническое значение этого гена пока недостаточно изучены. Отмечаются исследования, связанные с изменением экспрессии LINC00244 в опухолевых тканях, что делает этот ген объектом интереса для дальнейшего изучения как потенциальный биомаркер или терапевтическая мишень. В итоге, ENSG00000214900 (LINC00244) — это длинная некодирующая РНК с предполагаемой функцией регулятора клеточного гомеостаза и возможной ролью в патогенезе рака, однако для полного понимания требуются дополнительные исследования

Список животных

Чтобы передать полноту эволюции в филогенетическом древе и узнать у какого именно предка произошли данные гены, мы выбрали по одному виду из каждого таксона. Так получился такой список:

Bos_taurus / Домашний бык

Caenorhabditis_elegans / Нематода

Ciona_intestinalis / Лобастая асцидия

Corvus_moneduloides / Новокаледонский ворон

Crocodylus_porosus / Гребнистый крокодил

Danio_rerio / Данио-рерио

Drosophila_melanogaster / Дрозофила фруктовая

Ictidomys_tridecemlineatus / Тринадцатиполосный суслик

Macaca_mulatta / Макак-резус

Monodelphis_domestica / Домовый опоссум

Ornithorhynchus_anatinus / Утконос

Pan_troglodytes / Обыкновенный шимпанзе

Petromyzon_marinus  /  Морская минога

Saccharomyces_cerevisiae / Пекарские дрожжи

Xenopus_tropicalis / Когтистая шпорцевая лягушка


9. Ход работы

Мы скачали последовательности генов и геномы животных с Ensembl. Далее мы сгенерировали hmm базы и запустили выравнивание. Потом проанализировав полученные данные, основываясь на e-value, score и координатах, мы должны были отобрать виды, в которых эти гены есть, и по координатам вытащить и записать последовательность предполагаемого гена из генома животного.

Используемые базы данных: 

  1. Ensembl — это специализированная база данных, которая содержит геномные и транскриптомные данные различных живых организмов, а также нуклеотидные и аминокислотные последовательности генов и соответствующих белков. Благодаря этому ресурсу мы имели возможность загружать гомологичные последовательности и нуклеотидные данные генов, которые изучались в рамках нашего исследования.

  2. NCBI — это обширная база данных, включающая геномные, транскриптомные и протеомные данные множества организмов, а также нуклеотидные и аминокислотные последовательности генов и белков. Кроме того, NCBI предоставляет доступ к большому объёму научной литературы, что позволило нам находить статьи и другие материалы, необходимые для описания и характеристики исследуемых генов.


10. Вывод

Некодирующие РНК, в частности длинные некодирующие РНК (lncRNA), являются важными регуляторными элементами в клеточных процессах человека и связаны с патогенезом заболеваний, включая онкологические.

В работе был проведён филогенетический анализ двух генов некодирующих РНК — ENSG00000214894 (LINC00243) и ENSG00000214900 (LINC00244) — с целью выяснения их эволюционного происхождения и установления таксономических групп, в которых эти гены впервые появились.

Полученные данные подтверждают значимость филогенетического подхода для понимания времени появления и механизмов эволюции данных генов, что важно для дальнейшего изучения их функциональной роли и влияния на физиологические процессы. Анализ показывает, что оба гена, вероятно, возникли у приматов, что согласуется с гипотезой исследования.

Ген ENSG00000214894 (LINC00243) обладает более широким изучением и доказанным влиянием на рост и прогрессию некоторых видов рака, особенно эндометриального, выступая как регулятор на уровне транскрипции и эпигенетики.

Ген ENSG00000214900 (LINC00244) также связан с регуляцией клеточной пролиферации и дифференцировки, имеет перспективы участия в патогенезе рака, однако требует дальнейших исследований для уточнения механизмов и клинического значения.

Дальнейший анализ и интерпретация полученных результатов будут способствовать пониманию эволюционной динамики lncRNA и их функционального разнообразия в клеточных и патологических процессах.


11. Список литературы

  1. LINC00243 [Электронный ресурс] // LINC00243 – Режим доступа: https://www.genecards.org/cgi-bin/carddisp.pl?gene=LINC00243 (дата обращения: 15.09.2025)

  2. Details for: LINC00243 [Электронный ресурс] // Details for: LINC00243 – Режим доступа: https://genular.atomic-lab.org/details-gene/401247?contexts%5B%5D=UBERON0002771 (дата обращения: 15.09.2025)

  3. Exploring the Associated Genetic Causes of Diabetic Retinopathy as a Model of Inflammation in Retinal Diseases [Электронный ресурс] // Exploring the Associated Genetic Causes of Diabetic Retinopathy as a Model of Inflammation in Retinal Diseases – Режим доступа: https://pmc.ncbi.nlm.nih.gov/articles/PMC11121794/ (дата обращения: 15.09.2025)

  4. Genes, DNA methylation and exposures underlying COPD in never-smokers [Электронный ресурс] // Genes, DNA methylation and exposures underlying COPD in never-smokers – Режим доступа: https://research.rug.nl/files/48038470/Chapter_9.pdf (дата обращения: 15.09.2025)

  5. PTPN22 gene polymorphism and susceptibility to rheumatoid arthritis (RA): Updated systematic review and meta‐analysis [Электронный ресурс] // PTPN22 gene polymorphism and susceptibility to rheumatoid arthritis (RA): Updated systematic review and meta‐analysis – Режим доступа: https://onlinelibrary.wiley.com/doi/10.1002/jgm.3204 (дата обращения: 15.09.2025)

  6. Review on mechanistic strategy of gene therapy in the treatment of disease - ScienceDirect [Электронный ресурс] // Review on mechanistic strategy of gene therapy in the treatment of disease - ScienceDirect – Режим доступа: https://www.sciencedirect.com/science/article/abs/pii/S037811192030915X?via%3Dihub (дата обращения: 15.09.2025)