Исследователи из пяти стран разработали новые алгоритмы машинного обучения, которые способны упростить молекулярное типирование опухолей в клинической практике. Эти модели позволяют классифицировать злокачественные новообразования по известным подтипам, основываясь на минимальных наборах биологических данных. Результаты работы опубликованы в журнале Cancer Cell, а созданные алгоритмы выложены в открытый доступ, что делает их доступными для использования в медицинских учреждениях по всему миру.
Современное молекулярное типирование опухолей основано на данных, представленных в Атласе ракового генома (TCGA). Эти данные помогают определить биологические процессы, протекающие в опухоли, прогнозировать течение болезни и разрабатывать индивидуальные подходы к лечению. Однако существующие методы кластеризации часто ограничены определенными датасетами и трудно применимы в клинической практике, что существенно снижает их универсальность.
Международная команда исследователей, возглавляемая Питером Лэрдом из Института Ван Андела, провела мультиомный анализ 8791 опухоли из TCGA. Образцы включали 26 анатомогистопатологических разновидностей рака и 106 известных молекулярных подтипов. Анализ проводился по пяти ключевым параметрам: мутации, числу копий генов, матричной РНК, метилированию ДНК и микроРНК. На основе полученных данных команда разработала и протестировала пять алгоритмов машинного обучения: AKLIMATE, CloudForest, SK Grid, JADBio и subSCOPE.
Каждый из алгоритмов был настроен на выявление молекулярных подтипов рака, что позволило избежать переобучения и сохранить точность диагностики. В общей сложности было создано почти 412,6 тысячи моделей-классификаторов. Из них отобрали 737 наиболее эффективных, которые теперь доступны для определения подтипов опухолей вне исходной базы данных TCGA. Эти модели контейнеризировали, чтобы обеспечить их удобное применение в клинических условиях.
Новаторские разработки открывают возможности для создания компактных систем и диагностических наборов, которые могут использоваться для генетической диагностики рака. Такие инструменты способны значительно сократить разрыв между обширной библиотекой данных TCGA и ее реальным применением в клинике. Это может ускорить диагностику и повысить точность выбора терапевтической стратегии для пациентов.
Читать нас в Дзен Новостях