Как ИИ помогает ученым изучать исследования о COVID-19, чтобы найти лекарства и создать вакцину
Научное сообщество всего мира мобилизовано для борьбы с пандемией COVID-19. Каждый день появляются сотни научных статей о новом виде коронавируса, как в журналах, так и в нерецензированных препринтах. Материалов уже гораздо больше, чем человек может успеть прочитать. Команда исследователей из Калифорнийского университета в Беркли рассказала изданию Conversation об инструменте, который помогает врачам получать новые инсайты о COVID-19 и может приблизить нас к нахождению лекарства.
По оценкам авторов, существует 500 000 документов, имеющих отношение к COVID-19, которые были опубликованы до вспышки вируса, включая работы, связанные со вспышками атипичной пневмонии в 2002 году и MERS в 2012 году. Любой из них может содержать информацию, которая позволит найти эффективное лечение или вакцину от COVID-19.
Традиционные методы поиска в научной литературе просто не помогают. Вот почему исследователи из университета Беркли используют методы искусственного интеллекта для создания поисковой системы COVIDScholar, посвященной COVID-19.
COVIDScholar распознаёт запросы учёных, в том числе по названиям схожих лекарств и методологий, чтобы рекомендовать соответствующие исследования. ИИ не может заменить специалистов, но может помочь им получить новые идеи из большего количества статей, чем они могли бы прочитать за всю жизнь.
Почему это важно
Когда дело доходит до поиска эффективных методов лечения COVID-19, время имеет решающее значение. Ученые тратят 23% своего времени на поиск и чтение статей. Каждая секунда, которую могут сэкономить инструменты поиска, даст им больше времени, чтобы делать открытия в лаборатории и анализировать данные.
ИИ может сделать больше, чем просто сэкономить время. Предыдущая работа группы показала, что искусственный интеллект способен извлекать скрытые научные знания из текста, обнаруживая связи, которые упустили люди. ИИ смог предложить новые, самые современные функциональные материалы за годы до их открытия. Информация всё это время была у нас, но для её извлечения потребовалось объединить данные из сотен тысяч статей.
Сейчас группа применяет те же методы к COVID-19, чтобы найти существующие лекарства, которые можно использовать для лечения, генетические связи, которые могут помочь в разработке вакцины, и эффективные схемы лечения. Исследователи также начинают использовать ИИ, чтобы определять, какие лекарства похожи друг на друга, включая те, которые схожи неожиданным образом.
Как они это делают
Самая важная часть работы — это данные. Команда создала инструменты, которые собирают новые статьи по мере их публикации из самых разных источников, делая их доступными на сайте в течение 15 минут после их появления в интернете.
Исследователи очищают данные, исправляют ошибки в форматировании, и сравнивают одну и ту же статью из нескольких источников, чтобы найти лучшую.
Затем алгоритмы машинного обучения приступают к работе над документом, помечая его предметными категориями и отмечая элементы, важные для COVID-19.
COVIDScholar маркирует и классифицирует около 250 статей в день, чтобы помочь учёным находить связи, которые они могли пропустить. Группа также постоянно ищет экспертов в новых областях. Ввод и аннотация данных — это то, что позволяет обучать новые модели искусственного интеллекта.
На данный момент команда собрала более 60 000 статей про COVID-19 и ежедневно расширяет эту коллекцию. Она также создала инструменты поиска, которые группируют исследования по категориям, предлагают похожие работы и позволяют находить документы, которые связывают различные концепции (например, когда конкретное лекарство соотносится с болезнями, для лечения которых оно использовалось в прошлом). Сейчас команда создаёт алгоритмы, которые позволяют учёным включать результаты поиска в количественные модели для изучения таких тем, как взаимодействие белков. Она также просматривает литературу, чтобы найти скрытые инсайты.
Группа надеется, что очень скоро исследователи, использующие COVIDScholar, начнут выявлять взаимосвязи, которые они никогда не могли себе представить. Это приблизит нас к нахождению способов лечения COVID-19.
rb.ru