Биология

Искусственный интеллект научился создавать новые белки

Впервые ученые использовали искусственный интеллект для генерации совершенно новых белков. Комбинируя алгоритмы машинного обучения, исследователи смогли создать сложные белковые конструкции причудливых форм, которые при этом могли функционировать.

За последние два года искусственный интеллект (ИИ) произвел революцию в прогнозировании структуры белков. Теперь подобный прорыв случился и в области дизайна белков. Ученые из Вашингтонского университета (США) показали, что машинное обучение можно использовать для быстрого и точного создания новых белковых молекул. Результаты их исследования, опубликованные в журнале Science, позволят создавать новые вакцины, лекарства, биоматериалы и устройства для улавливания углерода.

Белки — неотъемлемая часть любого живого организма, они участвуют практически во всех клеточных процессах. Белок состоит из последовательностей аминокислот, определяющих его трехмерную форму, которая важна для его функционирования. Не так давно алгоритмы машинного обучения AlphaFold и RoseTTAFold научились детально предсказывать структуры природных белков на основе одних лишь аминокислотных последовательностей. Однако все существующие белки составляют менее одного процента от всех теоретически возможных белков, которые тоже могут обладать различными уникальными и полезными функциями.

Теперь ученые продемонстрировали, что ИИ может генерировать новые структуры белков двумя способами. Первый получил название hallucination: он напоминает DALL-E или другую генеративную нейросеть, которая создает вывод на основе простых подсказок. Второй, inpainting, аналогичен функции автозаполнения в современных поисковиках.

Чтобы ускорить процесс создания белков, ученые разработали новый алгоритм ProteinMPNN для генерации аминокислотных последовательностей, который работал в 200 раз быстрее, чем лучшие из предыдущих аналогов. Кроме того, исследователи использовали программу AlphaFold, чтобы независимо оценить, могут ли аминокислотные последовательности, которые создал ProteinMPNN, складываться в желаемые формы.

Комбинация этих инструментов машинного обучения позволила создать новые белки, которые успешно функционировали в лабораторных условиях. Ученым удалось соорудить несколько очень сложных белковых конструкций. Например, наноразмерные кольца, которые, по мнению создателей, могут стать частями нестандартных наномеханизмов.