Рубрика Технологии

Кулинарную нейросеть выложили в открытый доступ

Ученые из Массачусетского технологического института и Катарского вычислительного исследовательского института разработали компьютерный алгоритм для описания рецепта блюда по изображению и наоборот.

Создание искусственных нейросетей, помимо исследовательских, преследует прагматичные цели. Так, ранее стало известно о применении подобных систем в диагностике автомобилей, прогнозировании наводнений и выявлении преступного умысла. В 2014 году американская компания IBM представила первое в мире приложение для генерирования кулинарных рецептов. Сопоставляя химический состав сотен ингредиентов на основе базы сообщества Bon Appétit (более 10 тысяч блюд), программа составляет новые. Аналогичную концепцию весной показала другая группа исследователей: их алгоритм стилизует различные рецепты к традициям определенной кухни, например японских к французской.

 

До сих пор, однако, нейросети не удавалось адаптировать к распознаванию рецептов по изображениям блюд. Предыдущие попытки были ограничены объемом входных данных: обучение на сотне тысяч фотографий позволило достичь только 50-процентной точности. Новая система, получившая название Recipe1M, представляет собой открытую базу данных. Она включает в себя более одного миллиона позиций с указанием названия, типа и фотографии блюда, ингредиентов и инструкции, полученных с различных сайтов. Тренировка программы проводилась на 800 тысячах снимков. В ответ на входной стимул он выводит перечень продуктов, необходимых для приготовления, и пошаговый алгоритм действий.

 

Схема распознавания изображения блюда по рецепту / ©Amaia Salvador et al., MIT, 2017

 

Система образована из двух глубоких сверточных нейросетей и рассчитана и на выполнение обратного распознавания — фотографии по описанию. Этот механизм основан на свойстве совместного вложения. На первом этапе нейросеть разбивает рецепт на векторы с инструкцией приготовления и ингредиентами. Затем сопоставляет полученные данные с наиболее подходящими изображениями в базе и соотносит параметры путем линейного трансформирования. После обучения ответы программы сравнили с результатами опроса среди интернет-пользователей. Последние должны были выбрать из десяти рецептов тот, который соответствует показанному блюду. Некоторые описания при этом имели одинаковое название.

 

Точность нейросети превысила человеческую — 83,6 процента против 81,6 процента. Примечательно, что в обоих случаях показатель снижался с ростом специфичности блюда: например, и люди и алгоритм хуже справлялись с определением рецепта разных пицц по внешнем виду. По словам ученых, после совершенствования технологию можно применить и к другим отраслям. Так, ее можно использовать при разработке учебных пособий, составлении инструкций и описании промышленных процессов. Для самостоятельной проверки системы пользователи могут перейти на сайт проекта, там же находится доступная для скачивания база данных. Исходный код программы опубликован на GitHub.

 

Подробности исследования представлены на сайте Массачусетского технологического университета.

 

Ранее искусственные нейросети стали ближе к реконструкции трехмерных вымышленных ландшафтов и распознаванию оружия на видео.