11 сентября, 11:07

ФизТех

Ученые адаптировали ИИ для генерации изображений под российскую культуру

❋ 5.1

Для культурной адаптации моделей искусственного интеллекта коллектив российских ученых составил методику сбора и обработки пар данных текст-изображение. Применение методики позволило обучить модель Kandinsky 3.1 генерации изображений с учетом культурных особенностей народов нашей страны.

ФизТех

# культура

# Национальная идея

# нейросети

# рисунок

# Россия

Рисунок 3. Изображения, сгенерированные шестью моделями по их описаниям: «Иванушка-дурачок в кафтане и красной шапке летит по небу на маленькой серой лошади, ретро-иллюстрация, книга сказок» (первая строка), «вид Большого театра в Москве, лето, люди» (вторая строка), «пельмени» (третья строка) / © Васильев В. А. и др., журнал «Доклады Российской академии наук. Математика, информатика, процессы управления»

Результаты работы опубликованы в журнале «Доклады Российской академии наук. Математика, информатика, процессы управления».

Создание изображений — занятие творческое, требующее от исполнителя особых навыков и эмоционального настроя. Рисовать, к сожалению, умеет не каждый, да и муза — дама капризная, может долго не посещать. Когда человеку сложно справляться с работой, он стремится делегировать ее технике. По этой причине и благодаря новым возможностям, которые открывают технологии искусственного интеллекта и машинного обучения, появились модели генерации изображений по их описаниям, например DALL-E, Midjourney или Stable Diffusion.

Со временем рынок программного обеспечения стал изобиловать графическими редакторами и онлайн-приложениями. Между тем проблема качественного иллюстрирования не исчезла. Ее наличие обусловлено в том числе трудностями перевода и отсутствием адаптации моделей под национальную культуру. Из-за этого полученные с помощью моделей картинки могут не соответствовать запросу пользователя либо, в худшем случае, нечаянно оскорбить его. На результаты генерации, как правило, сильное влияние оказывает англоязычное информационное поле (рисунок 1).

Рисунок 1. Некорректная генерация изображения по тексту: «Буратино, кадр из мультфильма» (слева) и «Винни-Пух, кадр из мультфильма» / © Васильев В. А. и др., журнал «Доклады Российской академии наук. Математика, информатика, процессы управления»

Так как самобытность нации отражается в различных сферах деятельности, ученые выбрали 17 направлений, наиболее значимых для обучения моделей созданию изображений (рисунок 2). Большое внимание уделили особенностям русского языка и литературы, в первую очередь крылатым выражениям и пословицам. Помимо этого были изучены русские традиции и ассоциирующиеся с ними зрительные образы, такие как георгиевская лента — символ Дня Победы, блины и самовар — атрибут Масленицы, Чебурашка — любимый детьми герой сказочной повести Эдуарда Успенского.

Чтобы реализовать методику, ученые вручную обработали около восьми тысяч текстов и иллюстраций к ним из открытых источников в интернете. В процессе обработки и фильтрации были признаны неудовлетворительными и отброшены рисунки, дающие искаженное представление об объекте либо имеющие низкое качество и водяные знаки. Тексты тоже пытались редактировать: удаляли из них многозначные слова и речевые штампы, добавляли имена собственные: названия произведений, имена персонажей. Однако написание нового текста занимало в среднем 4,52 минуты, тогда как корректура существующего — 5,23 минуты, поэтому ученые решили сами излагать сведения об объектах в 2–10 предложениях и переводить их на английский язык. Для устранения ошибок тексты были многократно вычитаны разными лицами.

Рисунок 2. Категории для создания набора данных о культуре России / © Васильев В. А. и др., журнал «Доклады Российской академии наук. Математика, информатика, процессы управления»

В итоге удалось собрать около 200 тысяч пар текст-изображение, несущих отпечаток визуальной составляющей культуры. Данные были использованы в двухэтапном процессе дообучения модели Kandinsky 3.1. Общее число шагов оптимизатора на 416 графических процессорах составило 500 тысяч.

«Одно из основных преимуществ нашей модели над мировыми аналогами заключается в наличии данных о русской культуре,— пояснил Вячеслав Васильев, аспирант кафедры дискретной математики МФТИ.— Благодаря этому модель демонстрирует лучшие результаты при решении практических задач, ориентированных на специфику нашей информационной среды».

С целью проверки информационного наполнения модели Kandinsky 3.1 до и после обучения исследователи по описанию сгенерировали внешний вид нескольких объектов: героев русских сказок и мультфильмов, исторических зданий, блюд национальной кухни. Кроме того, разработчики поставили сравнительный эксперимент и задействовали в нем еще пять моделей (рисунки 3 и 4).

«Так как общепринятых правил и формул для определения культурной адаптации генеративных моделей пока не существует, мы разработали собственную методику оценки,— добавил Вячеслав Васильев.— Для этого привлекли людей, и каждому было предложено, руководствуясь рядом критериев, определить лучшее, на его взгляд, изображение, но при этом не зная, какой моделью оно сгенерировано».

Рисунок 4. Генерация изображения по тексту «Крокодил Гена и Чебурашка, советский мультфильм» моделью Kandinsky 3.1 до и после дообучения / © © Васильев В. А. и др., журнал «Доклады Российской академии наук. Математика, информатика, процессы управления»

Участникам опроса требовалось охарактеризовать рисунки по двум параметрам: соответствие тексту и визуальное качество. Большинство отдали предпочтение рисункам, полученным с помощью модели Kandinsky 3.1. Единственным достойным ее конкурентом назвали DALLE 3. Предыдущая версия Kandinsky 2.2, а также три другие модели: Midjourney 5.2, SDXL и YaART — уступили лидерство.

«Результаты опроса подтвердили эффективность нашей методики сбора данных и обучения модели»,— подвел итог Вячеслав Васильев.

В дальнейшем ученые планируют адаптировать модели для создания видео по тексту, согласно культурным особенностям нашей страны.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.

ФизТех

# культура

# Национальная идея

# нейросети

# рисунок

# Россия

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

ВДНХ

Москва

Лекция

11 Дек

Бесплатно

Ошибки природы: пределы и несовершенство естественного отбора

Центр «Архэ»

Москва

Курилка Гутенберга

Москва

Лекция

11 Дек

1400 ₽

Новые времена Средиземноморья

Центр «Архэ»

Москва

Лекция

11 Дек

Бесплатно

Нештатные ситуации в космическом полете

Москва

Что бывает с археологическими находками после раскопок

ВСмысле

Санкт-Петербург

Экскурсия

12 Дек

Бесплатно

Космическая карта России: от чертежей до запуска

Космонавтика и авиация

Москва

Центр «Архэ»

Онлайн

Лекция

13 Дек

Бесплатно

Искусственный интеллект. Введение

Библиотека им. Н. А. Некрасова

Москва

Популярное

За сутки

За неделю

За месяц

9 декабря, 10:59

НИУ ВШЭ

«Аффект зомби»: философ описал новое психоэмоциональное состояние современного человека

Специфическая тревога из-за ненадежности цифровых образов реальности и иллюзии тотального контроля над действительностью получила название «аффект зомби». Заведующий кафедрой философии НИУ ВШЭ — Санкт-Петербург Иван Микиртумов исследовал феномен в рамках проекта РНФ «Экзистенциальный опыт в цифровой среде».

НИУ ВШЭ

# общество

# социальные сети

# стресс

# тревожность

# философия

8 декабря, 13:09

Александр Березин

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

Космонавтика

# космос

# МКС

# Российская орбитальная станция

# Россия

10 декабря, 11:49

Игорь Байдов

Археологи нашли в Помпеях точный рецепт римского бетона

Раскопки мастерской, погребенной в Помпеях почти 2000 лет назад, помогли археологам больше узнать о римских строительных технологиях, а именно — определить методы изготовления римского бетона и раскрыть секрет его долговечности.

Археология

# бетон

# Везувий

# Помпеи

# Рим

# римляне

8 декабря, 13:09

Александр Березин

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

Космонавтика

# космос

# МКС

# Российская орбитальная станция

# Россия

9 декабря, 10:59

НИУ ВШЭ

«Аффект зомби»: философ описал новое психоэмоциональное состояние современного человека

НИУ ВШЭ

# общество

# социальные сети

# стресс

# тревожность

# философия

8 декабря, 10:59

НИУ ВШЭ

Исследование психолингвистов изменило представления о чтении у подростков

Команда психолингвистов Центра языка и мозга НИУ ВШЭ обнаружила, что у подростков в возрасте 15–18 лет навыки фонологической обработки продолжают влиять на скорость чтения текстов. Это открытие опровергает убеждение, что к подростковому возрасту эти навыки уже не играют значимой роли в беглости чтения.

НИУ ВШЭ

# дислексия

# звуки

# подростки

# психолингвистика

# скорость чтения

# чтение

8 декабря, 13:09

Александр Березин

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

Космонавтика

# космос

# МКС

# Российская орбитальная станция

# Россия

29 ноября, 12:42

Александр Березин

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

Космонавтика

# «Союз МС»

# Байконур

# корабль Союз

# космодром «Восточный»

# космодром Байконур

# космос

# Роскосмос

# Россия

Выбор редакции

27 ноября, 20:20

Максим Абдулаев

Эксперимент подтвердил эффективность античного способа получения вина из изюма

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

Археология

# алкоголь

# античность

# вино

# виноделие

# дрожжи

# история

# микробиология

[miniorange_social_login]

Ученые адаптировали ИИ для генерации изображений под российскую культуру

По теме

Культурные различия оказались связаны с оценкой креативности

В Facebook отказались перенести данные пользователей на территорию РФ

Российская армия получит сотни новых БМП-3

Популярное

«Аффект зомби»: философ описал новое психоэмоциональное состояние современного человека

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

Археологи нашли в Помпеях точный рецепт римского бетона

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

«Аффект зомби»: философ описал новое психоэмоциональное состояние современного человека

Исследование психолингвистов изменило представления о чтении у подростков

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Эксперимент подтвердил эффективность античного способа получения вина из изюма

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 65

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Стоит ли прогревать двигатель в холодную погоду

5 удивительных сферических видеопанорам от AirPano

Семерка самых значимых и необычных событий в науке и технике 2021 года

Великие мореходы Хейердала

Цена страха: как АЭС оказались жертвой массовой культуры и смогут ли они взять реванш

Посмотрите вверх: факты, загадки и домыслы о кометах

«Багратион»: удар Красной армии, который удивил даже Красную армию

Физика почти невозможного: о чем расскажет самый яркий пульсар

Ученые адаптировали ИИ для генерации изображений под российскую культуру

По теме

Культурные различия оказались связаны с оценкой креативности

В Facebook отказались перенести данные пользователей на территорию РФ

Российская армия получит сотни новых БМП-3

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 65

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Хотите
вести колонку
в нашем
издании?