«Сбер» представил нейросеть ruDALL-E. Она создает красивые картинки по описанию на русском языке
Проект по обучению ruDALL-E — самый большой нейросетевой вычислительный проект в России и СНГ, который можно считать «настоящим прорывом для русскоязычной индустрии».
«Сбер» представил первую нейросеть, которая генерирует неограниченное число изображений на основе заданного описания на русском языке. Разработку назвали ruDALL-E, рассказывается на посвященном ей сайте и в пресс-релизе. ruDALL-E может пригодиться копирайтерам, а также специалистам и обычным людям при поисках нужного варианта дизайна интерьера помещений, для создания стоковых картинок, векторных иллюстраций, а также рекламных материалов.
«Помимо вклада в прогресс в области ИИ, генерация изображений закрывает две важных потребности современного бизнеса — возможность получить уникальную картинку под собственное описание, а также в любой момент создавать необходимое количество licence-free-иллюстраций. При этом создание «мультимодальных» нейронных сетей, которые обучаются сразу на нескольких видах данных, даже сейчас, в эпоху big data и огромных возможностей поиска, будет очень востребованным, поскольку решает задачи на принципиально ином уровне. Технология пока совсем новая, первые шаги в этом направлении были сделаны только в 2020 году, а еще в 2018-2019 годах даже постановку такого рода задачи нельзя было себе представить. ruDALL-E можно считать настоящим прорывом для русскоязычной индустрии», — отметил Давид Рафаловский, исполнительный вице-президент Сбербанка и руководитель блока «Технологии».
Всего есть два варианта модели. Первый — ruDALL-E Malevich (XL) — содержит 1,3 миллиарда параметров и «по короткому текстовому описанию <…> генерирует яркие и красочные изображения на самые разные темы и сюжеты, <…> понимает обширный набор понятий и генерирует совершенно новые изображения и объекты, которых не существовало в реальном мире». Этой версией нейросети можно пользоваться бесплатно: нужно лишь загрузить ее с сервиса Github.
Второй вариант — ruDALL-E Kandinsky (XXL) — имеет ту же архитектуру, что и ruDALL-E Malevich, но содержит уже 12 миллиардов параметров. В ближайшее время обе модели станут доступны на платформе ML Space, в хабе DataHub от SberCloud — облачной платформы «Сбера», разработчик которой, ООО «Облачные технологии», в 2019 году представил самый мощный в России суперкомпьютер Christofari.

Итак, ruDALL-E создает изображения по текстовому описанию (кстати, обучается она и на картинках) в три этапа. Одна нейросеть берет текст на вход и генерирует необходимое число картинок, после чего другая нейросеть определяет, какие из них самые удачные и больше всего соответствуют заданным пользователем характеристикам. Затем третья нейросеть увеличивает картинки в размере. Что особенно важно: качество при этом никак не страдает.
Ранее в этом году Sber AI — подразделение «Сбера», ответственное за развитие и внедрение технологий ИИ — представило архитектуру модели DALL-E для английского языка. Но в открытом доступе она полностью не появилась. На основе их разработки SberDevices и Sber AI вместе с коллегами из SberCloud воспроизвели код и запустили обучение нейросети на ML Space на базе суперкомпьютера Christofari. На создание русского варианта нейросети ушло 23 тысячи GPU-часов (Graphics Processing Unit) и массив данных из 120 миллионов пар текст — изображение.
Анализ более 150 тысяч древних звезд Млечного Пути показал, что возраст космоса, судя по всему, близок к 13,8 миллиарда лет. Авторы нового исследования заключили, что сценарии, в которых Вселенную приходится делать заметно «моложе» ради решения хаббловского кризиса, плохо согласуются с наблюдениями. Это важно, поскольку возраст старейших светил — один из немногих независимых способов проверить космологические модели не по данным ранней Вселенной, а по объектам нашей собственной Галактики.
Мы много знаем о том, как цивилизации до нас строили дома и дороги, но с объектами материальной культуры дела обстоят сложнее. Ремесленные техники часто хранились в строгом секрете и могли быть случайно утрачены при неудачном стечении обстоятельств. Так случилось с ювелирной техникой цзинь чжэ сы.
Японские исследователи выловили у берегов Окинавы пластиковую бутылку с узким горлышком, внутри которой сидел большой живой краб. В итоге ученые смогли найти ответы на несколько возникших в связи с этой находкой вопросов: как краб попал в бутылку, сколько там находился и как ему удалось выжить?
Ученые Южного федерального университета исследовали новую светочувствительную молекулу и обнаружили, что она ведет себя совсем не так, как ожидалось. Благодаря необычным свойствам она может стать основой для создания умных материалов, сенсоров и лекарств, которые будут активироваться светом именно там, где нужно, например, для борьбы с опасными бактериями.
Анализ более 150 тысяч древних звезд Млечного Пути показал, что возраст космоса, судя по всему, близок к 13,8 миллиарда лет. Авторы нового исследования заключили, что сценарии, в которых Вселенную приходится делать заметно «моложе» ради решения хаббловского кризиса, плохо согласуются с наблюдениями. Это важно, поскольку возраст старейших светил — один из немногих независимых способов проверить космологические модели не по данным ранней Вселенной, а по объектам нашей собственной Галактики.
В вакууме космоса два металлических предмета, прижатые друг к другу, могут спонтанно свариться без какого-либо нагрева. Из-за отсутствия кислорода на поверхностях деталей разрушается защитный слой, в результате чего свободные электроны начинают мгновенно перемещаться между ними и соединяют два элемента в один монолит.
Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.
Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.
Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии