«Сбер» представил нейросеть ruDALL-E. Она создает красивые картинки по описанию на русском языке
Проект по обучению ruDALL-E — самый большой нейросетевой вычислительный проект в России и СНГ, который можно считать «настоящим прорывом для русскоязычной индустрии».
«Сбер» представил первую нейросеть, которая генерирует неограниченное число изображений на основе заданного описания на русском языке. Разработку назвали ruDALL-E, рассказывается на посвященном ей сайте и в пресс-релизе. ruDALL-E может пригодиться копирайтерам, а также специалистам и обычным людям при поисках нужного варианта дизайна интерьера помещений, для создания стоковых картинок, векторных иллюстраций, а также рекламных материалов.
«Помимо вклада в прогресс в области ИИ, генерация изображений закрывает две важных потребности современного бизнеса — возможность получить уникальную картинку под собственное описание, а также в любой момент создавать необходимое количество licence-free-иллюстраций. При этом создание «мультимодальных» нейронных сетей, которые обучаются сразу на нескольких видах данных, даже сейчас, в эпоху big data и огромных возможностей поиска, будет очень востребованным, поскольку решает задачи на принципиально ином уровне. Технология пока совсем новая, первые шаги в этом направлении были сделаны только в 2020 году, а еще в 2018-2019 годах даже постановку такого рода задачи нельзя было себе представить. ruDALL-E можно считать настоящим прорывом для русскоязычной индустрии», — отметил Давид Рафаловский, исполнительный вице-президент Сбербанка и руководитель блока «Технологии».
Всего есть два варианта модели. Первый — ruDALL-E Malevich (XL) — содержит 1,3 миллиарда параметров и «по короткому текстовому описанию <…> генерирует яркие и красочные изображения на самые разные темы и сюжеты, <…> понимает обширный набор понятий и генерирует совершенно новые изображения и объекты, которых не существовало в реальном мире». Этой версией нейросети можно пользоваться бесплатно: нужно лишь загрузить ее с сервиса Github.
Второй вариант — ruDALL-E Kandinsky (XXL) — имеет ту же архитектуру, что и ruDALL-E Malevich, но содержит уже 12 миллиардов параметров. В ближайшее время обе модели станут доступны на платформе ML Space, в хабе DataHub от SberCloud — облачной платформы «Сбера», разработчик которой, ООО «Облачные технологии», в 2019 году представил самый мощный в России суперкомпьютер Christofari.

Итак, ruDALL-E создает изображения по текстовому описанию (кстати, обучается она и на картинках) в три этапа. Одна нейросеть берет текст на вход и генерирует необходимое число картинок, после чего другая нейросеть определяет, какие из них самые удачные и больше всего соответствуют заданным пользователем характеристикам. Затем третья нейросеть увеличивает картинки в размере. Что особенно важно: качество при этом никак не страдает.
Ранее в этом году Sber AI — подразделение «Сбера», ответственное за развитие и внедрение технологий ИИ — представило архитектуру модели DALL-E для английского языка. Но в открытом доступе она полностью не появилась. На основе их разработки SberDevices и Sber AI вместе с коллегами из SberCloud воспроизвели код и запустили обучение нейросети на ML Space на базе суперкомпьютера Christofari. На создание русского варианта нейросети ушло 23 тысячи GPU-часов (Graphics Processing Unit) и массив данных из 120 миллионов пар текст — изображение.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Во всем мире во всех человеческих культурах около 90% людей пользуются преимущественно правой рукой. Такое поразительное единство практически всего человечества не имеет аналогов среди приматов и до сих пор остается эволюционной загадкой. Ученые проанализировали данные о более чем двух тысячах человекообразных обезьянах и выяснили, когда и почему праворукость стала популяционной тенденцией.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Во всем мире во всех человеческих культурах около 90% людей пользуются преимущественно правой рукой. Такое поразительное единство практически всего человечества не имеет аналогов среди приматов и до сих пор остается эволюционной загадкой. Ученые проанализировали данные о более чем двух тысячах человекообразных обезьянах и выяснили, когда и почему праворукость стала популяционной тенденцией.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии