Рубрика Hi-Tech

Искусственный интеллект DeepMind воссоздал трехмерную сцену по фотографии

Алгоритм учился на множестве примеров, чтобы понять, где располагается источник света и как он влияет на окружающие объекты.

Британская компания DeepMind разработала нейронную сеть, которая способна представлять трехмерное окружение по одному двухмерному снимку. Об этом пишет издание New Scientist.

 

Система называется «Генерирующая сеть запросов» (Generative Query Network (GQN)). Автор исследования Али Эслами (Ali Eslami) объяснил принцип работы:

 

«Представьте, что вы смотрите на гору Эверест и передвигаетесь на метр: она не изменит своего размера, и это даст вам информацию о расстоянии до нее. Если вы посмотрите на кружку, то увидите, что ее положение меняется. Примерно так и работает наша технология».

 

DeepMind

 

Чтобы научить ИИ анализировать, команда показывала ему изображения одной сцены с разных точек обзора. Эти картинки сеть использовала для того, чтобы понять, как изменяются объекты, и спрогнозировать, как они будут выглядеть с других ракурсов. Система также учитывала текстуры и освещение.

 

DeepMind

 

Один из работников Данило Резенде (Danilo Rezende) сказал, что алгоритм обучается так же, как люди. Увидев множество раз один и тот же объект, он анализирует его характеристики, запоминает и использует их при повторном взаимодействии. По его словам, искусственный интеллект способен воспроизвести целый лабиринт, просканировав несколько фотографий, сделанных изнутри.

 

Ранее Демис Хассабис, стоящий у истоков искусственного интеллекта и основавший компанию DeepMind, признал, что человечеству еще предстоит решить множество вопросов, связанных с этикой ИИ.