Эксперты из корпорации Google и Стенфордского университета смогли научить компьютер описывать фото человеческим языком. Эта технология будет особенно востребованной в будущем.
В Google создали специальные алгоритмы, которые используют нейронные сети. Важно отметить, что компьютер получил возможность не только описывать предметы на фотографии, но также научился выстраивать простейшие связи между ними.
Фотографию, на которой были изображены лежащие на плите пиццы, система определила как «две пиццы, лежащие на поверхности плиты». Еще пример: когда компьютеру показали фото совершающих покупки людей, он охарактеризовал его как «группа людей, совершающих покупки на уличном рынке».
И хотя такого рода эксперимент не кажется чем-то невероятным, эксперты уже успели назвать его важнейшим шагом в области машинного обучения и компьютерного зрения. Чтобы добиться таких результатов, лучшие специалисты использовали самые передовые технологии и выполнили огромный объем работ.
И хотя сейчас технологию не планируют использовать для решения насущных проблем, ее потенциал огромен. На первом этапе она может помочь людям с плохим зрением (например, если речь идет об изображениях в интернете). Возможно, Google захочет интегрировать свое изобретение в поисковую систему. К примеру, с его помощью можно будет найти картинки, не имеющие подписей.