Рубрика Hi-Tech

Приложение Google Lens научилось распознавать миллиард изображений

Оно умеет не только различать картинки, но и копировать предложения с фотографии.

Компания Google опубликовала в своем блоге отчет об успехах приложения Google Lens за прошедший год. На старте в его библиотеке хранилось 250 тысяч объектов, сейчас их суммарное количество превышает миллиард, и, ко всему прочему, программа обзавелась новыми функциями.

 

Большой объем предметов поступил благодаря сервису Google Shopping, который предназначен для поиска различных товаров в интернет-магазинах. Поскольку алгоритм Google Lens сверяется с тысячами изображений поисковика, определение объекта по фото не занимает много времени. Этот метод позволил добавить внушительный объем данных, однако у него есть свои недостатки. Например, он не учитывает старые предметы, которые не попадают в онлайн-магазины, — вроде ретроконсолей или кассетных плееров. Поэтому и Google Lens не сможет их узнать.

 

Вместе с тем специалисты компании отмечают, что алгоритм до сих пор не всегда работает корректно. Они объясняют это совокупностью факторов, среди которых — несоответствие фотографий пользователей картинкам, по которым тренируется модель, угол обзора и качество снимков. По их словам, они уже работают над решением, предлагая искусственному интеллекту больше изображений, снятых на камеры смартфона.

 

©Google

 

Еще в ранней версии Google Lens могло выводить информацию о заведении (например, о ресторане) по фотографии его вывески. Сейчас создатели пошли дальше и научили приложение читать. Теперь оно способно скопировать выделенный на фотографии текст. При этом оно учитывает разные языки и шрифты, благодаря образцам из базы данных Google Books, по которым обучалось. Для того чтобы различать похожие символы вроде нуля и буквы «о», алгоритм проверяет правописание в интернете.

 

©Google

 

Также у приложения появился поиск по стилю, который позволяет по сделанной фотографии найти похожие предметы. Опять же, программа будет искать среди образцов из магазина, поэтому стоит тщательно выбирать угол обзора. В России Google Lens доступно через приложение «Google Фото». 

 

Весной корпорация Google анонсировала пару экспериментов, которые помогут искусственному интеллекту лучше понимать семантическую связь между словами. Несмотря на серьезную задачу, сами программы оформлены в виде игр, в которых ответы участников постоянно совершенствуют способности алгоритма.