Специалисты из Ланкастерского университета разработают метод визуализации литературных произведений на основе алгоритмов распознавания текста, 3D-анимации и геоинформационных систем.
Разработкой технологий автоматической обработки текстов занимается сравнительно новая область знаний — цифровые гуманитарные науки (digital humanities). Например, она предполагает визуализацию литературных произведений. Так, ранее американские литературоведы на основе компьютерного анализа английских романов XVIII–XIX веков составили карту эмоционального восприятия Лондона. Их британские коллеги также совмещали машинное обучение с геоинформационными системами (ГИС): это позволило проследить связь маршрутов, которыми в XVIII веке англичане передвигались по Озерному краю, с субъективной оценкой местности.
Также существуют алгоритмы визуализации текстовых описаний. Примером тому может служить проект WordsEye, который рассчитан на трехмерное моделирование словесных описаний. Программа Ланкастерского университета ставит своей целью создание программного обеспечения для автоматического извлечения геолокационных меток из текста и построения на их основе 3D-изображений. По словам ученых, ключевая трудность задачи заключается в реалистичной реконструкции вымышленных территорий. Исследовательский Совет по искусству и гуманитарным наукам (AHRC) Великобритании выделил на реализацию замысла 914 тысяч фунтов стерлингов. Завершить работу планируется в течение трех лет.
Согласно графику, в первый год авторы намерены обработать массив текстов: на этом этапе компьютерный алгоритм будет тренироваться извлечению описательных элементов, подходящих для визуализации, и конвертировать их в формат XML. На протяжении второго года работы система будет обучаться сжиманию текстов до XML-описания отдельных территорий и составлять визуальный справочник ландшафтов посредством технологий 3D-моделирования. В последний год программа освоит визуальное воспроизведение определенных сцен — для этого будет задействовано программное обеспечение для игровых движков. Другие технические подробности проекта не раскрываются.
Результатом программы, как сообщается в пресс-релизе, станет сайт с крупной базой карт. В частности, в нее войдут модели Средиземья из легендариума Джона Толкиена и графства Барсетшир из «Барсетширских хроник» Энтони Троллопа. Ожидается, что технология может оказать существенный вклад в образование. При этом ученые не рассчитывают представить альтернативу традиционным книгам — трехмерные проекции выступят в качестве дополнения к текстовым описаниям, помогающего визуализации. Помимо моделирования алгоритмы распознавания применяются и для иных задач. Так, в 2016 году канадские программисты показали систему, которая позволяет искать ответы в незнакомых текстах.
О разработке нового метода сообщается на сайте Ланкастерского университета.
В 2014 году американские студенты создали книгу, которая передает физические реакции персонажей читателю.