• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
30.05.2022
ПНИПУ
521

В Пермском Политехе разработали модель генерации текста

4.6

Сегодня в некоторых сферах просто не обойтись без автоматической генерации контента. Электронная рассылка писем, отзывы о товаре, релевантные заголовки и отдельные абзацы для статей — все это работа сервисов, которые создают различный текстовый контент. Исследователи Пермского Политеха на базе матричного комбинаторного алгоритма разработали модель программы генерации слов, предложений и текста. Технология применима для языков, письменность которых основана на латинице и кириллице.

В Пермском Политехе разработали модель генерации текста / ©Getty images

Результаты работы представлены в журнале Austria science. Как говорит автор программы, алгоритм, который используется в модели, является функциональным и генерирует все слова из букв по математическим правилам комбинаторики и матричного исчисления. Так, для русского алфавита формирование предложений начинается с составления двухбуквенных слов.

Затем путем умножения строки на каждый столбец матрицы получается полная система абсолютно всех трехбуквенных слов. Таким образом базис матриц образует все множество слов данного алфавита.

После генерации всех вариантов слов путем подключения словарей выделяются и оставляются в матрице только те, которые подходят по смыслу в определенный момент. Остальные, не подходящие по лексическому значению слова считаются нулями и по умолчанию не выдаются системой. После добавления точки или пробела в полученные ранее базис формируются предложения.

Матрица генерации слов / ©Пресс-служба ПНИПУ

Такой иерархический матричный базис решает проблему визуализации и одновременно фиксирует место каждого слова и предложения в тексте. Это открывает путь к созданию информационной технологии для анализа, сравнения и распознавания текстов различных авторов и их идентификации.

«Стоит отметить, что предложенный программный матричный генератор текста превосходит все природные генераторы (писатели) и может быть использован в системе искусственного интеллекта. Однако человеческий текстовый генератор обладает меньшей избыточностью за счет использования омонимов и других трудных для понимания матрицы лексических значений», — сообщает доцент кафедры общей физики Вячеслав Кирчанов.

По словам политехника, в конечной перспективе искусственный интеллект, обладая абсолютно всеми словами определенного языка, опираясь на иерархические базисы слов и предложений, привнося смысл в новые слова, будет писать тексты, статьи, книги и другую печатную продукцию. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Пермский национальный исследовательский политехнический университет (национальный исследовательский, прошлые названия: Пермский политехнический институт, Пермский государственный технический университет) — технический ВУЗ Российской Федерации. Основан в 1960 году как Пермский политехнический институт (ППИ), в результате объединения Пермского горного института (организованного в 1953 году) с Вечерним машиностроительным институтом. В 1992 году ППИ в числе первых политехнических вузов России получил статус технического университета.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Вчера, 09:50
Михаил Орлов

Переход к паразитизму вызывает характерные изменения у самых разных существ. Авторы нового исследования узнали, как он повлиял на геномы растений, ставших «настолько паразитическими», что от них остался только клубень-химера с грибовидными соцветиями.

6 часов назад
Василий Парфенов

Аномально быстрое изменение яркости некоторых квазаров долгое время не давало покоя ученым. Существующие модели не могли объяснить такое непостоянство мощнейших источников излучения во Вселенной. Чтобы разобраться в этом парадоксе, американские астрофизики смоделировали «пищевое поведение» сверхмассивных черных дыр с беспрецедентной детализацией.

9 часов назад
Мария Азарова

Первый пациент, который перенес аналогичную операцию в 2022 году в том же медучреждении, умер. Однако у нового реципиента не было другого выхода, кроме как согласиться на ксенотрансплантацию.

22 сентября
ЮУрГУ

Научный коллектив Института лингвистики и международных коммуникаций ЮУрГУ создал уникальный интернет-портал, представляющий собой большой банк данных об интерпретациях в русской лингвокультуре важных общечеловеческих ценностей и других ментальных категорий. Ученые исследовали ассоциации обывателей для таких ценностей, как «образование», «карьера», «Родина», а также для концепта «страх».

Вчера, 09:50
Михаил Орлов

Переход к паразитизму вызывает характерные изменения у самых разных существ. Авторы нового исследования узнали, как он повлиял на геномы растений, ставших «настолько паразитическими», что от них остался только клубень-химера с грибовидными соцветиями.

21 сентября
Дарья

Распространенное мнение о том, что подавление негативных мыслей может быть вредным и даже опасным для психического здоровья, признали ошибочным. К такому выводу пришли ученые из Кембриджского университета (Великобритания).

31 августа
Сергей Васильев

Вопреки предсказаниям, кислород-28 оказался крайне неустойчивым. Физики не успели даже зарегистрировать такие ядра, хотя теоретически они должны быть дважды магическими, а значит — особенно стабильными.

31 августа
Дарья Губина

Тотальная память — плохо для мозга. Чтобы детально запомнить событие, стоит о нем вспоминать как можно реже. Чем больше вы знаете по теме, тем больше новой информации вы запомните. Но если информации будет слишком много, то не вся она будет зафиксирована в мозге. Naked Science разбирается, как сегодня ученые, нейробиологи и психологи объясняют способности нашего мозга запоминать и учиться.

2 сентября
Редакция

Американский поэт и литературный критик Адам Кирш в эссе, опубликованном в The Guardian, рассуждает о том, как новые представления о возможностях животного разума меняют нас самих.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: