Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
В Пермском Политехе разработали модель генерации текста
Сегодня в некоторых сферах просто не обойтись без автоматической генерации контента. Электронная рассылка писем, отзывы о товаре, релевантные заголовки и отдельные абзацы для статей — все это работа сервисов, которые создают различный текстовый контент. Исследователи Пермского Политеха на базе матричного комбинаторного алгоритма разработали модель программы генерации слов, предложений и текста. Технология применима для языков, письменность которых основана на латинице и кириллице.
Результаты работы представлены в журнале Austria science. Как говорит автор программы, алгоритм, который используется в модели, является функциональным и генерирует все слова из букв по математическим правилам комбинаторики и матричного исчисления. Так, для русского алфавита формирование предложений начинается с составления двухбуквенных слов.
Затем путем умножения строки на каждый столбец матрицы получается полная система абсолютно всех трехбуквенных слов. Таким образом базис матриц образует все множество слов данного алфавита.
После генерации всех вариантов слов путем подключения словарей выделяются и оставляются в матрице только те, которые подходят по смыслу в определенный момент. Остальные, не подходящие по лексическому значению слова считаются нулями и по умолчанию не выдаются системой. После добавления точки или пробела в полученные ранее базис формируются предложения.

Такой иерархический матричный базис решает проблему визуализации и одновременно фиксирует место каждого слова и предложения в тексте. Это открывает путь к созданию информационной технологии для анализа, сравнения и распознавания текстов различных авторов и их идентификации.
«Стоит отметить, что предложенный программный матричный генератор текста превосходит все природные генераторы (писатели) и может быть использован в системе искусственного интеллекта. Однако человеческий текстовый генератор обладает меньшей избыточностью за счет использования омонимов и других трудных для понимания матрицы лексических значений», — сообщает доцент кафедры общей физики Вячеслав Кирчанов.
По словам политехника, в конечной перспективе искусственный интеллект, обладая абсолютно всеми словами определенного языка, опираясь на иерархические базисы слов и предложений, привнося смысл в новые слова, будет писать тексты, статьи, книги и другую печатную продукцию.
Чтобы охотиться при температурах ниже нуля, пауки рода Clubiona выработали особые белки-антифризы. Изучив членистоногих, собранных в грушевых садах неподалеку от города Брно (Чехия), ученые раскрыли молекулярный механизм, позволяющий этим паукам не впадать в зимнюю спячку.
Бразильские зоологи выяснили, каких именно насекомых и пауков ловят домашние кошки в городах. Для этого использовали не полевые наблюдения, а анализ социальных сетей. Просмотрев более 17 000 видео и фото в TikTok и на фотостоке iStock, ученые нашли 550 записей кошачьей охоты. Самая частая добыча — кузнечики, сверчки, цикады и тараканы.
Наблюдая за галактикой CANUCS-LRD-z8.6 с помощью космической обсерватории «Джеймс Уэбб», астрономы обнаружили в ее центре сверхмассивную черную дыру. Хотя она существовала всего через 500 миллионов лет после Большого взрыва, ее масса оказалась рекордной для столь ранней эпохи.
Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.
Так называемые зумеры и альфа, несмотря на молодой возраст, уже формируют ключевые поведенческие и потребительские тренды. Ученые Пермского Политеха рассказали, почему обозначение поколений начали с конца алфавита, как альфа и зумеры отличаются в способности к терпеливости, совмещении цифрового и реального «Я», подходу к профессиональной деятельности и отношении к финансам, какое мышление пришло на смену клиповому и как использование искусственного интеллекта повлияет на авторитет родителей.
Бразильские зоологи выяснили, каких именно насекомых и пауков ловят домашние кошки в городах. Для этого использовали не полевые наблюдения, а анализ социальных сетей. Просмотрев более 17 000 видео и фото в TikTok и на фотостоке iStock, ученые нашли 550 записей кошачьей охоты. Самая частая добыча — кузнечики, сверчки, цикады и тараканы.
Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.
Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.
По расчетам, большинство «гостей» из других звездных систем летят к Земле примерно со стороны созвездия Геркулес. Скорее всего, они время от времени падают на нашу планету, просто мы еще не научились это замечать. Как удалось вычислить, чаще всего они должны падать зимой и где-то в окрестностях экватора.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно