Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
В Пермском Политехе разработали модель генерации текста
Сегодня в некоторых сферах просто не обойтись без автоматической генерации контента. Электронная рассылка писем, отзывы о товаре, релевантные заголовки и отдельные абзацы для статей — все это работа сервисов, которые создают различный текстовый контент. Исследователи Пермского Политеха на базе матричного комбинаторного алгоритма разработали модель программы генерации слов, предложений и текста. Технология применима для языков, письменность которых основана на латинице и кириллице.
Результаты работы представлены в журнале Austria science. Как говорит автор программы, алгоритм, который используется в модели, является функциональным и генерирует все слова из букв по математическим правилам комбинаторики и матричного исчисления. Так, для русского алфавита формирование предложений начинается с составления двухбуквенных слов.
Затем путем умножения строки на каждый столбец матрицы получается полная система абсолютно всех трехбуквенных слов. Таким образом базис матриц образует все множество слов данного алфавита.
После генерации всех вариантов слов путем подключения словарей выделяются и оставляются в матрице только те, которые подходят по смыслу в определенный момент. Остальные, не подходящие по лексическому значению слова считаются нулями и по умолчанию не выдаются системой. После добавления точки или пробела в полученные ранее базис формируются предложения.

Такой иерархический матричный базис решает проблему визуализации и одновременно фиксирует место каждого слова и предложения в тексте. Это открывает путь к созданию информационной технологии для анализа, сравнения и распознавания текстов различных авторов и их идентификации.
«Стоит отметить, что предложенный программный матричный генератор текста превосходит все природные генераторы (писатели) и может быть использован в системе искусственного интеллекта. Однако человеческий текстовый генератор обладает меньшей избыточностью за счет использования омонимов и других трудных для понимания матрицы лексических значений», — сообщает доцент кафедры общей физики Вячеслав Кирчанов.
По словам политехника, в конечной перспективе искусственный интеллект, обладая абсолютно всеми словами определенного языка, опираясь на иерархические базисы слов и предложений, привнося смысл в новые слова, будет писать тексты, статьи, книги и другую печатную продукцию.
Согласно гипотезе о так называемой Еврогондване, в эпоху динозавров Европа, как часть северного суперконтинента Лавразия, еще не полностью отделилась от южного суперконтинента Гондвана и животные могли свободно мигрировать между Европой и Африкой. Однако новый анализ найденных в Венгрии костей первобытного крокодила показал, что его сходство с гондванскими видами обусловлено не близким родством, а схожим образом жизни.
Треть века назад Штаты и Мексика подписали Североамериканское соглашение о свободной торговле. Авторы новой научной работы показали, что это спровоцировало рост войн между бандами и подъем смертности среди молодых мужчин на десятки процентов — но только в тех зонах, которые были интересны картелям. Всего после подписания соглашения в Мексике было убито (оценка с учетом исчезнувших трупов) более 0,85 миллиона человек.
Новые данные показали, что удар зонда DART не только изменил орбитальный период небольшого спутника Диморфа вокруг его «родителя» Дидима, но и вызвал небольшое изменение движения всей бинарной системы вокруг Солнца. Эти результаты укрепляют уверенность ученых в том, что технология кинетического удара, при заблаговременном обнаружении опасного объекта, может помочь отклонить потенциально опасный астероид от столкновения с Землей.
Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.
Запасы лития в России требуют переоценки и могут оказаться в разы выше, чем считалось до 2025 года. Об этом говорится в исследовании «Состояние ресурсной базы критически важных металлов и элементов для развития современных технологий», подготовленном учеными РГУ нефти и газа (НИУ) имени И.М. Губкина.
Российские ученые из МФТИ с коллегами из Института прикладной математики им. М. В. Келдыша РАН и Института физики Земли им. О.Ю. Шмидта РАН разработали инновационный метод для расчета равновесного распределения несмешивающихся жидкостей в пористой среде. Результаты применения этого метода можно использовать в разработках по повышению нефтеотдачи и гидрологии, а также геологического СО2-хранения.
Астрономы недавно проанализировали базу данных о падающих на Землю объектах и пришли к выводу, что два из них прибыли из межзвездного пространства. Известна не только дата, но и место падения каждого из них.
В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.
«Любить лишь можно только раз», — писал поэт Сергей Есенин, а герои культовых сериалов приходили к выводу, что «настоящая» влюбленность случается в жизни максимум дважды. Однако ни один из этих тезисов не подкреплен научными данными. Американские исследователи подошли к вопросу иначе: опросили более 10 тысяч человек и вывели среднее число сильных влюбленностей, возможных в течение жизни.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно