Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
В Пермском Политехе разработали модель генерации текста
Сегодня в некоторых сферах просто не обойтись без автоматической генерации контента. Электронная рассылка писем, отзывы о товаре, релевантные заголовки и отдельные абзацы для статей — все это работа сервисов, которые создают различный текстовый контент. Исследователи Пермского Политеха на базе матричного комбинаторного алгоритма разработали модель программы генерации слов, предложений и текста. Технология применима для языков, письменность которых основана на латинице и кириллице.
Результаты работы представлены в журнале Austria science. Как говорит автор программы, алгоритм, который используется в модели, является функциональным и генерирует все слова из букв по математическим правилам комбинаторики и матричного исчисления. Так, для русского алфавита формирование предложений начинается с составления двухбуквенных слов.
Затем путем умножения строки на каждый столбец матрицы получается полная система абсолютно всех трехбуквенных слов. Таким образом базис матриц образует все множество слов данного алфавита.
После генерации всех вариантов слов путем подключения словарей выделяются и оставляются в матрице только те, которые подходят по смыслу в определенный момент. Остальные, не подходящие по лексическому значению слова считаются нулями и по умолчанию не выдаются системой. После добавления точки или пробела в полученные ранее базис формируются предложения.
Такой иерархический матричный базис решает проблему визуализации и одновременно фиксирует место каждого слова и предложения в тексте. Это открывает путь к созданию информационной технологии для анализа, сравнения и распознавания текстов различных авторов и их идентификации.
«Стоит отметить, что предложенный программный матричный генератор текста превосходит все природные генераторы (писатели) и может быть использован в системе искусственного интеллекта. Однако человеческий текстовый генератор обладает меньшей избыточностью за счет использования омонимов и других трудных для понимания матрицы лексических значений», — сообщает доцент кафедры общей физики Вячеслав Кирчанов.
По словам политехника, в конечной перспективе искусственный интеллект, обладая абсолютно всеми словами определенного языка, опираясь на иерархические базисы слов и предложений, привнося смысл в новые слова, будет писать тексты, статьи, книги и другую печатную продукцию.
Экс-спикер Минобороны Армении Арцрун Ованнисян в эфире армянского Общественного телевидения решил «развеять миф» о Второй мировой войне. В частности, он заявил, что выигрыш Сталинградской битвы был не спасением для страны. Напротив, если бы немцы победили, уверен он, была бы создана объединенная историческая Армения — куда вошли бы земли, сегодня удерживаемые Турцией. Так ли все было на самом деле?
Крис Фалкенберг (Chris Falkenberg) — концепт-дизайнер и цифровой иллюстратор из США, чьи работы создают эффект погружения в далёкие миры, высокотехнологичные цивилизации и воображаемые космические сценарии. Его художественный стиль сочетает точность технического рендеринга с кинематографичной атмосферой.
Физики долго не могли определиться, является ли висмут топологическим материалом. Детальное исследование показало, что ученым стоит передоговориться о терминах.
Экс-спикер Минобороны Армении Арцрун Ованнисян в эфире армянского Общественного телевидения решил «развеять миф» о Второй мировой войне. В частности, он заявил, что выигрыш Сталинградской битвы был не спасением для страны. Напротив, если бы немцы победили, уверен он, была бы создана объединенная историческая Армения — куда вошли бы земли, сегодня удерживаемые Турцией. Так ли все было на самом деле?
Споры вокруг выделения антропоцена в самостоятельную геологическую эпоху не утихли после официального отказа Международного союза геологических наук, наоборот, разожглись сильнее. Шведские геологи, придерживаясь логики союза, решили оценить легитимность других периодов кайнозойской эры и выяснили, что доказательства в пользу голоцена слабее, чем у антропоцена. Если идти дальше, то и половину ступеней кайнозоя можно откинуть.
В Бразилии проживает более 200 миллионов человек, немалую долю которых занимают потомки иммигрантов. Колонизация с XV по XX века считается самым масштабным переселением народов в истории. Порядка пяти миллионов человек переселились туда из Европы. Столько же насильно переместили с Африканского континента. Сегодня бразильцы — это наиболее генетически разнородная нация, и одна из самых малоизученных. Поэтому неудивительно, что новая работа по результатам полногеномного анализа населения принесла целый ряд открытий.
Да, с волосами и люком все так. У космонавта Суниты Уильямс волосы на МКС плавали свободно, а у Кэти Пэрри и прочих в полете 14 апреля 2025 года — нет. Но это не значит, что суборбитального космического полета первого чисто женского экипажа не было или что он был инсценировкой. Причем, в общем-то, чтобы понять это, даже не нужно обладать специальными знаниями.
Мощнейшее отключение электроэнергии за последние 20 лет истории Европы случилось уже неделю назад, а испанские власти пока так и не объявили о его причинах. Это логично: как мы покажем ниже, ответ на вопрос, кто виноват, получится очень неполиткорректным. И, более того, противоречащим линии правящей в Испании партии. Но мы живем за тысячи километров от нее, поэтому можем себе позволить аполитичный анализ случившегося. Так что же произошло на самом деле и каковы наши шансы увидеть подобное у себя дома?
Инженеры компании UST Inc. разработали передовой рельсовый беспилотник, способный передвигаться на скорости до 500 километров в час. Юнибус U5-75304 предназначен для перевозки пассажиров и может в перспективе заменить среднемагистральную авиацию. Давайте узнаем, как конструктивные особенности обеспечивают продолжительное движение на больших скоростях, комфорт и безопасность пассажирам.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
ПонятноИз-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
ПонятноНаши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
ПонятноМы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
ПонятноМы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии