Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Нейросеть научили читать и расшифровывать древнерусские грамоты
В НовГУ разработали систему искусственного интеллекта для автоматического распознавания и интерпретации текстов древнерусских грамот. Разработка вошла в число проектов-победителей грантового конкурса «Студенческий стартап» Фонда содействия инновациям. На её реализацию выделен один миллион рублей.
Автор разработки — магистрант Политехнического института, ассистент кафедры информационных технологий и систем Иван Филиппов. Руководитель проекта — доцент кафедры физики твёрдого тела и микроэлектроники Ирина Телина.
— Задача распознавания букв достаточно тривиальна в области компьютерного зрения, однако специфика древнерусских символов вносит дополнительную сложность, — отметил Иван Филиппов. — Эксперты подтверждают необходимость поиска новых инструментов для работы с древнерусскими документами. Только в Великом Новгороде уже найдено более 1200 берестяных грамот, и их количество продолжает расти с каждым годом. При этом процесс их расшифровки очень трудоёмкий и требует много времени. Многие символы могут иметь разные варианты прочтений, а разнообразие устаревших букв и наличие редких диакритических знаков усложняют классификацию по стандартным моделям.
Автоматических решений для таких задач на данный момент нет. Существующие аналоги либо недостаточно точны, либо нестабильны, либо требуют больших, размеченных вручную датасетов. Разработка Ивана Филиппова призвана стать новым быстрым инструментом для библиографиов, палеографов, архивистов.
Для обучения нейросети использовали датасет из пяти «эталонных» грамот, на которых буквы были размечены вручную. При отборе грамот было важно, чтобы они были целыми, крупными по объёму и содержали наибольшее разнообразие разборчиво написанных букв. Также в датасет вошли автоматические вырезки букв, сделанные детектором.
— С запуска детектора начинается процесс работы ИИ, — пояснил Иван Филиппов. — Детектор отвечает за обнаружение и объединение боксов вокруг букв. Боксы — это прямоугольники, заключающие в себе буквы. Так как модель не может принять полную грамоту и дать детальную расшифровку — необходимо давать ей буквы по отдельности, уже после собирая их в строки. Затем происходит сегментация, поиск контуров, объединение соседних боксов по дистанции и соотношение площадей. Далее для распознавания букв используется свёрточная сеть ResNet-18, адаптированная под вырезки 64х64 пикселя. Все полученные вырезки букв сохраняются в виде PNG-файлов, сгруппированных по классам. Экспорт данных реализован на языке программирования Python с использованием стандартных библиотек, что гарантирует лёгкую интеграцию и последующую аналитику.
На данный момент уже создано приложение, позволяющее быстро загружать фото, автоматически детектировать боксы, распознавать буквы и экспортировать результаты. Для удобства пользователя в нём используется интуитивный интерфейс Canvas позволяет быстро и наглядно загружать любые изображения грамот, использовать функции зума и панорамы для точного выбора областей, автоматически или вручную выделять рамки вокруг букв, мгновенно редактировать, перемещать, удалять и отменять действия. Все действия выполняются мышью и горячими клавишами, а готовые инструменты Python обеспечивают простоту интеграции и отзывчивость даже на больших изображениях.

Система способна обучаться самостоятельно, в будущем этот процесс планируется полностью автоматизировать. Сейчас, по мере использования программы, датасет для обучения обогащается новыми качественными расшифровками.
— Система показала высокую производительность: полный прогон одного изображения занимает 1-2 секунды, — рассказал Иван Филиппов. — Также она демонстрирует надёжность и устойчивость благодаря компактной архитектуре, плавной работе пользовательского интерфейса. Точность распознавания высокая — после всех доработок и корректировок она составляет 98%. Система уже сейчас готова к интеграции в архивные и научные проекты по изучению древнерусских грамот. То, что уже сделано, позволяет раскрыть такие функции, как датирование и установка авторства грамоты. Также модель, обученная на грамотах, хорошо работает и с рукописями, что и является основной проблемой, к решению которой в итоге мы придём. Ведь у нас хранится множество рукописей, о которых, помимо самого текста, мало чего известно. В любом случае, мы открыты к взаимодействию и готовы работать со всеми, кто может быть заинтересован в реализации проекта — например, с Центром археологических исследований НовГУ.
Новое исследование показало, что вейперы, причем даже те, кто уже отказались от этой привычки, подвержены язвенной болезни желудка в большей степени, чем люди, никогда не курившие электронные сигареты.
В комплексах uST, где беспилотный транспорт фактически движется по натянутым струнам, возникают вынужденные и собственные колебания. При совпадении частот этих колебаний возможен резкий рост амплитуды. Это, в свою очередь, вызывает резонанс, который способен привести к ухудшению комфорта пассажиров и даже к повреждению самой путевой структуры. Чтобы решить эту потенциальную проблему, инженеры компании UST Inc. провели ряд исследований.
Ученые из МФТИ разработали и предложили новую систему единиц для электродинамики, способную примирить два главенствующих, но исторически несовместимых подхода. Эта компромиссная система, названная авторами физико-технической (ФТ), сохраняет практическое удобство Международной системы единиц (СИ), используемой инженерами по всему миру, и в то же время отражает теоретическую стройность и симметрию гауссовой системы (СГС), предпочитаемой физиками-теоретиками.
В последнее время отказ от глютена, или клейковины — белков, содержащихся в пшенице, ржи и ячмене, — превратился в модный тренд. В соцсетях и СМИ некоторые популярные блогеры и знаменитости преподносят безглютеновые диеты как секрет хороших самочувствия и внешности. Тем не менее обзор десятков научных работ показал, что у большинства людей, считающих себя чувствительными к глютену, причина негативной реакции часто кроется не в самой клейковине.
Физики нашли способ использовать собственные электроны радия для считывания информации о ядре атома. Соединение радиоактивного элемента с фтором позволило электронам ненадолго проникать в ядро.
Один и тот же фитнес-браслет считает шаги и калории одинаково у мужчин и женщин, но внутренний отклик организма на физическую нагрузку различается. Это выяснили авторы нового исследования. Ученые пришли к выводу: чтобы добиться такого же результата в снижении риска сердечно-сосудистых заболеваний, мужчинам от 50 лет нужно заниматься в спортзале более чем в два раза усерднее женщин. Результаты этой работы могут привести к пересмотру универсальных рекомендаций по физической активности.
Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.
Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.
В современном доме, насыщенном разнообразной техникой, удлинители стали незаменимым атрибутом, позволяющим обеспечить электропитанием все необходимые устройства. Однако мало кто задумывается, что привычное использование этого аксессуара может нести серьезную угрозу безопасности. По статистике, значительная часть бытовых пожаров происходит из-за неправильной эксплуатации электропроводки и вспомогательных устройств. Какие приборы категорически нельзя подключать через удлинители и почему это может привести к трагическим последствиям, рассказывает профессор кафедры наноэлектроники РТУ МИРЭА, доктор физико-математических наук Алексей Юрасов.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
