• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
6 июня
БФУ
1
548

В БФУ рассказали, как цифровые технологии меняют язык

4.4

В День русского языка Татьяна Цвигун, кандидат филологических наук, советник при ректорате по вопросам русского языка и развития гуманитарного образования БФУ имени И. Канта, делится своими размышлениями о том, как развитие искусственного интеллекта и нейросетей меняет облик филологической науки.

Как цифровые технологии меняют язык и науку о языке / © freestocks, unsplash.com

«Цифровая лингвистика — такое словосочетание давно перестало выглядеть странным. Для современного филолога это реальность, причем довольно продуктивная, — отмечает Татьяна Цвигун. — Цифровая лингвистика и, шире, цифровая гуманитаристика активно развивается, она открывает новые возможности не только для научных исследований, но и для образовательных программ. Без тех возможностей, которые дает “цифра” ученым-гуманитариям, сегодня просто невозможно представить целый ряд самых передовых научных разработок».

Самый показательный пример — Национальный корпус русского языка, электронный онлайн-корпус текстов на русском языке, поражающий своим объемом: на настоящий момент он включает свыше двух миллиардов словоупотреблений. Это очень мощный исследовательский инструмент, основанный на системе обработки big data (больших данных), работа с ним позволяет исследователю почти моментально формировать массивы примеров из русскоязычных текстов с учетом необходимых лингвистических параметров.

Достаточно сравнить это с тем, как филолог работал с материалом еще 20-30 лет назад: просматривал тексты, составлял картотеки примеров — это был долгий и кропотливый процесс первичной обработки информации, отнимавший много времени и сил. Ведь без статистики проверка научных теорий, и в филологических исследованиях в том числе, часто невозможна. Новые технологии эту часть филологического поиска берут на себя, они дают ученому возможность быстро находить нужную информацию и в большей мере сосредоточиться на ее осмыслении, концептуализации, на проработке механизмов, которые лежат в основе тех или иных языковых явлений.

«Цифровой академик»: воображаемое или реальность?

Сможет ли искусственный интеллект заменить лингвиста, полноценно занять его место? Ответить на этот вопрос, считает Татьяна Цвигун, пока ещё довольно сложно. С одной стороны, обучаясь на реальных образцах речи, искусственный интеллект, по остроумному выражению одного из современных исследователей, «косплеит» то, с чем он работает, и можно допустить, что в какой-то момент он начнет «косплеить» и своего учителя — исследователя, который работает с большими языковыми моделями. Основа искусственного интеллекта — это своеобразная система зеркал: ИИ отзеркаливает все, с чем имеет дело. И тут встает вопрос: а с чем он будет иметь дело в ближайшем будущем?

«Вместе с тем наука, и гуманитарная в особой мере, это не только систематизация и анализ данных, но и творчество, инсайт. Способна ли нейросеть, встав на позицию исследователя, так же, как и он, креативить, проявлять научную фантазию? Пока скорее нет. Однако скорость появления и развития технологических решений настолько высока, что даже за относительно небольшое время, в которое я пытаюсь следить за тем, что происходит в нейросетях, отчетливо видно, как у нейросетей меняется речевой профиль, как возникает вербальный портрет “нейроавтора”, партнера человека по творчеству», — отмечает исследователь.

Нейросети уже вовсю пишут исследовательские тексты — университетские преподаватели делятся историями, как студенты выдают нейротексты за свои курсовые или дипломные работы и даже за свои эссе — жанр, казалось бы, весьма субъективный, требующий присутствия личного тона и индивидуального взгляда. Хотя, конечно, граница перехода с нормального, «антропного» научного языка на «нейроязык» чувствуется довольно отчетливо.

Язык нейросети шаблонизирован, строится на штампах и формулах, в нем не найти того, чего мы ожидаем от хорошего научного исследования, ведь научный язык при всей его подчеркнутой строгости и стройности, тем не менее, может быть креативным. У цифрового «исследователя» всего этого пока нет, его тексты — это имитационные продукты, равно как и художественные произведения, которые создает ИИ. Но игнорировать процессы, которые происходят в технологиях «здесь и сейчас», в непосредственной близости с нами, исследователь не может и не должен. Напротив, нужно понимать этот процесс, быть внутри его, видеть, как он развивается. С этой точки зрения искусственный интеллект, нейросети и их «речевая деятельность» сами по себе становятся для лингвиста новым объектом изучения — не менее интересным, чем тот язык, на котором мы говорим друг с другом.

«Алиса, придумай сказку»

Опыт общения с голосовыми ассистентами, построенными на нейросетях, наглядно демонстрирует, что, несмотря на впечатляющие успехи в генерации текстов, современные ИИ-системы все еще далеки от того, чтобы полноценно заменить человека в творческих задачах, требующих не только знаний и следования правилам, но и эмоционального интеллекта, личного опыта и способности выходить за рамки заданных ограничений.

Очень интересный пример — голосовой помощник «Алиса», разработка компании «Яндекс». «Алиса» активно входит в наш быт, мы общаемся с ней, осознавая, что это всего лишь программный код; однако это цифровой помощник с сильно выраженной антропностью, расположенностью к человеку. До определенного момента «Алиса» обладала весьма примечательной особенностью: она была способна отвечать на запросы пользователя достаточно дерзко, иногда даже невежливо. Это разделило пользовательскую аудиторию на тех, кого это раздражало, и тех, кто усматривал в этой способности «Алисы» близость к живому человеку со своей индивидуальностью. Сейчас программисты «Яндекса» «перевоспитали» голосовой ассистент — «Алиса» стала предельно вежливой, аккуратной, коммуникабельной, но… слишком уж правильной. И этот процесс «перевоспитания» искусственного интеллекта сам по себе представляет интересный объект для исследования и осмысления.

Исследователь рассказала, как тестировала «Алису» с точки зрения создания художественных текстов. Оказалось, что вложенный в голосовой ассистент этический протокол — настройка на вежливость, тактичность, уважительное отношение к человеку — не позволяет «Алисе» порождать по-настоящему креативные тексты с элементом интриги, неожиданности, опасности. Например, если попросить ее написать страшную сказку, она создаст текст, в котором будут соответствующие жанру образы и атрибуты: мальчик, старая кукла, чудовище, зубы, когти и тому подобное.

Но если попытаться заставить «Алису» развить сюжет этически неприемлемым действием — например, убийством, — она будет этого всячески избегать, предлагать более нейтральные варианты. И получается, что «Алиса» креативит ровно до того момента, пока в тексте не возникает сильное сюжетное напряжение — она уходит от него, этический протокол не позволяет ей создать интригу за гранью запрета, тогда как «антропный» автор способен преодолевать эту грань без особого труда. Поэтому на запрос «Алиса, расскажи сказку» голосовой ассистент обязательно придумает текст добрый, светлый, радостный, но… скучный.

Этот пример показывает, что, несмотря на широкие возможности, современные ИИ-системы все еще ограничены в своей способности создавать по-настоящему креативные и эмоционально насыщенные тексты. В отличие от человека, ИИ содержит в себе «запрет на ошибку», и это лишает его возможности выходить за рамки заложенных в него правил и ограничений.

Именно поэтому, считает Татьяна Цвигун, писателям и поэтам пока не стоит опасаться, что ИИ полностью заменит их: «Нейросеть воспитывается на определенном материале, и у нее есть ограничения: она не может выдать больше того, что в нее заложено. ИИ обладает знанием, но он не может обладать сознанием». Тем не менее, эксперименты по созданию художественных произведений в соавторстве человека и ИИ, такие как проект Павла Пепперштейна «Пытаясь проснуться», показывают любопытные результаты и открывают новые горизонты для творческого взаимодействия человека и машины.

Все можно исправить

Татьяна Цвигун также затронула тему автоматического исправления ошибок в тексте, которое сегодня легко делают компьютерные программы. По ее мнению, это не должно восприниматься как что-то оскорбительное для человека.

«Не думаю, что использование такой формы цифровой помощи как-то оскорбительно действует на человека. В том мире, где мы сейчас живем, — а это очень быстрый мир, в котором приходится порождать большое количество текстов, — без такого помощника не обойтись, — считает эксперт. — Навык грамотного письма от этого вряд ли уйдет. Скорее бОльшую опасность представляет то, что уходят привычные формы графики, письма: мы видим, что современные дети плохо пишут, им легче печатать, а это значит, постепенно исчезает письменная форма языка. Существующие же автоматизированные сервисы коррекции печатного текста помогают экономить время, работать с большими объемами текстов».

Цвигун подчеркнула, что сохранять грамотность человеку помогает врожденное или привитое чувство языковой культуры, а исправление ошибок, сделанных по невнимательности, — «довольно безобидная часть нашего взаимодействия с технологическими помощниками», тем более что за корректностью таких исправлений все-таки приходится внимательно следить.

Чтобы оставаться востребованным и эффективным в своей профессии, современному филологу необходимо осваивать новые инструменты и компетенции, связанные с цифровой обработкой и анализом языковых данных. Однако, как подчеркнула Татьяна Цвигун, этот процесс не должен восприниматься как угроза самому языку.

«Язык ничто не может обеднить и испортить, разве что его забвение. Язык всегда мудрее человека, он сам себя регулирует, сам решает, что следует принять и оставить, а от чего нужно избавиться. Язык выживет после каждого из нас и будет помнить о нас. Не мы управляем языком — это язык управляет нами», — уверена исследователь. По ее словам, язык развивается естественным путем и изменение некоторых его функций — органичная часть процесса, в основе которого лежит принцип экономии речевых усилий. Этот принцип движет язык вперед, на новый этап развития, и то, что мы иногда воспринимаем как упрощение, на самом деле является рождением нового, более адаптированного к современным реалиям языка.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Балтийский федеральный университет имени Иммануила Канта – один из ведущих вузов России, расположенный в самом западном регионе страны. БФУ является крупнейшим образовательным, научным, культурным и просветительским центром Калининградской области. Университет предлагает более 180 образовательных программ и объединяет 13 высших школ и университетский колледж. В БФУ обучаются более 12 000 студентов, в том числе из 51 страны мира, и работают более 1400 сотрудников, среди которых 740 научно-педагогических кадров и 430 аспирантов. Научная деятельность БФУ охватывает 30 направлений и осуществляется 236 исследователями, средний возраст которых составляет 38 лет. Университет гордится высоким уровнем "остепененности" научных и педагогических кадров (74,8%), наличием 10 диссертационных советов и 11 научных журналов, 4 из которых индексируются в базе данных Scopus. БФУ располагает современным оборудованием на сумму более 2,6 млрд рублей и инновационным научно-технологическим парком "Фабрика". В настоящее время университет реализует амбициозный проект создания кампуса мирового уровня на территории 29 га, где будут размещены новые учебно-лабораторные корпуса и общежития на 2500 мест. Завершение строительства запланировано на сентябрь 2025 года.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Позавчера, 10:01
Михаил Орлов

Колорадский жук Leptinotarsa decemlineata — один из самых злостных вредителей сельского хозяйства, который специализируется на картофеле и других пасленовых. Будучи родом из Скалистых гор, за последние 100 лет жук завоевал большую часть Северного полушария и сейчас осваивается в Китае. Свыше 50 различных пестицидов не смогли остановить картофельного вредителя, поэтому для борьбы с ним ученые прибегли к избирательной генетической технологии — РНК-интерференции.

Вчера, 13:16
Редакция Naked Science

Новое исследование геномных данных самых последних обитавших на Земле мамонтов не подтвердило ранее высказанные возможные причины вымирания, включая близкородственное скрещивание, пагубные мутации и охоту на них.

28 июня
Игорь Байдов

Окаменелости трилобитов — животных, которые жили сотни миллионов лет назад — палеонтологи находят довольно часто. Обычно эти находки представляют собой твердые панцири-экзоскелеты, то есть только внешнюю оболочку. Теперь же ученые обнаружили практически полные экземпляры с мягкими тканями, которые хорошо сохранились благодаря извержению вулкана. Открытие позволит специалистам лучше разобраться в анатомии древних существ, а также тщательно исследовать анатомические структуры, которые долгое время вызывали споры.

25 июня
Игорь Байдов

Ученые из Китая и Бельгии воссоздали в лаборатории условия, существовавшие на Меркурии четыре миллиарда лет назад, и выяснили, что они были идеальными для образования слоя алмазов, который с течением времени становился лишь толще.

25 июня
НИУ ВШЭ

Ученые из Института высшей нервной деятельности и нейрофизиологии РАН и НИУ ВШЭ выяснили, как формируются основы грамотности. Для этого они сравнили процессы распознавания ошибок в трех возрастных группах: у детей 8–10 лет, подростков 11–14 лет и взрослых. Эксперимент показал, что орфографическая чувствительность у ребенка появляется в начальной школе и продолжает развиваться как минимум до 14 лет. До этого возраста дети хуже, чем подростки и взрослые, распознают ошибки в словах.

26 июня
Андрей

Специалисты из Великобритании смоделировали таяние шельфовых ледников в Антарктиде и узнали, как на это влияют включения теплой морской воды. Исследователи также выяснили, что запускает необратимый процесс таяния антарктических ледников и какие из них наиболее уязвимы.

25 июня
Игорь Байдов

Ученые из Китая и Бельгии воссоздали в лаборатории условия, существовавшие на Меркурии четыре миллиарда лет назад, и выяснили, что они были идеальными для образования слоя алмазов, который с течением времени становился лишь толще.

21 июня
Nadya

Земля начала формироваться примерно 4,5 миллиарда лет назад. Чтобы понять, как это происходило в ранние периоды развития нашей планеты, ученые ищут образцы древних горных пород. Одну из таких, возрастом почти 3,5 миллиарда лет, обнаружили рядом с городом Колли в Австралии.

10 июня
Александр Березин

Исследователи из США выяснили, что примерно два миллиона лет назад Солнечная система захватила хвост облака холодного межзвездного газа. В результате гелиосфера сильно сжалась, дав галактическим лучам свободно облучать все планеты системы. Это должно было вызвать и серьезные проблемы с климатом.

[miniorange_social_login]

Комментарии

1 Комментарий
Василий Мусатов
3 недели назад
-
0
+
"писателям и поэтам пока не стоит опасаться, что ИИ полностью заменит их" С точки зрения писателей - да. Но только вот "пользователям", воспитанным на продукте нейросетей эти писатели уже будут не нужны :)
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно