06.06.2024, 09:00

БФУ

В БФУ рассказали, как цифровые технологии меняют язык

❋ 4.4

В День русского языка Татьяна Цвигун, кандидат филологических наук, советник при ректорате по вопросам русского языка и развития гуманитарного образования БФУ имени И. Канта, делится своими размышлениями о том, как развитие искусственного интеллекта и нейросетей меняет облик филологической науки.

БФУ

# лингвистика

# нейросети

# филология

# цифровизация

# цифровые технологии

# язык

Как цифровые технологии меняют язык и науку о языке / © freestocks, unsplash.com

«Цифровая лингвистика — такое словосочетание давно перестало выглядеть странным. Для современного филолога это реальность, причем довольно продуктивная, — отмечает Татьяна Цвигун. — Цифровая лингвистика и, шире, цифровая гуманитаристика активно развивается, она открывает новые возможности не только для научных исследований, но и для образовательных программ. Без тех возможностей, которые дает «цифра» ученым-гуманитариям, сегодня просто невозможно представить целый ряд самых передовых научных разработок».

Самый показательный пример — Национальный корпус русского языка, электронный онлайн-корпус текстов на русском языке, поражающий своим объемом: на настоящий момент он включает свыше двух миллиардов словоупотреблений. Это очень мощный исследовательский инструмент, основанный на системе обработки big data (больших данных), работа с ним позволяет исследователю почти моментально формировать массивы примеров из русскоязычных текстов с учетом необходимых лингвистических параметров.

Достаточно сравнить это с тем, как филолог работал с материалом еще 20-30 лет назад: просматривал тексты, составлял картотеки примеров — это был долгий и кропотливый процесс первичной обработки информации, отнимавший много времени и сил. Ведь без статистики проверка научных теорий, и в филологических исследованиях в том числе, часто невозможна. Новые технологии эту часть филологического поиска берут на себя, они дают ученому возможность быстро находить нужную информацию и в большей мере сосредоточиться на ее осмыслении, концептуализации, на проработке механизмов, которые лежат в основе тех или иных языковых явлений.

«Цифровой академик»: воображаемое или реальность?

Сможет ли искусственный интеллект заменить лингвиста, полноценно занять его место? Ответить на этот вопрос, считает Татьяна Цвигун, пока ещё довольно сложно. С одной стороны, обучаясь на реальных образцах речи, искусственный интеллект, по остроумному выражению одного из современных исследователей, «косплеит» то, с чем он работает, и можно допустить, что в какой-то момент он начнет «косплеить» и своего учителя — исследователя, который работает с большими языковыми моделями. Основа искусственного интеллекта — это своеобразная система зеркал: ИИ отзеркаливает все, с чем имеет дело. И тут встает вопрос: а с чем он будет иметь дело в ближайшем будущем?

«Вместе с тем наука, и гуманитарная в особой мере, это не только систематизация и анализ данных, но и творчество, инсайт. Способна ли нейросеть, встав на позицию исследователя, так же, как и он, креативить, проявлять научную фантазию? Пока скорее нет. Однако скорость появления и развития технологических решений настолько высока, что даже за относительно небольшое время, в которое я пытаюсь следить за тем, что происходит в нейросетях, отчетливо видно, как у нейросетей меняется речевой профиль, как возникает вербальный портрет «нейроавтора», партнера человека по творчеству», — отмечает исследователь.

Нейросети уже вовсю пишут исследовательские тексты — университетские преподаватели делятся историями, как студенты выдают нейротексты за свои курсовые или дипломные работы и даже за свои эссе — жанр, казалось бы, весьма субъективный, требующий присутствия личного тона и индивидуального взгляда. Хотя, конечно, граница перехода с нормального, «антропного» научного языка на «нейроязык» чувствуется довольно отчетливо.

Язык нейросети шаблонизирован, строится на штампах и формулах, в нем не найти того, чего мы ожидаем от хорошего научного исследования, ведь научный язык при всей его подчеркнутой строгости и стройности, тем не менее, может быть креативным. У цифрового «исследователя» всего этого пока нет, его тексты — это имитационные продукты, равно как и художественные произведения, которые создает ИИ. Но игнорировать процессы, которые происходят в технологиях «здесь и сейчас», в непосредственной близости с нами, исследователь не может и не должен. Напротив, нужно понимать этот процесс, быть внутри его, видеть, как он развивается. С этой точки зрения искусственный интеллект, нейросети и их «речевая деятельность» сами по себе становятся для лингвиста новым объектом изучения — не менее интересным, чем тот язык, на котором мы говорим друг с другом.

«Алиса, придумай сказку»

Опыт общения с голосовыми ассистентами, построенными на нейросетях, наглядно демонстрирует, что, несмотря на впечатляющие успехи в генерации текстов, современные ИИ-системы все еще далеки от того, чтобы полноценно заменить человека в творческих задачах, требующих не только знаний и следования правилам, но и эмоционального интеллекта, личного опыта и способности выходить за рамки заданных ограничений.

Очень интересный пример — голосовой помощник «Алиса», разработка компании «Яндекс». «Алиса» активно входит в наш быт, мы общаемся с ней, осознавая, что это всего лишь программный код; однако это цифровой помощник с сильно выраженной антропностью, расположенностью к человеку. До определенного момента «Алиса» обладала весьма примечательной особенностью: она была способна отвечать на запросы пользователя достаточно дерзко, иногда даже невежливо. Это разделило пользовательскую аудиторию на тех, кого это раздражало, и тех, кто усматривал в этой способности «Алисы» близость к живому человеку со своей индивидуальностью. Сейчас программисты «Яндекса» «перевоспитали» голосовой ассистент — «Алиса» стала предельно вежливой, аккуратной, коммуникабельной, но… слишком уж правильной. И этот процесс «перевоспитания» искусственного интеллекта сам по себе представляет интересный объект для исследования и осмысления.

Исследователь рассказала, как тестировала «Алису» с точки зрения создания художественных текстов. Оказалось, что вложенный в голосовой ассистент этический протокол — настройка на вежливость, тактичность, уважительное отношение к человеку — не позволяет «Алисе» порождать по-настоящему креативные тексты с элементом интриги, неожиданности, опасности. Например, если попросить ее написать страшную сказку, она создаст текст, в котором будут соответствующие жанру образы и атрибуты: мальчик, старая кукла, чудовище, зубы, когти и тому подобное.

Но если попытаться заставить «Алису» развить сюжет этически неприемлемым действием — например, убийством, — она будет этого всячески избегать, предлагать более нейтральные варианты. И получается, что «Алиса» креативит ровно до того момента, пока в тексте не возникает сильное сюжетное напряжение — она уходит от него, этический протокол не позволяет ей создать интригу за гранью запрета, тогда как «антропный» автор способен преодолевать эту грань без особого труда. Поэтому на запрос «Алиса, расскажи сказку» голосовой ассистент обязательно придумает текст добрый, светлый, радостный, но… скучный.

Этот пример показывает, что, несмотря на широкие возможности, современные ИИ-системы все еще ограничены в своей способности создавать по-настоящему креативные и эмоционально насыщенные тексты. В отличие от человека, ИИ содержит в себе «запрет на ошибку», и это лишает его возможности выходить за рамки заложенных в него правил и ограничений.

Именно поэтому, считает Татьяна Цвигун, писателям и поэтам пока не стоит опасаться, что ИИ полностью заменит их: «Нейросеть воспитывается на определенном материале, и у нее есть ограничения: она не может выдать больше того, что в нее заложено. ИИ обладает знанием, но он не может обладать сознанием». Тем не менее, эксперименты по созданию художественных произведений в соавторстве человека и ИИ, такие как проект Павла Пепперштейна «Пытаясь проснуться», показывают любопытные результаты и открывают новые горизонты для творческого взаимодействия человека и машины.

Все можно исправить

Татьяна Цвигун также затронула тему автоматического исправления ошибок в тексте, которое сегодня легко делают компьютерные программы. По ее мнению, это не должно восприниматься как что-то оскорбительное для человека.

«Не думаю, что использование такой формы цифровой помощи как-то оскорбительно действует на человека. В том мире, где мы сейчас живем, — а это очень быстрый мир, в котором приходится порождать большое количество текстов, — без такого помощника не обойтись, — считает эксперт. — Навык грамотного письма от этого вряд ли уйдет. Скорее бОльшую опасность представляет то, что уходят привычные формы графики, письма: мы видим, что современные дети плохо пишут, им легче печатать, а это значит, постепенно исчезает письменная форма языка. Существующие же автоматизированные сервисы коррекции печатного текста помогают экономить время, работать с большими объемами текстов».

Цвигун подчеркнула, что сохранять грамотность человеку помогает врожденное или привитое чувство языковой культуры, а исправление ошибок, сделанных по невнимательности, — «довольно безобидная часть нашего взаимодействия с технологическими помощниками», тем более что за корректностью таких исправлений все-таки приходится внимательно следить.

Чтобы оставаться востребованным и эффективным в своей профессии, современному филологу необходимо осваивать новые инструменты и компетенции, связанные с цифровой обработкой и анализом языковых данных. Однако, как подчеркнула Татьяна Цвигун, этот процесс не должен восприниматься как угроза самому языку.

«Язык ничто не может обеднить и испортить, разве что его забвение. Язык всегда мудрее человека, он сам себя регулирует, сам решает, что следует принять и оставить, а от чего нужно избавиться. Язык выживет после каждого из нас и будет помнить о нас. Не мы управляем языком — это язык управляет нами», — уверена исследователь. По ее словам, язык развивается естественным путем и изменение некоторых его функций — органичная часть процесса, в основе которого лежит принцип экономии речевых усилий. Этот принцип движет язык вперед, на новый этап развития, и то, что мы иногда воспринимаем как упрощение, на самом деле является рождением нового, более адаптированного к современным реалиям языка.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Балтийский федеральный университет имени Иммануила Канта – один из ведущих вузов России, расположенный в самом западном регионе страны. БФУ является крупнейшим образовательным, научным, культурным и просветительским центром Калининградской области. Университет предлагает более 180 образовательных программ и объединяет 13 высших школ и университетский колледж. В БФУ обучаются более 12 000 студентов, в том числе из 51 страны мира, и работают более 1400 сотрудников, среди которых 740 научно-педагогических кадров и 430 аспирантов. Научная деятельность БФУ охватывает 30 направлений и осуществляется 236 исследователями, средний возраст которых составляет 38 лет. Университет гордится высоким уровнем "остепененности" научных и педагогических кадров (74,8%), наличием 10 диссертационных советов и 11 научных журналов, 4 из которых индексируются в базе данных Scopus. БФУ располагает современным оборудованием на сумму более 2,6 млрд рублей и инновационным научно-технологическим парком "Фабрика". В настоящее время университет реализует амбициозный проект создания кампуса мирового уровня на территории 29 га, где будут размещены новые учебно-лабораторные корпуса и общежития на 2500 мест. Завершение строительства запланировано на сентябрь 2025 года.

БФУ

# лингвистика

# нейросети

# филология

# цифровизация

# цифровые технологии

# язык

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Как выбрать лучший оффер и не уйти в монастырь

Центр «Архэ»

Онлайн

Экскурсия

17 Авг

Бесплатно

Тайны небесных светил

Космонавтика и авиация

Москва

Лекция

17 Авг

700 ₽

Личная система самообмана

Зануда

Санкт-Петербург

Лекция

18 Авг

600 ₽

Как батониться по гари, чтобы не засилили

Центр «Архэ»

Онлайн

Библиотека им. Н. А. Некрасова

Москва

Лекция

19 Авг

Бесплатно

Архитектурные утопии XX века

Библиотека им. М. Ю. Лермонтова

Санкт-Петербург

Лекция

19 Авг

Бесплатно

Русские мифы: как и зачем их исследуют ученые?

Альпина нон-фикшн

Москва

Библиотека им. М. Ю. Лермонтова

Санкт-Петербург

Лекция

20 Авг

Бесплатно

Русское зарубежье и советские граждане в Движении Сопротивления

Библиотека иностранной литературы

Москва

Популярное

За сутки

За неделю

За месяц

16 августа, 19:09

Адель Романова

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Астрономы подсчитали, что с поверхности летящего по Солнечной системе межзвездного объекта 3I/ATLAS каждую секунду испаряется около 40 килограммов водяного льда. Такую сильную кометную активность он проявил, будучи в три с половиной раза дальше Земли от Солнца. По мнению ученых, это довольно необычно.

Астрономия

# кометы

# космос

# межзвездная комета

# межзвездные объекты

# Солнечная система

16 августа, 11:58

Александр Березин

Нетронутые липиды позволят марсоходам найти жизнь уже существующими инструментами

Новый подход к быстрому поиску жизни может однозначно обнаруживать ее всего одним инструментом. Он уже есть на борту обоих действующих американских марсоходов. Правда, NASA может не захотеть воспользоваться этой возможностью.

Космонавтика

# внеземная жизнь

# космонавтика

# марс

17 августа, 11:56

Любовь С.

Нейробиологи раскрыли, как мозг объединяет сенсорные сигналы зрения и слуха для принятия решений

Чтобы понять, как именно мозг объединяет разные сенсорные сигналы, ученые проверили реакцию добровольцев на простые визуальные и слуховые стимулы, отслеживая изменения в движении точек на экране и в звуковых сигналах с помощью ЭЭГ. Результаты показали, что за обработку информации ответственны разные процессы, которые «сходятся» в едином механизме в решающий момент.

Биология

# зрение

# компьютерное моделирование

# мозг

# нейроны

# слух

# ЭЭГ

16 августа, 19:09

Адель Романова

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Астрономия

# кометы

# космос

# межзвездная комета

# межзвездные объекты

# Солнечная система

16 августа, 11:58

Александр Березин

Нетронутые липиды позволят марсоходам найти жизнь уже существующими инструментами

Космонавтика

# внеземная жизнь

# космонавтика

# марс

12 августа, 11:29

Юлия Трепалина

Психологи узнали, в каких парах любовь сильнее — у нашедших друг друга онлайн или в жизни

Влияет ли формат знакомства на качество последующих романтических отношений в паре? Научные данные на этот счет разнятся. Новое исследование по вопросу представила группа психологов из Польши, Австралии и Великобритании. В попытке понять, при каком сценарии удовлетворенность отношениями выше, а любовь крепче — когда двое нашли друг друга в Сети или познакомились в жизни, — ученые опросили свыше 6000 тысяч человек из разных стран.

Психология

# знакомство

# интернет

# любовь

# онлайн-знакомство

# романтические отношения

# удовлетворенность отношениями

25 июля, 07:47

Адель Романова

У третьего межзвездного объекта нашли признаки управляемого корабля

Прибывшая из межзвездного пространства предполагаемая комета 3I/ATLAS движется по траектории, максимально удобной для гравитационных маневров управляемого корабля, при этом возможность ее отслеживания с Земли практически минимальна. По мнению некоторых ученых, такое «поведение» объекта наводит на определенные мысли.

Астрономия

# внеземные цивилизации

# космос

# межзвездная комета

# межзвездные зонды

# межзвездные объекты

6 августа, 20:59

Татьяна Пичугина

Ученые добыли новые доказательства столкновения с кометой 12 800 лет назад

Примерно 12 800 лет назад в Северном полушарии началось резкое изменение климата, которое сопровождалось вымиранием мегафауны и угасанием культуры Кловис. Такое могло произойти, например, из-за прорыва пресных вод в Атлантику или мощного вулканического извержения. Несколько лет назад ученые обнаружили места на суше с повышенным содержанием элементов платиновой группы, прослоями угля, микрочастицами расплава. По их мнению, это может быть признаком пребывания Земли в потоке обломков кометы или астероида. В новой работе впервые представлены доказательства кометного события в позднем дриасе из морских осадочных толщ.

Геология

# Атлантический океан

# комета

# морское дно

# платина

# событие позднего дриаса

22 июля, 14:44

ФизТех

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

Команда исследователей из Сколтеха, МФТИ, Института искусственного интеллекта AIRI и других научных центров разработала метод, позволяющий не просто отличать тексты, написанные человеком, от сгенерированных нейросетью, но и понимать, по каким именно признакам классификатор принимает решение о том, является ли текст генерацией или нет. Анализируя внутренние состояния глубоких слоев языковой модели, ученые смогли выделить и интерпретировать численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.

ФизТех

# ChatGPT

# нейросети

# ошибки

# слова

# текст

[miniorange_social_login]

"писателям и поэтам пока не стоит опасаться, что ИИ полностью заменит их" С точки зрения писателей - да. Но только вот "пользователям", воспитанным на продукте нейросетей эти писатели уже будут не нужны :)

Ответить

Василий Мусатов

10.06.2024

Ответить

В БФУ рассказали, как цифровые технологии меняют язык

«Цифровой академик»: воображаемое или реальность?

«Алиса, придумай сказку»

Все можно исправить

По теме

Письма Джека Потрошителя назвали подделкой журналистов

Эволюцию диалектов объяснило поверхностное натяжение

Ученые: знание родного языка сохраняется даже у тех, кто никогда на нем не говорил

Популярное

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Нетронутые липиды позволят марсоходам найти жизнь уже существующими инструментами

Нейробиологи раскрыли, как мозг объединяет сенсорные сигналы зрения и слуха для принятия решений

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Нетронутые липиды позволят марсоходам найти жизнь уже существующими инструментами

Психологи узнали, в каких парах любовь сильнее — у нашедших друг друга онлайн или в жизни

У третьего межзвездного объекта нашли признаки управляемого корабля

Ученые добыли новые доказательства столкновения с кометой 12 800 лет назад

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

История Земли за полчаса

Портрет воина

Самые запретные места на планете

Нейрообразование: от термина до рынка

Альберт Эйнштейн и его уникальное наследие

Распознающие хвори: как компьютерное зрение и экспертные системы помогают врачам

Российская вакцина от коронавируса: опасна для введения или еще одна антивакцинаторская истерия?

Как политкорректность убивает главный лес планеты — и почему СМИ делают вид, что ничего не замечают

В БФУ рассказали, как цифровые технологии меняют язык

«Цифровой академик»: воображаемое или реальность?

«Алиса, придумай сказку»

Все можно исправить

По теме

Письма Джека Потрошителя назвали подделкой журналистов

Эволюцию диалектов объяснило поверхностное натяжение

Ученые: знание родного языка сохраняется даже у тех, кто никогда на нем не говорил

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Хотите
вести колонку
в нашем
издании?