Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
В БФУ рассказали, как цифровые технологии меняют язык
В День русского языка Татьяна Цвигун, кандидат филологических наук, советник при ректорате по вопросам русского языка и развития гуманитарного образования БФУ имени И. Канта, делится своими размышлениями о том, как развитие искусственного интеллекта и нейросетей меняет облик филологической науки.
«Цифровая лингвистика — такое словосочетание давно перестало выглядеть странным. Для современного филолога это реальность, причем довольно продуктивная, — отмечает Татьяна Цвигун. — Цифровая лингвистика и, шире, цифровая гуманитаристика активно развивается, она открывает новые возможности не только для научных исследований, но и для образовательных программ. Без тех возможностей, которые дает «цифра» ученым-гуманитариям, сегодня просто невозможно представить целый ряд самых передовых научных разработок».
Самый показательный пример — Национальный корпус русского языка, электронный онлайн-корпус текстов на русском языке, поражающий своим объемом: на настоящий момент он включает свыше двух миллиардов словоупотреблений. Это очень мощный исследовательский инструмент, основанный на системе обработки big data (больших данных), работа с ним позволяет исследователю почти моментально формировать массивы примеров из русскоязычных текстов с учетом необходимых лингвистических параметров.
Достаточно сравнить это с тем, как филолог работал с материалом еще 20-30 лет назад: просматривал тексты, составлял картотеки примеров — это был долгий и кропотливый процесс первичной обработки информации, отнимавший много времени и сил. Ведь без статистики проверка научных теорий, и в филологических исследованиях в том числе, часто невозможна. Новые технологии эту часть филологического поиска берут на себя, они дают ученому возможность быстро находить нужную информацию и в большей мере сосредоточиться на ее осмыслении, концептуализации, на проработке механизмов, которые лежат в основе тех или иных языковых явлений.
«Цифровой академик»: воображаемое или реальность?
Сможет ли искусственный интеллект заменить лингвиста, полноценно занять его место? Ответить на этот вопрос, считает Татьяна Цвигун, пока ещё довольно сложно. С одной стороны, обучаясь на реальных образцах речи, искусственный интеллект, по остроумному выражению одного из современных исследователей, «косплеит» то, с чем он работает, и можно допустить, что в какой-то момент он начнет «косплеить» и своего учителя — исследователя, который работает с большими языковыми моделями. Основа искусственного интеллекта — это своеобразная система зеркал: ИИ отзеркаливает все, с чем имеет дело. И тут встает вопрос: а с чем он будет иметь дело в ближайшем будущем?
«Вместе с тем наука, и гуманитарная в особой мере, это не только систематизация и анализ данных, но и творчество, инсайт. Способна ли нейросеть, встав на позицию исследователя, так же, как и он, креативить, проявлять научную фантазию? Пока скорее нет. Однако скорость появления и развития технологических решений настолько высока, что даже за относительно небольшое время, в которое я пытаюсь следить за тем, что происходит в нейросетях, отчетливо видно, как у нейросетей меняется речевой профиль, как возникает вербальный портрет «нейроавтора», партнера человека по творчеству», — отмечает исследователь.
Нейросети уже вовсю пишут исследовательские тексты — университетские преподаватели делятся историями, как студенты выдают нейротексты за свои курсовые или дипломные работы и даже за свои эссе — жанр, казалось бы, весьма субъективный, требующий присутствия личного тона и индивидуального взгляда. Хотя, конечно, граница перехода с нормального, «антропного» научного языка на «нейроязык» чувствуется довольно отчетливо.
Язык нейросети шаблонизирован, строится на штампах и формулах, в нем не найти того, чего мы ожидаем от хорошего научного исследования, ведь научный язык при всей его подчеркнутой строгости и стройности, тем не менее, может быть креативным. У цифрового «исследователя» всего этого пока нет, его тексты — это имитационные продукты, равно как и художественные произведения, которые создает ИИ. Но игнорировать процессы, которые происходят в технологиях «здесь и сейчас», в непосредственной близости с нами, исследователь не может и не должен. Напротив, нужно понимать этот процесс, быть внутри его, видеть, как он развивается. С этой точки зрения искусственный интеллект, нейросети и их «речевая деятельность» сами по себе становятся для лингвиста новым объектом изучения — не менее интересным, чем тот язык, на котором мы говорим друг с другом.
«Алиса, придумай сказку»
Опыт общения с голосовыми ассистентами, построенными на нейросетях, наглядно демонстрирует, что, несмотря на впечатляющие успехи в генерации текстов, современные ИИ-системы все еще далеки от того, чтобы полноценно заменить человека в творческих задачах, требующих не только знаний и следования правилам, но и эмоционального интеллекта, личного опыта и способности выходить за рамки заданных ограничений.
Очень интересный пример — голосовой помощник «Алиса», разработка компании «Яндекс». «Алиса» активно входит в наш быт, мы общаемся с ней, осознавая, что это всего лишь программный код; однако это цифровой помощник с сильно выраженной антропностью, расположенностью к человеку. До определенного момента «Алиса» обладала весьма примечательной особенностью: она была способна отвечать на запросы пользователя достаточно дерзко, иногда даже невежливо. Это разделило пользовательскую аудиторию на тех, кого это раздражало, и тех, кто усматривал в этой способности «Алисы» близость к живому человеку со своей индивидуальностью. Сейчас программисты «Яндекса» «перевоспитали» голосовой ассистент — «Алиса» стала предельно вежливой, аккуратной, коммуникабельной, но… слишком уж правильной. И этот процесс «перевоспитания» искусственного интеллекта сам по себе представляет интересный объект для исследования и осмысления.
Исследователь рассказала, как тестировала «Алису» с точки зрения создания художественных текстов. Оказалось, что вложенный в голосовой ассистент этический протокол — настройка на вежливость, тактичность, уважительное отношение к человеку — не позволяет «Алисе» порождать по-настоящему креативные тексты с элементом интриги, неожиданности, опасности. Например, если попросить ее написать страшную сказку, она создаст текст, в котором будут соответствующие жанру образы и атрибуты: мальчик, старая кукла, чудовище, зубы, когти и тому подобное.
Но если попытаться заставить «Алису» развить сюжет этически неприемлемым действием — например, убийством, — она будет этого всячески избегать, предлагать более нейтральные варианты. И получается, что «Алиса» креативит ровно до того момента, пока в тексте не возникает сильное сюжетное напряжение — она уходит от него, этический протокол не позволяет ей создать интригу за гранью запрета, тогда как «антропный» автор способен преодолевать эту грань без особого труда. Поэтому на запрос «Алиса, расскажи сказку» голосовой ассистент обязательно придумает текст добрый, светлый, радостный, но… скучный.
Этот пример показывает, что, несмотря на широкие возможности, современные ИИ-системы все еще ограничены в своей способности создавать по-настоящему креативные и эмоционально насыщенные тексты. В отличие от человека, ИИ содержит в себе «запрет на ошибку», и это лишает его возможности выходить за рамки заложенных в него правил и ограничений.
Именно поэтому, считает Татьяна Цвигун, писателям и поэтам пока не стоит опасаться, что ИИ полностью заменит их: «Нейросеть воспитывается на определенном материале, и у нее есть ограничения: она не может выдать больше того, что в нее заложено. ИИ обладает знанием, но он не может обладать сознанием». Тем не менее, эксперименты по созданию художественных произведений в соавторстве человека и ИИ, такие как проект Павла Пепперштейна «Пытаясь проснуться», показывают любопытные результаты и открывают новые горизонты для творческого взаимодействия человека и машины.
Все можно исправить
Татьяна Цвигун также затронула тему автоматического исправления ошибок в тексте, которое сегодня легко делают компьютерные программы. По ее мнению, это не должно восприниматься как что-то оскорбительное для человека.
«Не думаю, что использование такой формы цифровой помощи как-то оскорбительно действует на человека. В том мире, где мы сейчас живем, — а это очень быстрый мир, в котором приходится порождать большое количество текстов, — без такого помощника не обойтись, — считает эксперт. — Навык грамотного письма от этого вряд ли уйдет. Скорее бОльшую опасность представляет то, что уходят привычные формы графики, письма: мы видим, что современные дети плохо пишут, им легче печатать, а это значит, постепенно исчезает письменная форма языка. Существующие же автоматизированные сервисы коррекции печатного текста помогают экономить время, работать с большими объемами текстов».
Цвигун подчеркнула, что сохранять грамотность человеку помогает врожденное или привитое чувство языковой культуры, а исправление ошибок, сделанных по невнимательности, — «довольно безобидная часть нашего взаимодействия с технологическими помощниками», тем более что за корректностью таких исправлений все-таки приходится внимательно следить.
Чтобы оставаться востребованным и эффективным в своей профессии, современному филологу необходимо осваивать новые инструменты и компетенции, связанные с цифровой обработкой и анализом языковых данных. Однако, как подчеркнула Татьяна Цвигун, этот процесс не должен восприниматься как угроза самому языку.
«Язык ничто не может обеднить и испортить, разве что его забвение. Язык всегда мудрее человека, он сам себя регулирует, сам решает, что следует принять и оставить, а от чего нужно избавиться. Язык выживет после каждого из нас и будет помнить о нас. Не мы управляем языком — это язык управляет нами», — уверена исследователь. По ее словам, язык развивается естественным путем и изменение некоторых его функций — органичная часть процесса, в основе которого лежит принцип экономии речевых усилий. Этот принцип движет язык вперед, на новый этап развития, и то, что мы иногда воспринимаем как упрощение, на самом деле является рождением нового, более адаптированного к современным реалиям языка.
Нарастающий в последние десятки лет пластиковый кризис многие годы пытались решить наращиванием вторичной переработки пластика. Ученые выяснили, что такие переработанные полимеры негативно повлияли на развитие подопытных животных.
В последнее время в некоторых развитых странах наблюдается тенденция к тому, что женщины предпочитают рожать первого ребенка в возрасте 40 лет и старше. Но счастье материнства, как показали авторы новой научной работы, могут омрачить тревожные последствия. Исследователи из Швеции изучили историю нескольких сотен тысяч родов и рассказали о рисках для здоровья малышей, появившихся на свет у женщин в позднем возрасте.
Боеголовки, размещенные на орбите, наносят удар быстро и по любой точке Земли — широко расхожая и в корне неверная картина. О планах космического базирования боеголовок пишут СМИ и спорят в интернете. Однако их размещение на орбите не дает боевых преимуществ: напротив, оно намного проигрывает МБР в эффективности. Разберемся, почему это так.
Выбросы углекислого газа, которые возникнут при сжигании доказанных запасов ископаемого топлива всего 200 компаний, будут настолько велики, что для их компенсации нужны новые леса в десятки миллионов квадратных километров. По крайней мере, так считают авторы новой научной работы. Однако исследование их предшественников ставит эти выводы под серьезное сомнение.
Исследователи из Новой Зеландии посчитали угрозу для озонового слоя при достижении землянами хотя бы пары тысяч ракетных запусков в год. По их расчетам, он должен начать существенно деградировать. Интересно, что Илон Маск планирует несколько тысяч запусков ежегодно, то есть даже больше. Несмотря на это, некоторые проблемы в работе делают ее выводы далеко не бесспорными.
Нарастающий в последние десятки лет пластиковый кризис многие годы пытались решить наращиванием вторичной переработки пластика. Ученые выяснили, что такие переработанные полимеры негативно повлияли на развитие подопытных животных.
Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.
Вид антилоп, с ледникового периода привыкший к массовым миграциям, пытается вернуться в свой исторический ареал, когда-то достигавший Днепра. Однако их нетипичные для травоядных привычки вызывают сильнейшее отторжение у сельских жителей, предлагающих массово уничтожать их с воздуха. С экологической точки зрения возвращение этих животных весьма желательно, но как примирить их с фермерами — неясно.
В ЮФУ придумали новый остроумный способ тестировать ИИ на способность работать в реальных ситуациях использования русского языка. Исследователи искусственного интеллекта из МИИ ИМ ЮФУ предлагают использовать интеллектуальные языковые игры, как пример — заставлять ИИ отвечать на вопросы из архива телевикторины «Что? Где? Когда?» и «Своей игры». Инициативу прокомментировал опытный игрок.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
ПонятноИз-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
ПонятноНаши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
ПонятноМы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Комментарии