16 июля, 12:16

Александр Березин

Нейросети замедлили работу программистов, а не помогли ускорить ее

❋ 4.9

Даже опытные программисты считали, что использование нейросети для написания кода экономит им время. Однако, когда исследователи проверили это на задачах из реального мира, выяснилось, что разработчики ошибаются. В действительности применение ИИ увеличило время, необходимое для реализации проектов.

Технологии

# искусственный интеллект

# нейросети

# программирование

Изменения во времени работы над ПО-проектом при использовании ИИ разошлись с прогнозами. То, что ожидали экономисты, описывающие прогресс ИИ находится слева, прогнозы специалистов по машинном обучению правее, еще правее можно видеть оценки самих разработчиков, участвовавших в эксперименте, сначала перед выполнением работы, а потом и после нее. Красным справа показаны реальные результаты / © METR

В нашу эпоху ИИ чаще всего называют «нейросети». Хотя Naked Science отмечал, что в действительности слово «интеллект» в названии таких ИИ не отражает реального положения вещей и что такие системы на самом деле «китайские комнаты», общий энтузиазм по поводу их возможностей привел к широкому использованию таких систем в написании кода. Причем большинство специальных тестов (бенчмарков) уже некоторое время показывают, что это экономит время разработчиков.

Исследователи из некоммерческой исследовательской организации Model Evaluation & Threat Research решили выяснить, так ли это в случае реальных задач, а не специально сконструированных бенчмарков. Для этого к эксперименту привлекли 16 разработчиков программного обеспечения для опенсорсных репозиториев. Такие репозитории требуют регулярного поддержания: исправления багов, внедрения новых черт и так далее.

Затем исследователи поручили половину из 246 таких задач выполнять с помощью специализированных нейросетей-кодеров: Cursor Pro или Claude 3.5/3.7 Sonnet от Anthropic. Хотя они не так на слуху, как ChatGPT, в мире программистов эти системы оценивают достаточно высоко, разработчики исходно «затачивали» их во многом под написание кода. Другая половина задач выполнялась без привлечения таких систем.

Перед тем как разделить задачи, для них сделали прогноз времени, нужного для выполнения. Что важно, время по обработке запросов на включение тех или иных изменений из ветки разрабатываемого ПО в основную ветку ПО (уже стабильно работающую) было включено в общую оценку времени на разработку.

Перед работой программистов попросили оценить, насколько сократится время на выполнение задач из-за использования ИИ. Средняя оценка была 24%. После выполнения задачи разработчики изменили ее: по их мнению, его использование снизило время на выполнение задач только на 20%.

А вот исследователи, отслеживавшие реальные траты времени с помощью записи происходящего на экранах разработчиков, выявили совсем другие показатели. При использовании нейросетей они выполняли задачи на 19% медленнее, чем это делалось при программировании «вручную». Авторы научной работы, опубликованной на сервере препринтов Корнеллского университета, начали искать объяснение столь неожиданному итогу.

В частности, они отметили, что участвовавшие в исследовании программисты работали с этими репозиториями пять лет. За это время они хорошо узнали их структуру и характерные проблемы. ИИ, напротив, особенностей работы этих репозиториев не знали. Кроме того, ответственность при работе с такими репозиториями очень велика, поскольку любая ошибка будет иметь длительные последствия, часто неприятные для программиста. И если в разработке коммерческого ПО иной раз можно скрыть свою недоработку, списав на чужие ошибки, то в разработке открытого программного обеспечения принят подход серьезной личной ответственности — это заставляет программистов тщательнее выверять, что они выпускают.

Затраты времени по типам задач. Фиолетовым показана ситуация для группы, которой запретили пользоваться ИИ, зеленым даны затраты тех, кто использовал ИИ.

И все же основной причиной медленного выполнения задач с помощью нейросетей были их реальные проблемы, а не особенности эксперимента. Анализ экранного времени показал, что хотя время на, собственно, написания кода, отладку/дебаггинг или чтение и поиск информации у разработчиков упало, другие времязатраты это более чем компенсировали. Сначала разработчикам пришлось долго вычитывать написанный ИИ код, затем предлагать ИИ поправить найденные ошибки, затем ждать, пока все это происходит.

Выросло также время, когда на экране ничего не происходило: то есть программисты в период работы с нейросетью меньшую долю времени активно трудились. Без каких-либо правок оказалось возможным задействовать только 44% кода, написанного ИИ, и 9% всего времени разработчиков ушло на внесение в этот код изменений, с которыми он бы заработал нормально.

То, что новое исследование противоречит бенчмаркам, неудивительно: те очень часто измеряют продуктивность в количествах строк кода или же по небольшим, дискретным задачам, законченным в тот или иной промежуток времени. Между тем в работе над реальными проектами много времени занимают и другие процессы: тщательная (в отличие от экспериментов) проверка адекватности кода при самых неожиданных ситуациях, а также интеграция частных «кусков» процесса разработки в единое целое.

Авторы статьи предположили, что уже в скором времени нейросети смогут спрогрессировать достаточно, чтобы не замедлять работу программистов. Но так это или нет, определенно покажет только будущее. То, что сами программисты, участвовавшие в эксперименте, даже по его окончании не могли понять, что ИИ замедлил их, а не ускорил, говорит: оценить ситуацию объективно непросто. Всеобщий энтузиазм по поводу нейросетей, по всей видимости, заставляет многих систематически переоценивать возможности этих помощников.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Заместитель главного редактора Naked Science. Автор специализируется на популяризации в области истории, космологии, астрономии, медицины, климата, макроэкономики и техники. Лауреат премии «Научный журналист года-2021».

Технологии

# искусственный интеллект

# нейросети

# программирование

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Дальневосточная одиссея Владимира Арсеньева

Российская государственная библиотека

Москва

Лекция

16 Июл

Бесплатно

Квантовая физика в стаканчике кофе

Парк Горького

Москва

Лекция

17 Июл

Бесплатно

Где учат полярных исследователей?

Российская государственная библиотека

Москва

Лекция

17 Июл

Бесплатно

Нейробиологические основы депрессии

Парк «Зарядье»

Москва

Лекция

17 Июл

Бесплатно

Изыскатели железнодорожных и морских путей Африки

Библиотека иностранной литературы

Москва

Лекция

17 Июл

Бесплатно

Архетипы в африканских мифах

Библиотека иностранной литературы

Москва

Лекция

17 Июл

Бесплатно

Липидная карта депрессивного мозга

Курилка Гутенберга

Москва

Лекция

18 Июл

Бесплатно

Культура и традиции Замбии

Библиотека иностранной литературы

Москва

Лекция

18 Июл

Бесплатно

Восточные сокровища Лазаревского института в Москве

Российская государственная библиотека

Москва

Популярное

За сутки

За неделю

За месяц

15 июля, 13:19

Юлия Тарасова

На чемоданах нашли в десятки раз больше бактерий, чем на унитазах

Чемоданы оказались настоящими рассадниками микробов. Как выяснилось, на отдельных частях дорожных сумок может обитать в 58 раз больше бактерий, чем на сиденьях унитазов в общественном туалете.

Медицина

# бактерии

# гигиена

# микробы

# унитаз

# чемодан

15 июля, 12:45

ПНИПУ

Российские ученые заставили рацию работать без помех

В условиях отсутствия связи (шахты, горы, тайга) критически важна надежная передача данных. Ученые Пермского Политеха разработали цифровую радиостанцию, устойчивую к помехам и физическим препятствиям, включая бетонные стены. Устройство передает данные в двух сетях MANET одновременно, обеспечивая скорость до 300 кбит/с (низкоскоростной канал) и 54 Мбит/с (высокоскоростной). Рация работает как ретранслятор и узел сети, что делает ее незаменимой для спасателей, промышленности и туристов. Ключевые преимущества разработки: помехоустойчивость, дальность связи до 30 километров и работа при -25°C до +55 градусов Цельсия.

ПНИПУ

# МЧС

# помехи

# радиостанция

# Туризм

16 июля, 10:28

Адель Романова

На Титане оказалось возможным образование протоклеток

По мнению ученых, наблюдаемые в атмосфере спутника Сатурна Титана сложные органические молекулы могут соединяться в подобия внутриклеточных органелл — везикул. Более того, в дальнейшем эти структуры способны становиться еще более сложными и образовывать не что иное, как протоклетки.

Астрономия

# абиогенез

# внеземная жизнь

# космос

# метановые озера

# протоклетка

# титан

# толины

12 июля, 22:10

Редакция Naked Science

Научно-фантастические сериалы лета, на которые стоит обратить внимание

Лето 2025 обещает насыщенную линейку научно-фантастических сериалов на ведущих стриминговых платформах. От адаптаций культовых романов до масштабных космических одиссей — мы отобрали проекты, на которые стоит обратить внимание.

Sci-Fi

# «Звездный путь»

# научная фантастика

# сериалы

11 июля, 17:47

Денис Яковлев

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Международная команда ученых оценила связь между длительностью физической активности, ее интенсивностью, риском смерти от всех причин и вероятностью развития сердечно-сосудистых и онкологических заболеваний.

Медицина

# ЗОЖ

# онкологические заболевания

# сердечно-сосудистые болезни

# смертность

# спорт

15 июля, 11:00

НИУ ВШЭ

ИИ определил родство точнее, чем тесты ДНК

В Институте искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ предложили новый подход, основанный на современных методах машинного обучения, для определения генетического происхождения человека. Графовые нейросети позволяют с высокой точностью различать даже очень близкие популяции.

НИУ ВШЭ

# ДНК

# мутации

# народы

# родственники

17 июня, 16:49

Адель Романова

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

Астрономия

# космический мусор

# космос

# радиосигналы

# спутники

25 июня, 15:19

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

2 июля, 11:17

Юлия Тарасова

Коров покормили отходами конопли и проверили их молоко на психоактивность

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Биология

# животноводство

# конопля

# корм

# коровы

# молоко

# ТГК

# тетрагидроканнабинол

[miniorange_social_login]

Я без знания программирования с Copilot Pro в VS написал полностью рабочее веб-приложение, которое приносит деньги, фронтэнд, бэкэнд и всю логику, включая защиту. Плюс боты для него. Это заняло у меня полтора месяца и стоило 20$. Закажи я разработку этого приложения у людей, я бы им только объяснял месяц, что мне нужно, и стоило бы это от 1500 до 2500$ минимум. К слову, на Kworke вообще отказывались делать некоторые боты. С ИИ таких проблем нет. Хотите вы или не хотите, но ИИ меняет индустрию и мир.

Ответить

—

Александр Березин

2 часа назад

Dwight, да-да, "через 20 лет везде будет один телевизор. Конечно. Разве могут быть сомнения.

Ответить

Stanislav Vlasov

5 часов назад

Ничего удивительного — LLM обычный инструмент, которым надо научиться пользоваться для полной эффективности. В частности, уметь не использовать там, где не надо.

Ответить

Stanislav Vlasov

5 часов назад

Ответить

Dwight Gerhardt

5 часов назад

Ответить

—

Александр Березин

2 часа назад

Dwight, да-да, "через 20 лет везде будет один телевизор. Конечно. Разве могут быть сомнения.

Ответить

Нейросети замедлили работу программистов, а не помогли ускорить ее

По теме

Искусственный интеллект поможет точнее прогнозировать риски сложных заболеваний

За последние пять лет ИИ стал на девять процентов точнее выявлять рак кожи

Большие данные, нейроны и психология: какие технологии искусственного интеллекта разрабатывают российские ученые в Национальном центре физики и математики

Популярное

Комментарии

Последние новости:

Астрономы впервые увидели формирование крупиц минералов будущих планет

Слабоалкогольные напитки облегчили эволюцию сложных обществ

Популярные энергетики могут способствовать развитию рака крови

Формат изучения русского языка изменился из-за мемов

Полет фантазии: заменит ли орбитальное базирование боеголовок современные МБР?

«Отвратительная тайна эволюции»: что стало известно о самом древнем цветке

Иран и Израиль — дойдет ли дело до ядерного оружия?

Трамп и Маск разругались: сорвет ли это высадку на Луну и как отразится на России?

Последние комментарии

Самые обсуждаемые

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

«Возродившая лютоволка» компания решила воскресить птицу моа

Гравитационный телескоп впервые зарегистрировал слияние черных дыр промежуточных масс

Научно-фантастические сериалы лета, на которые стоит обратить внимание