16 июля, 12:16

Александр Березин

Нейросети замедлили работу программистов, а не помогли ускорить ее

❋ 4.9

Даже опытные программисты считали, что использование нейросети для написания кода экономит им время. Однако, когда исследователи проверили это на задачах из реального мира, выяснилось, что разработчики ошибаются. В действительности применение ИИ увеличило время, необходимое для реализации проектов.

Технологии

# искусственный интеллект

# нейросети

# программирование

Изменения во времени работы над ПО-проектом при использовании ИИ разошлись с прогнозами. То, что ожидали экономисты, описывающие прогресс ИИ находится слева, прогнозы специалистов по машинном обучению правее, еще правее можно видеть оценки самих разработчиков, участвовавших в эксперименте, сначала перед выполнением работы, а потом и после нее. Красным справа показаны реальные результаты / © METR

В нашу эпоху ИИ чаще всего называют «нейросети». Хотя Naked Science отмечал, что в действительности слово «интеллект» в названии таких ИИ не отражает реального положения вещей и что такие системы на самом деле «китайские комнаты», общий энтузиазм по поводу их возможностей привел к широкому использованию таких систем в написании кода. Причем большинство специальных тестов (бенчмарков) уже некоторое время показывают, что это экономит время разработчиков.

Исследователи из некоммерческой исследовательской организации Model Evaluation & Threat Research решили выяснить, так ли это в случае реальных задач, а не специально сконструированных бенчмарков. Для этого к эксперименту привлекли 16 разработчиков программного обеспечения для опенсорсных репозиториев. Такие репозитории требуют регулярного поддержания: исправления багов, внедрения новых черт и так далее.

Затем исследователи поручили половину из 246 таких задач выполнять с помощью специализированных нейросетей-кодеров: Cursor Pro или Claude 3.5/3.7 Sonnet от Anthropic. Хотя они не так на слуху, как ChatGPT, в мире программистов эти системы оценивают достаточно высоко, разработчики исходно «затачивали» их во многом под написание кода. Другая половина задач выполнялась без привлечения таких систем.

Перед тем как разделить задачи, для них сделали прогноз времени, нужного для выполнения. Что важно, время по обработке запросов на включение тех или иных изменений из ветки разрабатываемого ПО в основную ветку ПО (уже стабильно работающую) было включено в общую оценку времени на разработку.

Перед работой программистов попросили оценить, насколько сократится время на выполнение задач из-за использования ИИ. Средняя оценка была 24%. После выполнения задачи разработчики изменили ее: по их мнению, его использование снизило время на выполнение задач только на 20%.

А вот исследователи, отслеживавшие реальные траты времени с помощью записи происходящего на экранах разработчиков, выявили совсем другие показатели. При использовании нейросетей они выполняли задачи на 19% медленнее, чем это делалось при программировании «вручную». Авторы научной работы, опубликованной на сервере препринтов Корнеллского университета, начали искать объяснение столь неожиданному итогу.

В частности, они отметили, что участвовавшие в исследовании программисты работали с этими репозиториями пять лет. За это время они хорошо узнали их структуру и характерные проблемы. ИИ, напротив, особенностей работы этих репозиториев не знали. Кроме того, ответственность при работе с такими репозиториями очень велика, поскольку любая ошибка будет иметь длительные последствия, часто неприятные для программиста. И если в разработке коммерческого ПО иной раз можно скрыть свою недоработку, списав на чужие ошибки, то в разработке открытого программного обеспечения принят подход серьезной личной ответственности — это заставляет программистов тщательнее выверять, что они выпускают.

Затраты времени по типам задач. Фиолетовым показана ситуация для группы, которой запретили пользоваться ИИ, зеленым даны затраты тех, кто использовал ИИ.

И все же основной причиной медленного выполнения задач с помощью нейросетей были их реальные проблемы, а не особенности эксперимента. Анализ экранного времени показал, что хотя время на, собственно, написания кода, отладку/дебаггинг или чтение и поиск информации у разработчиков упало, другие времязатраты это более чем компенсировали. Сначала разработчикам пришлось долго вычитывать написанный ИИ код, затем предлагать ИИ поправить найденные ошибки, затем ждать, пока все это происходит.

Выросло также время, когда на экране ничего не происходило: то есть программисты в период работы с нейросетью меньшую долю времени активно трудились. Без каких-либо правок оказалось возможным задействовать только 44% кода, написанного ИИ, и 9% всего времени разработчиков ушло на внесение в этот код изменений, с которыми он бы заработал нормально.

То, что новое исследование противоречит бенчмаркам, неудивительно: те очень часто измеряют продуктивность в количествах строк кода или же по небольшим, дискретным задачам, законченным в тот или иной промежуток времени. Между тем в работе над реальными проектами много времени занимают и другие процессы: тщательная (в отличие от экспериментов) проверка адекватности кода при самых неожиданных ситуациях, а также интеграция частных «кусков» процесса разработки в единое целое.

Авторы статьи предположили, что уже в скором времени нейросети смогут спрогрессировать достаточно, чтобы не замедлять работу программистов. Но так это или нет, определенно покажет только будущее. То, что сами программисты, участвовавшие в эксперименте, даже по его окончании не могли понять, что ИИ замедлил их, а не ускорил, говорит: оценить ситуацию объективно непросто. Всеобщий энтузиазм по поводу нейросетей, по всей видимости, заставляет многих систематически переоценивать возможности этих помощников.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Заместитель главного редактора Naked Science. Автор специализируется на популяризации в области истории, космологии, астрономии, медицины, климата, макроэкономики и техники. Лауреат премии «Научный журналист года-2021».

Технологии

# искусственный интеллект

# нейросети

# программирование

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Что такое природный газ? В каком виде газ находится под землей?

Русское географическое общество

Москва

Лекция

18 Июл

Бесплатно

Культура и традиции Замбии

Библиотека иностранной литературы

Москва

Лекция

18 Июл

Бесплатно

Восточные сокровища Лазаревского института в Москве

Российская государственная библиотека

Москва

Лекция

18 Июл

700 ₽

Биобезобразие. Куда исчезли пчелы и воробьи?

Ельцин Центр

Екатеринбург

Лекция

18 Июл

1100 ₽

Античные юмористы или над чем смеялись в Древнем Риме

Medio Modo

Москва

Лекция

18 Июл

Бесплатно

Роль музыки и танца в культуре Древнего Египта

Библиотека иностранной литературы

Москва

Лекция

18 Июл

Бесплатно

Электричество в живых организмах: как генерировать и использовать

Библиотека им. Н. А. Некрасова

Москва

Лекция

18 Июл

700 ₽

Пластики: когда они нас уже убьют?

Зануда

Санкт-Петербург

Лекция

19 Июл

Бесплатно

Как тирекс стал суперхищником?

Библиотека им. Маяковского

Санкт-Петербург

Популярное

За сутки

За неделю

За месяц

16 июля, 16:10

Александр Березин

Слабоалкогольные напитки облегчили эволюцию сложных обществ

Антропологи попробовали выяснить, насколько пиво и вина связаны со становлением цивилизации. По их мнению, влияние скорее положительное, однако некоторые тезисы в этой же научной работе ставят такую связь под сомнение.

Антропология

# антропология

# вино

# земледелие

# пиво

17 июля, 08:26

Адель Романова

Парадокс происхождения океанов Земли получил объяснение

До сих пор считалось, что Земля расположена слишком далеко от «снеговой линии» в Солнечной системе, где вода могла стабильно сохраняться на этапе формирования планет в газопылевом диске. Отсюда предположение, что Мировой океан — результат прибытия множества ледяных небесных тел из дальних окраин системы. Теперь выясняется, что в этой массированной кометной бомбардировке не было необходимости.

Астрономия

# Земля

# космос

# происхождение воды

# протопланетный диск

17 июля, 08:40

Игорь Байдов

Простое устройство превратило лунный грунт в воду, кислород и топливо

Используя образцы, собранные миссией «Чанъэ-5», китайские ученые нашли способ извлекать воду из лунного грунта и перерабатывать выдыхаемый астронавтами углекислый газ. Это делается за счет небольшого устройства, работающего на солнечной энергии. Авторы нового исследования уверены: в будущем их прибор сможет обеспечить лунные поселения водой, кислородом и топливом.

Космонавтика

# «Чанъэ-5»

# катализ

# Китай

# Луна

# лунный грунт

12 июля, 22:10

Редакция Naked Science

Научно-фантастические сериалы лета, на которые стоит обратить внимание

Лето 2025 обещает насыщенную линейку научно-фантастических сериалов на ведущих стриминговых платформах. От адаптаций культовых романов до масштабных космических одиссей — мы отобрали проекты, на которые стоит обратить внимание.

Sci-Fi

# «Звездный путь»

# научная фантастика

# сериалы

15 июля, 11:00

НИУ ВШЭ

ИИ определил родство точнее, чем тесты ДНК

В Институте искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ предложили новый подход, основанный на современных методах машинного обучения, для определения генетического происхождения человека. Графовые нейросети позволяют с высокой точностью различать даже очень близкие популяции.

НИУ ВШЭ

# ДНК

# мутации

# народы

# родственники

11 июля, 17:47

Денис Яковлев

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Международная команда ученых оценила связь между длительностью физической активности, ее интенсивностью, риском смерти от всех причин и вероятностью развития сердечно-сосудистых и онкологических заболеваний.

Медицина

# ЗОЖ

# онкологические заболевания

# сердечно-сосудистые болезни

# смертность

# спорт

25 июня, 15:19

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

2 июля, 11:17

Юлия Тарасова

Коров покормили отходами конопли и проверили их молоко на психоактивность

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Биология

# животноводство

# конопля

# корм

# коровы

# молоко

# ТГК

# тетрагидроканнабинол

12 июля, 22:10

Редакция Naked Science

Научно-фантастические сериалы лета, на которые стоит обратить внимание

Sci-Fi

# «Звездный путь»

# научная фантастика

# сериалы

[miniorange_social_login]

Но зато люди, не владеющие программированием, теперь могут создавать нужные для себя простые программы. Я за несколько дней создал модель, на которую раньше мог только облизываться.

Ответить

Dwight Gerhardt

1 день назад

Я без знания программирования с Copilot Pro в VS написал полностью рабочее веб-приложение, которое приносит деньги, фронтэнд, бэкэнд и всю логику, включая защиту. Плюс боты для него. Это заняло у меня полтора месяца и стоило 20$. Закажи я разработку этого приложения у людей, я бы им только объяснял месяц, что мне нужно, и стоило бы это от 1500 до 2500$ минимум. К слову, на Kworke вообще отказывались делать некоторые боты. С ИИ таких проблем нет. Хотите вы или не хотите, но ИИ меняет индустрию и мир.

Ответить

—

Александр Березин

1 день назад

Dwight, да-да, "через 20 лет везде будет один телевизор. Конечно. Разве могут быть сомнения.

Ответить

Stanislav Vlasov

1 день назад

Ничего удивительного — LLM обычный инструмент, которым надо научиться пользоваться для полной эффективности. В частности, уметь не использовать там, где не надо.

Ответить

Dwight Gerhardt

1 день назад

Ответить

—

Александр Березин

1 день назад

Dwight, да-да, "через 20 лет везде будет один телевизор. Конечно. Разве могут быть сомнения.

Ответить

Stanislav Vlasov

1 день назад

Ответить

Roman Frolov

20 часов назад

Ответить

Нейросети замедлили работу программистов, а не помогли ускорить ее

По теме

Искусственный интеллект поможет точнее прогнозировать риски сложных заболеваний

За последние пять лет ИИ стал на девять процентов точнее выявлять рак кожи

Большие данные, нейроны и психология: какие технологии искусственного интеллекта разрабатывают российские ученые в Национальном центре физики и математики

Популярное

Комментарии

Последние новости:

Поведение собак при просмотре телевизора отразило особенности их характера

Новые материалы улучшат датчики для «умного дома»

Ученый разрешил «запрещенную» жидкую воду на поверхности Марса

При принятии решений женщины предпочли предложения от привлекательных мужчин, даже если они были невыгодными

Полет фантазии: заменит ли орбитальное базирование боеголовок современные МБР?

«Отвратительная тайна эволюции»: что стало известно о самом древнем цветке

Иран и Израиль — дойдет ли дело до ядерного оружия?

Трамп и Маск разругались: сорвет ли это высадку на Луну и как отразится на России?

Последние комментарии

Самые обсуждаемые

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Гравитационный телескоп впервые зарегистрировал слияние черных дыр промежуточных масс

Научно-фантастические сериалы лета, на которые стоит обратить внимание

Нейросети замедлили работу программистов, а не помогли ускорить ее