16.07.2025, 12:16

Александр Березин

6,5 тыс

Нейросети замедлили работу программистов, а не помогли ускорить ее

❋ 4.9

Даже опытные программисты считали, что использование нейросети для написания кода экономит им время. Однако, когда исследователи проверили это на задачах из реального мира, выяснилось, что разработчики ошибаются. В действительности применение ИИ увеличило время, необходимое для реализации проектов.

Технологии

# искусственный интеллект

# нейросети

# программирование

Изменения во времени работы над ПО-проектом при использовании ИИ разошлись с прогнозами. То, что ожидали экономисты, описывающие прогресс ИИ находится слева, прогнозы специалистов по машинном обучению правее, еще правее можно видеть оценки самих разработчиков, участвовавших в эксперименте, сначала перед выполнением работы, а потом и после нее. Красным справа показаны реальные результаты / © METR

В нашу эпоху ИИ чаще всего называют «нейросети». Хотя Naked Science отмечал, что в действительности слово «интеллект» в названии таких ИИ не отражает реального положения вещей и что такие системы на самом деле «китайские комнаты», общий энтузиазм по поводу их возможностей привел к широкому использованию таких систем в написании кода. Причем большинство специальных тестов (бенчмарков) уже некоторое время показывают, что это экономит время разработчиков.

Исследователи из некоммерческой исследовательской организации Model Evaluation & Threat Research решили выяснить, так ли это в случае реальных задач, а не специально сконструированных бенчмарков. Для этого к эксперименту привлекли 16 разработчиков программного обеспечения для опенсорсных репозиториев. Такие репозитории требуют регулярного поддержания: исправления багов, внедрения новых черт и так далее.

Затем исследователи поручили половину из 246 таких задач выполнять с помощью специализированных нейросетей-кодеров: Cursor Pro или Claude 3.5/3.7 Sonnet от Anthropic. Хотя они не так на слуху, как ChatGPT, в мире программистов эти системы оценивают достаточно высоко, разработчики исходно «затачивали» их во многом под написание кода. Другая половина задач выполнялась без привлечения таких систем.

Перед тем как разделить задачи, для них сделали прогноз времени, нужного для выполнения. Что важно, время по обработке запросов на включение тех или иных изменений из ветки разрабатываемого ПО в основную ветку ПО (уже стабильно работающую) было включено в общую оценку времени на разработку.

Перед работой программистов попросили оценить, насколько сократится время на выполнение задач из-за использования ИИ. Средняя оценка была 24%. После выполнения задачи разработчики изменили ее: по их мнению, его использование снизило время на выполнение задач только на 20%.

А вот исследователи, отслеживавшие реальные траты времени с помощью записи происходящего на экранах разработчиков, выявили совсем другие показатели. При использовании нейросетей они выполняли задачи на 19% медленнее, чем это делалось при программировании «вручную». Авторы научной работы, опубликованной на сервере препринтов Корнеллского университета, начали искать объяснение столь неожиданному итогу.

В частности, они отметили, что участвовавшие в исследовании программисты работали с этими репозиториями пять лет. За это время они хорошо узнали их структуру и характерные проблемы. ИИ, напротив, особенностей работы этих репозиториев не знали. Кроме того, ответственность при работе с такими репозиториями очень велика, поскольку любая ошибка будет иметь длительные последствия, часто неприятные для программиста. И если в разработке коммерческого ПО иной раз можно скрыть свою недоработку, списав на чужие ошибки, то в разработке открытого программного обеспечения принят подход серьезной личной ответственности — это заставляет программистов тщательнее выверять, что они выпускают.

Затраты времени по типам задач. Фиолетовым показана ситуация для группы, которой запретили пользоваться ИИ, зеленым даны затраты тех, кто использовал ИИ.

И все же основной причиной медленного выполнения задач с помощью нейросетей были их реальные проблемы, а не особенности эксперимента. Анализ экранного времени показал, что хотя время на, собственно, написания кода, отладку/дебаггинг или чтение и поиск информации у разработчиков упало, другие времязатраты это более чем компенсировали. Сначала разработчикам пришлось долго вычитывать написанный ИИ код, затем предлагать ИИ поправить найденные ошибки, затем ждать, пока все это происходит.

Выросло также время, когда на экране ничего не происходило: то есть программисты в период работы с нейросетью меньшую долю времени активно трудились. Без каких-либо правок оказалось возможным задействовать только 44% кода, написанного ИИ, и 9% всего времени разработчиков ушло на внесение в этот код изменений, с которыми он бы заработал нормально.

То, что новое исследование противоречит бенчмаркам, неудивительно: те очень часто измеряют продуктивность в количествах строк кода или же по небольшим, дискретным задачам, законченным в тот или иной промежуток времени. Между тем в работе над реальными проектами много времени занимают и другие процессы: тщательная (в отличие от экспериментов) проверка адекватности кода при самых неожиданных ситуациях, а также интеграция частных «кусков» процесса разработки в единое целое.

Авторы статьи предположили, что уже в скором времени нейросети смогут спрогрессировать достаточно, чтобы не замедлять работу программистов. Но так это или нет, определенно покажет только будущее. То, что сами программисты, участвовавшие в эксперименте, даже по его окончании не могли понять, что ИИ замедлил их, а не ускорил, говорит: оценить ситуацию объективно непросто. Всеобщий энтузиазм по поводу нейросетей, по всей видимости, заставляет многих систематически переоценивать возможности этих помощников.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# искусственный интеллект

# нейросети

# программирование

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Эволюция социальности позвоночных в контексте происхождения человеческого общества

Библиотека им. Н. А. Некрасова

Москва

Лекция

14 Июл

Бесплатно

Устойчивость транспортной системы, или нужны ли нам электросамокаты?

Библиотека Планетарий 1

Санкт-Петербург

Лекция

15 Июл

2000 ₽

Будущее русского языка

Medio Modo

Москва

Лекция

15 Июл

Бесплатно

Почему «Война и мир» – великая книга?

ВДНХ

Москва

Лекция

15 Июл

Бесплатно

Философия искусственного интеллекта: новые вопросы о человеке и мире

Библиотека им. Анны Ахматовой

Москва

Лекция

16 Июл

Бесплатно

Миклухо-Маклай и секретное плавание корвета «Скобелев»

Русское географическое общество

Санкт-Петербург

Лекция

16 Июл

Бесплатно

Вирусы против опухоли: новые подходы в терапии рака

Парк «Зарядье»

Москва

Лекция

16 Июл

Бесплатно

Сердце как инженерная задача: от насоса к тканевой инженерии

Центр «Архэ»

Москва

Лекция

16 Июл

Бесплатно

Пластик: враг планеты или лучший материал цивилизации?

ИЦАЭ

Санкт-Петербург

Популярное

За сутки

За неделю

За месяц

13 июля, 14:06

Максим Абдулаев

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Кит живет двести лет, умеет пробивать головой полуметровый лед и поет океанский джаз голосом несмазанной дверной петли. Охотоморские гренландские киты — это не просто многотонные ледоколы. Это древние узники, которые остались жить в Охотском море со времен последнего оледенения. Это счастливцы, которые смогли пережить гарпуны китобоев XIX-XX веков, но сегодня уязвимы не меньше. Чтобы спасти этих поразительных китов, российским ученым и команде фонда «Природа и люди» приходится: считать хвосты, читать биографии по шрамам, прятать подростков от хищников, стрелять (спутниковыми метками) с парамоторов и тяжелых дронов. Рассказываем, как устроена жизнь гренландских китов России и кто помогает им не исчезнуть навсегда с лица планеты.

Биология

# Баренцево море

# горбатые киты

# защита природы

# китообразные

# киты

# косатки

# природа

# усатые киты

Выбор редакции

13 июля, 20:02

Evgenia Vavilova

Физик создал маленькую Вселенную, для которой нет понятия времени

Деревья растут и люди стареют не потому, что идет время, а из-за происходящих внутри них процессов. Но можно ли сказать, что именно эти процессы порождают время? Ученый создал маленькую Вселенную, в которой дела обстоят именно так.

Физика

# время

# коденсат Бозе-Эйнштейна

# лазеры

# Общая теория относительности

# рубидий

# энтропия

14 июля, 10:10

Марк Чернов

Физики впервые объяснили, почему золото не тускнеет тысячелетиями

Ученые выяснили, что золото владеет уникальной «техникой самообороны», которая защищает его от потускнения. Оказалось, атомы на поверхности этого металла способны самостоятельно перестраиваться в особые защитные структуры. Такой невидимый барьер блокирует контакт с кислородом и подавляет процесс окисления в триллион раз эффективнее, чем поверхность любого другого металла.

Химия

# Золото

# материаловедение

# наноматериалы

# окисление

# химия

13 июля, 14:06

Максим Абдулаев

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Биология

# Баренцево море

# горбатые киты

# защита природы

# китообразные

# киты

# косатки

# природа

# усатые киты

Выбор редакции

12 июля, 12:24

Марк Чернов

Интервальное голодание оказалось не хуже подсчета калорий — и оно значительно легче переносится

Ученые выяснили, почему интервальное голодание для многих оказывается эффективнее обычных диет. Исследование показало, что ограничение времени для приема пищи избавляет худеющего от изнуряющего ощущения жесткого контроля и при этом позволяет сбросить ровно столько же, сколько при скрупулезном подсчете калорий.

Медицина

# диета

# интервальное голодание

# лишний вес

# метаболизм

# питание

# похудение

13 июля, 20:02

Evgenia Vavilova

Физик создал маленькую Вселенную, для которой нет понятия времени

Физика

# время

# коденсат Бозе-Эйнштейна

# лазеры

# Общая теория относительности

# рубидий

# энтропия

25 июня, 16:20

Любовь С.

Физики уточнили возможные размеры Вселенной

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

Астрономия

# бесконечность

# вселенная

# геометрия

# пространство

# реликтовое излучение

# свет

# топология

25 июня, 15:09

Марк Чернов

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

Физика

# вода

# Молекулярная биология

# структура воды

# фазовые переходы

26 июня, 14:54

Максим Абдулаев

Начало деменции у пожилых собак определили по их походке

Американские ветеринары установили, что длина шага передних лап у пожилых собак отражает возрастные изменения в работе мозга. Когда у собак развивается деменция, шаги их передних лап становятся короче, причем эта связь не зависит от хронической боли в суставах.

Биология

# деменция

# походка

# собаки

# старение

[miniorange_social_login]

В статье понятие "работа программиста" очень расплывчатая. У меня в должности написано "программист", но в реальных проектах приходится решать намного более широкий круг задач, чем исправлять баги из багтрекера. Недавние примеры, где ChatGPT и DeepSeek существенно сократили время работы (схожие задачи приходилось решать до появления LLM, мог потратить около дня): - Поиск и исправление проблем в Linux: исправление настроек сети, диагностика проблем с оборудованием, написание скриптов; - Помощь в работе с Git. ИИ подсказал, какими инструментами можно переработать репозиторий, чтобы полностью удалить файл; - Фреймворк Boost::ASIO для C++. ИИ помог найти и исправить баг и архитектуру, в оф. документации не было примера; - Работа с БД: ИИ предложил типовые подходы по организации таблиц, функций; помогает написать простые SQL запросы; - Продвинутый поиск информации в интернете, включая научные статьи по редким темам. LLM дают ссылки на первоисточник.

Ответить

Лана Пренципал

19.07.2025

Как сенъёрный программер в крупном банке скажу, нифига оно не помогает, и никто в большом взрослом программировании это не использует. Сделать с нуля мелкое приложение - может быть. Дописать фичу в крупную систему из десятков приложений и тысяч файлов - нет.

Ответить

Евгений Керель

18.07.2025

-1

Я лично противник попыток замены профессий ИИ. Не верю что в принципе возможно, в самом лучшем случае выйдет только шаблонный повторятор того, что есть у среднего спеца. Цель всей этой кутерьмы, конечно, снизить траты крупных компаний и они это сделают в ущерб качеству. Уволят сотни тысяч, не смотря ни на что. Аукнется потом, когда народ досыта наестся ИИ шлака. Либо все привыкнут и смирятся что качественно как было уже не будет никогда. Потому что за качество нужно платить спецам зп. Что, мне кажется, стоит делать так это ИИ исключительно в формате помощника для каждого спеца. Вот это было бы эффективно. Многие считают что так и есть. Но абсолютно точно это готовиться под тотальную замену массу профессий.

Ответить

-1

—

Иван Колупаев

18.07.2025

Евгений, гениям замена ИИ не грозит. И высококлассным спецам тоже. Но много ли таких в мире? Большинство и есть средние кроме тех что еще ниже. И чем займутся эти люди? Вот тут возможны варианты вплоть до одного художника, которого не взяли в Венскую академию из-за весьма средних талантов.

Ответить

ещё комментарии

Свежий

20.07.2025

Иван, а с чего это ты так решил? Потому что ИИ не так хорош в выполнении профессиональных задач? А ему это и не требуется - чтобы заменить спецов, достаточно убедить их руководство в том что ИИ будет более эффективен. Он уже очень хорош во внушении и убеждении. А многомиллиардные рекламные кампании в этом помогают. Спецы думают что их не заменят потому что они лучше как профессионалы, но профессиональные навыки тут не будут играть роли. Решение о том кому работать принимается людьми, которые вообще не понимают программирования

Ответить

Roman Frolov

16.07.2025

Но зато люди, не владеющие программированием, теперь могут создавать нужные для себя простые программы. Я за несколько дней создал модель, на которую раньше мог только облизываться.

Ответить

Dwight Gerhardt

16.07.2025

Я без знания программирования с Copilot Pro в VS написал полностью рабочее веб-приложение, которое приносит деньги, фронтэнд, бэкэнд и всю логику, включая защиту. Плюс боты для него. Это заняло у меня полтора месяца и стоило 20$. Закажи я разработку этого приложения у людей, я бы им только объяснял месяц, что мне нужно, и стоило бы это от 1500 до 2500$ минимум. К слову, на Kworke вообще отказывались делать некоторые боты. С ИИ таких проблем нет. Хотите вы или не хотите, но ИИ меняет индустрию и мир.

Ответить

—

Александр Березин

16.07.2025

Dwight, да-да, "через 20 лет везде будет один телевизор. Конечно. Разве могут быть сомнения.

Ответить

SiL

20.07.2025

-1

Dwight, только когда ваши базы будут слиты, а серваки упадут и упрямо не захотят подниматься - не нойте, а обязательно запилите постик о том, как хорошо писать с ИИ.

Ответить

-1

ещё комментарии

SiL

20.07.2025

SiL, нужно просто трезво понимать, что ИИ это инструмент. Нельзя купить уровень, молоток, и ещё другие инструменты и построить дом для своей семьи ничего не понимая в этом. Можно в итоге какую-то симпатичную коробку родить, но она будет разваливаться на глазах через очень короткий промежуток времени. Так и с ИТ проектами своими руками без знаний в программировании.

Ответить

—

Dwight Gerhardt

20.07.2025

SiL, понятно, очередной нытик луддит.

Ответить

Stanislav Vlasov

16.07.2025

Ничего удивительного — LLM обычный инструмент, которым надо научиться пользоваться для полной эффективности. В частности, уметь не использовать там, где не надо.

Ответить

Stanislav Vlasov

16.07.2025

Ответить

Лана Пренципал

19.07.2025

Ответить

Ян Пивнев

20.07.2025

Ответить

Roman Frolov

16.07.2025

Ответить

Евгений Керель

18.07.2025

-1

Ответить

-1

—

Иван Колупаев

18.07.2025

Ответить

ещё комментарии

Свежий

20.07.2025

Ответить

VASYA G.

22.07.2025

Считаю, что на данном этапе еще рано внедрять ИИ в работу. Нужно его продолжать обучать

Ответить

Владимир Кормушкин

23.12.2025

Ответить

Dwight Gerhardt

16.07.2025

Ответить

—

Александр Березин

16.07.2025

Dwight, да-да, "через 20 лет везде будет один телевизор. Конечно. Разве могут быть сомнения.

Ответить

SiL

20.07.2025

-1

Ответить

-1

ещё комментарии

SiL

20.07.2025

Ответить

—

Dwight Gerhardt

20.07.2025

SiL, понятно, очередной нытик луддит.

Ответить

Нейросети замедлили работу программистов, а не помогли ускорить ее

По теме

Анализ показал, что искусственный интеллект развивается быстрее, чем окупается

Российские ученые научили нейросети писать безопасный код

Как искусственный интеллект спасет отечественное ЖКХ

Популярное

Комментарии

Последние новости:

На египетском курорте нашли древние гробницы с россыпью золотых языков мумий

Простой метод оценки неопределенности в машинном обучении оказался точным и менее затратным

Археологи узнали имя астронома майя

NASA начало сборку ракеты для пилотируемой миссии Artemis III

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Последние комментарии

Самые обсуждаемые

YouTube в России вырос даже с ограничениями, в отличие от «VK Видео»

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Эксперимент объяснил миф о женской многозадачности

Психологи выяснили, почему молодежь не спешит в ЗАГС