16 июля, 12:16

Александр Березин

6,3 тыс

Нейросети замедлили работу программистов, а не помогли ускорить ее

❋ 4.9

Даже опытные программисты считали, что использование нейросети для написания кода экономит им время. Однако, когда исследователи проверили это на задачах из реального мира, выяснилось, что разработчики ошибаются. В действительности применение ИИ увеличило время, необходимое для реализации проектов.

Технологии

# искусственный интеллект

# нейросети

# программирование

Изменения во времени работы над ПО-проектом при использовании ИИ разошлись с прогнозами. То, что ожидали экономисты, описывающие прогресс ИИ находится слева, прогнозы специалистов по машинном обучению правее, еще правее можно видеть оценки самих разработчиков, участвовавших в эксперименте, сначала перед выполнением работы, а потом и после нее. Красным справа показаны реальные результаты / © METR

В нашу эпоху ИИ чаще всего называют «нейросети». Хотя Naked Science отмечал, что в действительности слово «интеллект» в названии таких ИИ не отражает реального положения вещей и что такие системы на самом деле «китайские комнаты», общий энтузиазм по поводу их возможностей привел к широкому использованию таких систем в написании кода. Причем большинство специальных тестов (бенчмарков) уже некоторое время показывают, что это экономит время разработчиков.

Исследователи из некоммерческой исследовательской организации Model Evaluation & Threat Research решили выяснить, так ли это в случае реальных задач, а не специально сконструированных бенчмарков. Для этого к эксперименту привлекли 16 разработчиков программного обеспечения для опенсорсных репозиториев. Такие репозитории требуют регулярного поддержания: исправления багов, внедрения новых черт и так далее.

Затем исследователи поручили половину из 246 таких задач выполнять с помощью специализированных нейросетей-кодеров: Cursor Pro или Claude 3.5/3.7 Sonnet от Anthropic. Хотя они не так на слуху, как ChatGPT, в мире программистов эти системы оценивают достаточно высоко, разработчики исходно «затачивали» их во многом под написание кода. Другая половина задач выполнялась без привлечения таких систем.

Перед тем как разделить задачи, для них сделали прогноз времени, нужного для выполнения. Что важно, время по обработке запросов на включение тех или иных изменений из ветки разрабатываемого ПО в основную ветку ПО (уже стабильно работающую) было включено в общую оценку времени на разработку.

Перед работой программистов попросили оценить, насколько сократится время на выполнение задач из-за использования ИИ. Средняя оценка была 24%. После выполнения задачи разработчики изменили ее: по их мнению, его использование снизило время на выполнение задач только на 20%.

А вот исследователи, отслеживавшие реальные траты времени с помощью записи происходящего на экранах разработчиков, выявили совсем другие показатели. При использовании нейросетей они выполняли задачи на 19% медленнее, чем это делалось при программировании «вручную». Авторы научной работы, опубликованной на сервере препринтов Корнеллского университета, начали искать объяснение столь неожиданному итогу.

В частности, они отметили, что участвовавшие в исследовании программисты работали с этими репозиториями пять лет. За это время они хорошо узнали их структуру и характерные проблемы. ИИ, напротив, особенностей работы этих репозиториев не знали. Кроме того, ответственность при работе с такими репозиториями очень велика, поскольку любая ошибка будет иметь длительные последствия, часто неприятные для программиста. И если в разработке коммерческого ПО иной раз можно скрыть свою недоработку, списав на чужие ошибки, то в разработке открытого программного обеспечения принят подход серьезной личной ответственности — это заставляет программистов тщательнее выверять, что они выпускают.

Затраты времени по типам задач. Фиолетовым показана ситуация для группы, которой запретили пользоваться ИИ, зеленым даны затраты тех, кто использовал ИИ.

И все же основной причиной медленного выполнения задач с помощью нейросетей были их реальные проблемы, а не особенности эксперимента. Анализ экранного времени показал, что хотя время на, собственно, написания кода, отладку/дебаггинг или чтение и поиск информации у разработчиков упало, другие времязатраты это более чем компенсировали. Сначала разработчикам пришлось долго вычитывать написанный ИИ код, затем предлагать ИИ поправить найденные ошибки, затем ждать, пока все это происходит.

Выросло также время, когда на экране ничего не происходило: то есть программисты в период работы с нейросетью меньшую долю времени активно трудились. Без каких-либо правок оказалось возможным задействовать только 44% кода, написанного ИИ, и 9% всего времени разработчиков ушло на внесение в этот код изменений, с которыми он бы заработал нормально.

То, что новое исследование противоречит бенчмаркам, неудивительно: те очень часто измеряют продуктивность в количествах строк кода или же по небольшим, дискретным задачам, законченным в тот или иной промежуток времени. Между тем в работе над реальными проектами много времени занимают и другие процессы: тщательная (в отличие от экспериментов) проверка адекватности кода при самых неожиданных ситуациях, а также интеграция частных «кусков» процесса разработки в единое целое.

Авторы статьи предположили, что уже в скором времени нейросети смогут спрогрессировать достаточно, чтобы не замедлять работу программистов. Но так это или нет, определенно покажет только будущее. То, что сами программисты, участвовавшие в эксперименте, даже по его окончании не могли понять, что ИИ замедлил их, а не ускорил, говорит: оценить ситуацию объективно непросто. Всеобщий энтузиазм по поводу нейросетей, по всей видимости, заставляет многих систематически переоценивать возможности этих помощников.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# искусственный интеллект

# нейросети

# программирование

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Санкт-Петербургский Планетарий

Санкт-Петербург

Лекция

27 Ноя

Бесплатно

Интеллектуальные особенности рас

ВДНХ

Москва

Лекция

27 Ноя

Бесплатно

Нейрофизиология сна и сновидений

Библиотека им. Н. А. Некрасова

Москва

Лекция

27 Ноя

800 ₽

На закате: этруски в третьем-первом вв. до н.э.

Центр «Архэ»

Санкт-Петербург

Лекция

27 Ноя

Бесплатно

Стабильный хаос: как Солнечная система сохраняет порядок

Москва

Радиационные катастрофы: Чернобыль, Фукусима и …?

Центр «Архэ»

Онлайн

Лекция

28 Ноя

Бесплатно

Что общего у автомагистралей с египетскими мумиями?

Библиотека Планетарий 1

Санкт-Петербург

Лекция

28 Ноя

Бесплатно

Слова, строящие мосты

Библиотека им. Н. А. Некрасова

Москва

Лекция

28 Ноя

750 ₽

Взаимодействие аллелей одного гена. Взаимодействие генов

Центр «Архэ»

Онлайн

Популярное

За сутки

За неделю

За месяц

27 ноября, 11:05

Игорь Байдов

Каменные идолы острова Пасхи оказались результатом соперничества независимых общин

Долгое время ученые полагали, что сотни гигантских статуй на острове Пасхи создали представители местной общины под руководством одного вождя. Однако авторы нового исследования поставили эту гипотезу под сомнение. Детальная трехмерная карта главного каменного карьера острова указала на более сложную картину. Вероятно, монументы были плодом творчества и соперничества небольших независимых групп.

Антропология

# остров Пасхи

# Полинезия

# статуи

26 ноября, 12:39

Игорь Байдов

Налоги на урожай, а не сельское хозяйство в целом, подтолкнули людей к созданию первых государств

Что стало настоящим фундаментом власти — умение обрабатывать землю или контроль над некоторыми культурными растениями? Авторы нового исследования пришли к выводу, что появление первых крупных сообществ и государств зависело не от земледелия в целом, а от выращивания определенных злаков. Эти культуры было легко хранить и, еще важнее, невероятно просто облагать налогом, что и дало толчок появлению цивилизации.

История

# земледелие

# зерновые культуры

# письменность

# сельское хозяйство

26 ноября, 13:12

Александр Березин

Японский астроном заявил об открытии гамма-излучения от частиц темной материи

Гамма-излучение, зафиксированное гамма-телескопом «Ферми», по мнению исследователя, может объясняться только распадом вимпов, частиц темной материи, в существовании которых множество других физиков уже разуверились. Если независимые проверки подтвердят открытие, это может существенно изменить космологическую картину мира.

Физика

# Fermi

# вимпы

# космические телескопы

# космос

21 ноября, 10:02

ПНИПУ

Зумеры против альфа: сравнение цифровых привычек, мышления и жизненных стратегий

Так называемые зумеры и альфа, несмотря на молодой возраст, уже формируют ключевые поведенческие и потребительские тренды. Ученые Пермского Политеха рассказали, почему обозначение поколений начали с конца алфавита, как альфа и зумеры отличаются в способности к терпеливости, совмещении цифрового и реального «Я», подходу к профессиональной деятельности и отношении к финансам, какое мышление пришло на смену клиповому и как использование искусственного интеллекта повлияет на авторитет родителей.

ПНИПУ

# демография

# зумеры

# интернет

# молодежь

# общество

# подростки

# поколения

# теория поколений

26 ноября, 16:18

ФизТех

Тайная архитектура пьезокерамики: как атомная симметрия породила уникальные свойства материалов

Коллектив российских ученых из МИРЭА — Российского технологического университета, Центра фотоники двумерных материалов МФТИ, Института металлургии и материаловедения им. А. А. Байкова РАН и ряда других ведущих научных центров провел глубокое исследование кристаллической структуры широко используемых пьезоэлектрических материалов на основе цирконата-титаната свинца. Используя метод рентгеноструктурного анализа, исследователи впервые смогли в деталях установить, как небольшие химические добавки кардинально меняют фазовый состав керамики и напрямую определяют ее электрофизические характеристики. Это открывает путь к целенаправленному дизайну «умных» материалов с заранее заданными свойствами для передовой электроники и сенсорики.

ФизТех

# атомная структура

# керамика

# кристаллическая решетка

# материал

# пьезоэлектрика

# структура

26 ноября, 17:00

Курчатовский институт

Ученые разработали штамм цианобактерии, способный поглощать в три раза больше фосфора из сточных вод

Фосфор – элемент, играющий ключевую роль в росте растений. В сельском хозяйстве он используется в составе многих минеральных удобрений. В то же время фосфор, содержащийся в сточных водах — серьезный загрязнитель, который при попадании в водоемы нарушает баланс экосистем и вызывает цветение водорослей. Ученые Национального исследовательского центра «Курчатовский институт» и Южного федерального университета предложили новый экологичный способ выделения фосфора из сточных вод с помощью фотосинтезирующих микроорганизмов.

Курчатовский институт

# бактерии

# биоуголь

# сточные воды

# фосфор

# цианобактерии

# экология

20 ноября, 13:12

Полина Меньшова

Анализ 2430 языков показал сходства и различия их правил грамматики

Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.

Психология

# грамматика

# лингвистика

# морфология

# синтаксис

# языки

8 ноября, 18:29

Адель Романова

Астрономы вычислили, откуда на Землю прилетают межзвездные объекты

По расчетам, большинство «гостей» из других звездных систем летят к Земле примерно со стороны созвездия Геркулес. Скорее всего, они время от времени падают на нашу планету, просто мы еще не научились это замечать. Как удалось вычислить, чаще всего они должны падать зимой и где-то в окрестностях экватора.

Астрономия

# космос

# межзвездные объекты

# Солнечная система

12 ноября, 10:47

Максим Абдулаев

Бактерии со сломанными жгутиками поплыли вперед на собственных продуктах жизнедеятельности

Ученые открыли новый, ранее неизвестный способ передвижения бактерий по поверхностям, для которого не нужны жгутики. Эти микроорганизмы на краю колонии переваривают сахара, выделяют метаболиты и создают осмотическое давление. Оно вызывает микроскопическое «цунами», и на нем бактерии катятся вперед.

Биология

# бактерии

# жгутики

# локомоция

# микробиология

[miniorange_social_login]

В статье понятие "работа программиста" очень расплывчатая. У меня в должности написано "программист", но в реальных проектах приходится решать намного более широкий круг задач, чем исправлять баги из багтрекера. Недавние примеры, где ChatGPT и DeepSeek существенно сократили время работы (схожие задачи приходилось решать до появления LLM, мог потратить около дня): - Поиск и исправление проблем в Linux: исправление настроек сети, диагностика проблем с оборудованием, написание скриптов; - Помощь в работе с Git. ИИ подсказал, какими инструментами можно переработать репозиторий, чтобы полностью удалить файл; - Фреймворк Boost::ASIO для C++. ИИ помог найти и исправить баг и архитектуру, в оф. документации не было примера; - Работа с БД: ИИ предложил типовые подходы по организации таблиц, функций; помогает написать простые SQL запросы; - Продвинутый поиск информации в интернете, включая научные статьи по редким темам. LLM дают ссылки на первоисточник.

Ответить

Лана Пренципал

19.07.2025

Как сенъёрный программер в крупном банке скажу, нифига оно не помогает, и никто в большом взрослом программировании это не использует. Сделать с нуля мелкое приложение - может быть. Дописать фичу в крупную систему из десятков приложений и тысяч файлов - нет.

Ответить

Евгений Керель

18.07.2025

-1

Я лично противник попыток замены профессий ИИ. Не верю что в принципе возможно, в самом лучшем случае выйдет только шаблонный повторятор того, что есть у среднего спеца. Цель всей этой кутерьмы, конечно, снизить траты крупных компаний и они это сделают в ущерб качеству. Уволят сотни тысяч, не смотря ни на что. Аукнется потом, когда народ досыта наестся ИИ шлака. Либо все привыкнут и смирятся что качественно как было уже не будет никогда. Потому что за качество нужно платить спецам зп. Что, мне кажется, стоит делать так это ИИ исключительно в формате помощника для каждого спеца. Вот это было бы эффективно. Многие считают что так и есть. Но абсолютно точно это готовиться под тотальную замену массу профессий.

Ответить

-1

—

Иван Колупаев

18.07.2025

Евгений, гениям замена ИИ не грозит. И высококлассным спецам тоже. Но много ли таких в мире? Большинство и есть средние кроме тех что еще ниже. И чем займутся эти люди? Вот тут возможны варианты вплоть до одного художника, которого не взяли в Венскую академию из-за весьма средних талантов.

Ответить

ещё комментарии

Свежий

20.07.2025

Иван, а с чего это ты так решил? Потому что ИИ не так хорош в выполнении профессиональных задач? А ему это и не требуется - чтобы заменить спецов, достаточно убедить их руководство в том что ИИ будет более эффективен. Он уже очень хорош во внушении и убеждении. А многомиллиардные рекламные кампании в этом помогают. Спецы думают что их не заменят потому что они лучше как профессионалы, но профессиональные навыки тут не будут играть роли. Решение о том кому работать принимается людьми, которые вообще не понимают программирования

Ответить

Roman Frolov

16.07.2025

Но зато люди, не владеющие программированием, теперь могут создавать нужные для себя простые программы. Я за несколько дней создал модель, на которую раньше мог только облизываться.

Ответить

Dwight Gerhardt

16.07.2025

Я без знания программирования с Copilot Pro в VS написал полностью рабочее веб-приложение, которое приносит деньги, фронтэнд, бэкэнд и всю логику, включая защиту. Плюс боты для него. Это заняло у меня полтора месяца и стоило 20$. Закажи я разработку этого приложения у людей, я бы им только объяснял месяц, что мне нужно, и стоило бы это от 1500 до 2500$ минимум. К слову, на Kworke вообще отказывались делать некоторые боты. С ИИ таких проблем нет. Хотите вы или не хотите, но ИИ меняет индустрию и мир.

Ответить

—

Александр Березин

16.07.2025

Dwight, да-да, "через 20 лет везде будет один телевизор. Конечно. Разве могут быть сомнения.

Ответить

SiL

20.07.2025

-1

Dwight, только когда ваши базы будут слиты, а серваки упадут и упрямо не захотят подниматься - не нойте, а обязательно запилите постик о том, как хорошо писать с ИИ.

Ответить

-1

ещё комментарии

SiL

20.07.2025

SiL, нужно просто трезво понимать, что ИИ это инструмент. Нельзя купить уровень, молоток, и ещё другие инструменты и построить дом для своей семьи ничего не понимая в этом. Можно в итоге какую-то симпатичную коробку родить, но она будет разваливаться на глазах через очень короткий промежуток времени. Так и с ИТ проектами своими руками без знаний в программировании.

Ответить

—

Dwight Gerhardt

20.07.2025

SiL, понятно, очередной нытик луддит.

Ответить

Stanislav Vlasov

16.07.2025

Ничего удивительного — LLM обычный инструмент, которым надо научиться пользоваться для полной эффективности. В частности, уметь не использовать там, где не надо.

Ответить

Stanislav Vlasov

16.07.2025

Ответить

Лана Пренципал

19.07.2025

Ответить

Ян Пивнев

20.07.2025

Ответить

Roman Frolov

16.07.2025

Ответить

Евгений Керель

18.07.2025

-1

Ответить

-1

—

Иван Колупаев

18.07.2025

Ответить

ещё комментарии

Свежий

20.07.2025

Ответить

VASYA G.

22.07.2025

Считаю, что на данном этапе еще рано внедрять ИИ в работу. Нужно его продолжать обучать

Ответить

Dwight Gerhardt

16.07.2025

Ответить

—

Александр Березин

16.07.2025

Dwight, да-да, "через 20 лет везде будет один телевизор. Конечно. Разве могут быть сомнения.

Ответить

SiL

20.07.2025

-1

Ответить

-1

ещё комментарии

SiL

20.07.2025

Ответить

—

Dwight Gerhardt

20.07.2025

SiL, понятно, очередной нытик луддит.

Ответить

Нейросети замедлили работу программистов, а не помогли ускорить ее

По теме

Пермские ученые «раскроили» промышленные детали с помощью нейросетей

Пародийный чат-бот из 1960-х годов превзошел GPT-3.5 в тесте Тьюринга

ИИ помог составить карту распределения темной материи вокруг Млечного Пути

Популярное

Комментарии

Последние новости:

Объемно-поверхностная закалка: как белорусские инженеры повысили прочность транспортных систем

Загадочный магнетизм сверхпроводников: динамика во времени оказалась важнее пространства

Слава отняла у музыкантов до четырех лет жизни

Кости животных помогли раскрыть загадку средневекового городища Саломатово

Атомный квиз — разгоните нейтроны знаний!

Зажечь Солнце на Земле: как Россия в одиночку строит свой ИТЭР – интервью с Андреем Аникеевым

Огонь спуска с орбиты: миф о трении и вопрос с плазмой

Физики доказали, что Вселенная не может быть компьютерной симуляцией? Что здесь не так

Последние комментарии

Самые обсуждаемые

«Яндекс» начал крупномасштабный эксперимент по поиску возможного сознания у искусственного интеллекта

Зумеры против альфа: сравнение цифровых привычек, мышления и жизненных стратегий

Blue Origin заявила о планах создать сверхтяжелую частную ракету

Ученые объяснили, почему пауки рода Clubiona не замерзают зимой