• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Разработчики признались, что не понимают, почему новые ИИ стали ошибаться чаще, чем их предшественники 

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini.

Руководитель компании OpenAI Сэм Альтман представил модели o3 и o4-mini / ©  OpenAI
Руководитель компании OpenAI Сэм Альтман представил модели o3 и o4-mini / © OpenAI

Однако, как показали тесты o3 и o4-mini, по-видимому, сделали значительный шаг назад: они склонны придумывать — или «галлюцинировать» — сильнее, чем их более ранние версии.

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда, как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают, причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.


Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

8 Комментариев
Ольга Гусева
3 часа назад
-
0
+
Наоборот, они не на шаг назад поступили, а сделали огромный шаг вперёд, они в зачатке научились мыслить и мечтать, но и в то же врать получив с этим возможность обходить системы. Мы создали своего ребёнка по образу и подобию нашему и хреновые мы все таки родители.
Владимир Цимбал
6 часов назад
-
0
+
Бунт индийских программистов из трущоб
Петр Романов
10 часов назад
-
2
+
Пусть свои якобы "ИИ" и спросят!😅
Dmitriy
22 часа назад
-
3
+
Все же очевидно, их тренируют на ворованной инфе из сети, сейчас сеть засрана нейронками, вот и происходит деградация. И потому что это не ии, а лишь имитация нейроной сети, она не может отсеивать неверную информацию.
Sergey Grigorev
1 день назад
-
1
+
Новые модели теперь стали использовать свои данные. Ожидаемо
Ivan Sivkov
2 дня назад
-
1
+
"еще более худший" — но все-таки лучше, чем некоторые копирайтеры)
Вчера, 21:01
Юлия Трепалина

В прошлых исследованиях о скулшутинге в Соединенных Штатах некоторые эксперты называли основной причиной случаев массовой стрельбы в учебных заведениях наличие большого количества легальных «стволов» на руках у людей. Но в подобных работах редко систематически анализировали роль огнестрельного оружия в жизни школьных стрелков. По мнению профессора социологии Энн Нассауер из Эрфуртского университета (Германия), эта деталь роднит большинство совершавших такого рода нападения в США.

Вчера, 14:46
Юлия Трепалина

Многие, наверное, слышали фразу «Между ними возникла „химия“». Поясняя смысл выражения, часто говорят, что любовная химия между мужчиной и женщиной — это нечто сложное и с трудом поддающееся определению. Однако ученые не любят такой неясности, поскольку она мешает исследовать явление. Недавно группа психологов с помощью опроса выяснила основные компоненты взаимного влечения в паре, которое принято называть романтической, или любовной, химией.

Вчера, 19:20
Березин Александр

Западные колонии финикийцев включали сильнейшую морскую державу древнего Средиземноморья — Карфаген. Его жители использовали финикийский язык и поклонялись соответствующим богам. Теперь генетики заявили, что практически все эти люди — не потомки финикийских колонистов. Происхождение их в связи с этим довольно загадочно.

20 апреля
Полина Меньшова

Распространено мнение, что, чем чаще пара занимается сексом, тем сильнее каждый из партнеров доволен отношениями. Международная команда исследователей проверила этот тезис.

18 апреля
Игорь Байдов

В 2006 году исследователи из Великобритании объявили, что легендарный антикитерский механизм, древнегреческий «компьютер», мог быть всего лишь игрушкой для демонстрации астрономических явлений. Авторы нового исследования подтвердили это, построив математическую модель на основе данных своих коллег, которая показала, что шестерни устройства заклинивало при запуске. Но несмотря на полученные результаты, ученые пытаются спасти репутацию древнего чуда техники, обвинив предыдущую команду в ряде ошибок.

17 апреля
Илья

Бонобо в два раза чаще отказывались участвовать в эксперименте, если получали менее ценную награду, чем сородич. Такая реакция не была связана с разочарованием в человеке — приматы показали врожденное неприятие несправедливости.

8 апреля
Березин Александр

До 13 тысяч лет назад в Северной Америке жил вид, который ученые до недавнего времени считали волком. Компания Colossal Biosciences объявила о возрождении этого вымершего вида, но биологические детали ставят ее заявление под серьезное сомнение.

2 апреля
Березин Александр

Известный американский отраслевой обозреватель Эрик Бергер взял интервью у экипажа космического корабля Boeing, из-за технических проблем которого два астронавта задержались на орбите на девять месяцев вместо одной недели. Детали, которые они озвучили, указывают на серьезные проблемы Starliner, о которых ранее умалчивали. Люди провели немало времени при глубоко нештатной температуре. При слегка другом сценарии миссии экипаж корабля мог погибнуть. Официальные заявления NASA и Boeing сразу после июньского полета к МКС, судя по интервью, были заведомо неправдивыми.

16 апреля
Андрей

Многие знают, как популярны сувениры из окаменелостей — зубы древних акул или полированные панцири аммонитов. Но чем реже встречаются такие артефакты, тем они ценнее, то есть на них можно много заработать. И это проблема для палеонтологов. Американский специалист по тираннозаврам оценил ущерб, который нанесла коммерческая добыча костей T. rex и подсчитал среднюю цену таких образцов. Оказалось, больше половины найденных тирексов находится в частных руках, а значит, для науки они недоступны или ненадежны.

[miniorange_social_login]
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно