• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Разработчики признались, что не понимают, почему новые ИИ стали ошибаться чаще, чем их предшественники 

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini.

Руководитель компании OpenAI Сэм Альтман представил модели o3 и o4-mini / ©  OpenAI
Руководитель компании OpenAI Сэм Альтман представил модели o3 и o4-mini / © OpenAI

Однако, как показали тесты o3 и o4-mini, по-видимому, сделали значительный шаг назад: они склонны придумывать — или «галлюцинировать» — сильнее, чем их более ранние версии.

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда, как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают, причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.


Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

24 Комментариев
J M
J M
23 минуты назад
-
0
+
Здесь в комментариях ошибочно называют ИИ алгоритмом. Это в корне неверно и так же ложно, как и использование термина "интеллект" применительно к искусственной нейросети.
Ольга Гусева
4 дня назад
-
-1
+
Наоборот, они не на шаг назад поступили, а сделали огромный шаг вперёд, они в зачатке научились мыслить и мечтать, но и в то же врать получив с этим возможность обходить системы. Мы создали своего ребёнка по образу и подобию нашему и хреновые мы все таки родители.
Владимир Цимбал
4 дня назад
-
0
+
Бунт индийских программистов из трущоб
Петр Романов
4 дня назад
-
2
+
Пусть свои якобы "ИИ" и спросят!😅
    Mikhail Lukashev
    4 дня назад
    -
    2
    +
    Петр, ключевое слово - "якобы". Пора прекратить называть алгоритмы, написанные человеком, Искусственным Интеллектом.
    +
      ещё комментарии
      Kassie Cage
      2 дня назад
      -
      -1
      +
      Mikhail, а как, по-вашему, создать ИСКУССТВЕННЫЙ интеллект? Он сам должен родится, чтобы его назвали искусственным? Человек и напишет ИИ.
        Mikhail Lukashev
        1 день назад
        -
        1
        +
        Kassie, это не интеллект, это алгоритм, написанный нами. Перестаньте уже паразитировать на этом понятии. Мы очень мало знаем о том, как работает наш мозг. Его считаем интеллектом, верно? Я IT-шник, знаю, о чём говорю.
          Mikhail Lukashev
          1 день назад
          -
          1
          +
          Если бы вы писали код, знали бы, как он пишется, на основании чего, у вас бы не было вопросов. ИИ никакого нет. И пока непонятно, как его реализовать.
            Mikhail Lukashev
            1 день назад
            -
            1
            +
            Я тут очень согласен с глубокоуважаемым товарищем Березиным. Мы можем развивать алгоритмы, но как сделать из них Интеллект (всё, что мы вкладываем в это понятие), нам пока неизвестно.
            Иван Колупаев
            1 день назад
            -
            0
            +
            Mikhail, вы знаете как пишется код но не знаете почему он работает не так как вы знаете пишется код? 😁 Ситуация конечно в IT не такая уж редкая но вот эта ваша уверенность немного умиляет.
              Mikhail Lukashev
              19 часов назад
              -
              0
              +
              Иван, нет. По образованию я физик, МИФИ, специальность - физика атомного ядра и частиц. Так что и как работает, представление имею. По вопросу ИИ есть что сказать?
                Иван Колупаев
                11 часов назад
                -
                0
                +
                M., а зачем? У вас уже сформировалась своя точка зрения и по опыту общения с тов. Березиным вас с нее хрен своротишь.
                Mikhail Lukashev
                6 часов назад
                -
                0
                +
                Иван, а по предмету дискуссии есть что ответить?
                Иван Колупаев
                4 часа назад
                -
                0
                +
                Mikhail, ну а вы ответили? 😏 Вы начали трясти корочками. Ладно сыграем на этом поле. Вот вы уверяете что "представление имеете" и на этом основании я неправ. Но и разработчики ИИ говорят что не понимают почему их разработка по алгоритмам которые они в нее заложили работает как-то не так как должна работать по этим алгоритмам. То есть люди которые уж точно в теме говорят, что не все так однозначно, но куда им до вас с Березиным 😁 Может они напрасно не обратились к вам за консультацией? А кстати что такое сознание (ну или интеллект) которого как вы уверяете там точно нет. Ведь чтоб на 100% быть уверенным в отсутствии чего бы то ни было, надо хотя бы знать что это такое? Дайте определение что ли, вы ведь физик, а значит должны уметь это делать.
      Петр Романов
      1 день назад
      -
      1
      +
      Mikhail, вы абсолютно правы! Особенно, если говорить об интеллекте человеческого уровня (ИЧУ). Но тут еще возможна путаница с терминами, особенно английскими - у них ведь есть понятия: intelligence и intellect (да же гугл переводчик переводит эти термины на русский язык одинаково как "интеллект") и еще куча всего. Что понимают под "интеллектом", когда говорят про алгоритмы написанные человеком и выдаваемые за ИИ не понятно. СМИ и создатели этих алгоритмов хайпуют, инвесторы и обыватели не разбираются и пошло-поехало ... Ясно одно что эти алгоритмы и близко не дотягивают до зачатков интеллекта у животных, не говоря уже про human intelligence. И уж точно ничего не могут создать сами, по собственному желанию ибо у них такового нет - задачу им всегда ставит оператор и он же анализирует результат.
Dmitriy
4 дня назад
-
3
+
Все же очевидно, их тренируют на ворованной инфе из сети, сейчас сеть засрана нейронками, вот и происходит деградация. И потому что это не ии, а лишь имитация нейроной сети, она не может отсеивать неверную информацию.
Sergey Grigorev
5 дней назад
-
1
+
Новые модели теперь стали использовать свои данные. Ожидаемо
Ivan Sivkov
5 дней назад
-
1
+
"еще более худший" — но все-таки лучше, чем некоторые копирайтеры)
Предстоящие мероприятия
Сегодня, 09:38
Редакция Naked Science

Квентин Маркос (Quentin Marcos) — концепт-художник и цифровой иллюстратор из Парижа, специализирующийся на создании научно-фантастических миров. Его работы переносят зрителя в далёкие планеты, футуристические города и альтернативные реальности, наполненные захватывающими сюжетами и атмосферной детализацией.

12 часов назад
Полина Меньшова

Ученые из США смогли вырастить зубы, напоминающие человеческие, во рту свиней. Для их создания использовали клетки свиных и человеческих зубов. Как удалось это сделать и как результаты эксперимента могут изменить стоматологию, исследователи описали в новой научной статье.

Позавчера, 20:38
Редакция Naked Science

В 2024 году европейские страны активно наращивали импорт газа из России и в первом квартале 2025-го продолжали поддерживать высокий уровень его потребления. Это произошло, несмотря на запланированный отказ от такого импорта из нашей страны. Все это в комплексе побудило европейские власти отказаться и от будущего запрета на ввоз газа из России.

Сегодня, 09:38
Редакция Naked Science

Квентин Маркос (Quentin Marcos) — концепт-художник и цифровой иллюстратор из Парижа, специализирующийся на создании научно-фантастических миров. Его работы переносят зрителя в далёкие планеты, футуристические города и альтернативные реальности, наполненные захватывающими сюжетами и атмосферной детализацией.

12 часов назад
Полина Меньшова

Ученые из США смогли вырастить зубы, напоминающие человеческие, во рту свиней. Для их создания использовали клетки свиных и человеческих зубов. Как удалось это сделать и как результаты эксперимента могут изменить стоматологию, исследователи описали в новой научной статье.

Позавчера, 20:38
Редакция Naked Science

В 2024 году европейские страны активно наращивали импорт газа из России и в первом квартале 2025-го продолжали поддерживать высокий уровень его потребления. Это произошло, несмотря на запланированный отказ от такого импорта из нашей страны. Все это в комплексе побудило европейские власти отказаться и от будущего запрета на ввоз газа из России.

8 апреля
Березин Александр

До 13 тысяч лет назад в Северной Америке жил вид, который ученые до недавнего времени считали волком. Компания Colossal Biosciences объявила о возрождении этого вымершего вида, но биологические детали ставят ее заявление под серьезное сомнение.

2 апреля
Березин Александр

Известный американский отраслевой обозреватель Эрик Бергер взял интервью у экипажа космического корабля Boeing, из-за технических проблем которого два астронавта задержались на орбите на девять месяцев вместо одной недели. Детали, которые они озвучили, указывают на серьезные проблемы Starliner, о которых ранее умалчивали. Люди провели немало времени при глубоко нештатной температуре. При слегка другом сценарии миссии экипаж корабля мог погибнуть. Официальные заявления NASA и Boeing сразу после июньского полета к МКС, судя по интервью, были заведомо неправдивыми.

16 апреля
Андрей

Многие знают, как популярны сувениры из окаменелостей — зубы древних акул или полированные панцири аммонитов. Но чем реже встречаются такие артефакты, тем они ценнее, то есть на них можно много заработать. И это проблема для палеонтологов. Американский специалист по тираннозаврам оценил ущерб, который нанесла коммерческая добыча костей T. rex и подсчитал среднюю цену таких образцов. Оказалось, больше половины найденных тирексов находится в частных руках, а значит, для науки они недоступны или ненадежны.

[miniorange_social_login]
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно