Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.
Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Разработчики признались, что не понимают, почему новые ИИ стали ошибаться чаще, чем их предшественники
На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini.

Однако, как показали тесты o3 и o4-mini, по-видимому, сделали значительный шаг назад: они склонны придумывать — или «галлюцинировать» — сильнее, чем их более ранние версии.
По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.
Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда, как o4-mini показала еще более худший результат — 48%.
Хуже того, специалисты компании, похоже, не до конца понимают, причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.
Квентин Маркос (Quentin Marcos) — концепт-художник и цифровой иллюстратор из Парижа, специализирующийся на создании научно-фантастических миров. Его работы переносят зрителя в далёкие планеты, футуристические города и альтернативные реальности, наполненные захватывающими сюжетами и атмосферной детализацией.
Давно известно, что общение со взрослыми полезнее для развития речи, чем просмотр мультфильмов. Но есть ли разница между чтением вживую и с экрана? Ученые из США нашли ответ на этот вопрос.
Несколько дней назад террористы из Пакистана убили 26 человек в индийской части Кашмира. Это подлило масла в огонь тлеющего кашмирского конфликта: Индия обвинила в теракте пакистанскую сторону, та, как обычно, все отрицает. Наказать самих террористов Дели очень сложно, поэтому есть риск, что вместо них удары будут нанесены по приграничным пакистанским солдатам, как это уже бывало в прошлом. Разгорится ли война в этот раз?
Квентин Маркос (Quentin Marcos) — концепт-художник и цифровой иллюстратор из Парижа, специализирующийся на создании научно-фантастических миров. Его работы переносят зрителя в далёкие планеты, футуристические города и альтернативные реальности, наполненные захватывающими сюжетами и атмосферной детализацией.
Ученые из США смогли вырастить зубы, напоминающие человеческие, во рту свиней. Для их создания использовали клетки свиных и человеческих зубов. Как удалось это сделать и как результаты эксперимента могут изменить стоматологию, исследователи описали в новой научной статье.
Тренд на энергоэффективность охватывает все сферы — от строительства до техники. Особенно перспективным направлением становятся технологии накопления тепла, среди которых – грунтовые аккумуляторы. Белорусские инженеры создали лабораторный образец и математическую модель. Исследование открывает путь к масштабированию технологии и ее интеграции в транспортно-инфраструктурные комплексы uST, разработкой которых занимается международная инжиниринговая компания Unitsky String Technologies Inc.
До 13 тысяч лет назад в Северной Америке жил вид, который ученые до недавнего времени считали волком. Компания Colossal Biosciences объявила о возрождении этого вымершего вида, но биологические детали ставят ее заявление под серьезное сомнение.
Известный американский отраслевой обозреватель Эрик Бергер взял интервью у экипажа космического корабля Boeing, из-за технических проблем которого два астронавта задержались на орбите на девять месяцев вместо одной недели. Детали, которые они озвучили, указывают на серьезные проблемы Starliner, о которых ранее умалчивали. Люди провели немало времени при глубоко нештатной температуре. При слегка другом сценарии миссии экипаж корабля мог погибнуть. Официальные заявления NASA и Boeing сразу после июньского полета к МКС, судя по интервью, были заведомо неправдивыми.
Многие знают, как популярны сувениры из окаменелостей — зубы древних акул или полированные панцири аммонитов. Но чем реже встречаются такие артефакты, тем они ценнее, то есть на них можно много заработать. И это проблема для палеонтологов. Американский специалист по тираннозаврам оценил ущерб, который нанесла коммерческая добыча костей T. rex и подсчитал среднюю цену таких образцов. Оказалось, больше половины найденных тирексов находится в частных руках, а значит, для науки они недоступны или ненадежны.

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии