Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.
Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Разработчики признались, что не понимают, почему новые ИИ стали ошибаться чаще, чем их предшественники
На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini.

Однако, как показали тесты o3 и o4-mini, по-видимому, сделали значительный шаг назад: они склонны придумывать — или «галлюцинировать» — сильнее, чем их более ранние версии.
По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.
Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда, как o4-mini показала еще более худший результат — 48%.
Хуже того, специалисты компании, похоже, не до конца понимают, причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.
Многие люди по всему миру верят в карму — существование некоей высшей силы, наказывающей за плохие поступки и вознаграждающей за добро. Канадские психологи недавно выявили любопытную особенность, характерную для этого убеждения. Оказалось, что люди склонны объяснять свои успехи «хорошей» кармой, а злоключения других — кармическим наказанием.
Долгое время ученые предполагали, что мегалитические гробницы, возведенные в Ирландии, служили своего рода семейным склепом, там хоронили представителей знати. Авторы нового исследования опровергли эту гипотезу и выяснили, что древние сооружения никак не связаны ни с властью, ни с династиями.
И Лю (Yi Liu) — концепт-дизайнер и цифровой художник из китайского города Далянь. В его работах сочетаются лаконичность формы и выразительная атмосфера, свойственная классической научной фантастике. Художник предпочитает графичный стиль, при этом уделяет большое внимание свету, композиции и настроению.
Инженеры компании UST Inc. разработали передовой рельсовый беспилотник, способный передвигаться на скорости до 500 километров в час. Юнибус U5-75304 предназначен для перевозки пассажиров и может в перспективе заменить среднемагистральную авиацию. Давайте узнаем, как конструктивные особенности обеспечивают продолжительное движение на больших скоростях, комфорт и безопасность пассажирам.
От хронической бессонницы страдают около 20-35% людей, а в пожилом возрасте такие расстройства встречаются почти у каждого второго человека. С кратковременным же недосыпанием из-за графика работы, стресса, слишком долгого пользования гаджетами или других причин сталкивался, наверное, каждый. Международный коллектив ученых с помощью метаанализа обобщил данные прошлых работ о том, как нарушения сна влияют на человеческий мозг, и показал, что постоянные и эпизодические сбои такого рода оставляют разные «следы».
Многие люди по всему миру верят в карму — существование некоей высшей силы, наказывающей за плохие поступки и вознаграждающей за добро. Канадские психологи недавно выявили любопытную особенность, характерную для этого убеждения. Оказалось, что люди склонны объяснять свои успехи «хорошей» кармой, а злоключения других — кармическим наказанием.
До 13 тысяч лет назад в Северной Америке жил вид, который ученые до недавнего времени считали волком. Компания Colossal Biosciences объявила о возрождении этого вымершего вида, но биологические детали ставят ее заявление под серьезное сомнение.
Многие знают, как популярны сувениры из окаменелостей — зубы древних акул или полированные панцири аммонитов. Но чем реже встречаются такие артефакты, тем они ценнее, то есть на них можно много заработать. И это проблема для палеонтологов. Американский специалист по тираннозаврам оценил ущерб, который нанесла коммерческая добыча костей T. rex и подсчитал среднюю цену таких образцов. Оказалось, больше половины найденных тирексов находится в частных руках, а значит, для науки они недоступны или ненадежны.
Инженеры компании Unitsky String Technologies Inc. разработали несколько вариантов транспортно-инфраструктурных комплексов, способных значительно улучшить пассажирское сообщение в городах, расположенных по обеим берегам крупных водных артерий. Обычно такие мегаполисы сталкиваются с необходимостью строительства дорогих капитальных сооружений — шоссейных мостов, что не всегда подъемно для городского бюджета. Решение белорусских инженеров куда менее ресурсоемкое. Для примера возьмем Ростов-на-Дону, где есть запрос на устойчивое сообщение между левобережной частью города с историческим центром.

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии