Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.
Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Разработчики признались, что не понимают, почему новые ИИ стали ошибаться чаще, чем их предшественники
На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini.

Однако, как показали тесты o3 и o4-mini, по-видимому, сделали значительный шаг назад: они склонны придумывать — или «галлюцинировать» — сильнее, чем их более ранние версии.
По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.
Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда, как o4-mini показала еще более худший результат — 48%.
Хуже того, специалисты компании, похоже, не до конца понимают, причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.
Астрономы рассмотрели редкий пример гравитационной линзы — галактику, которая исказила и увеличила изображения даже не одного, а как минимум двух скрытых за ней объектов. Выяснилось, что они, в свою очередь, позволили обнаружить нечто необычное в самой «линзе»: на окраине этой крупной галактики, похоже, скрывается массивный и плотный сгусток невидимой массы — возможно, темной материи. Если так, то это противоречит представлениям многих ученых о структуре «темного вещества» Вселенной.
Самой большой загадкой пандемии остается так называемый посткоронавирусный синдром. Больные сначала как будто выздоравливают, но спустя некоторое время чувствуют усталость и слабость, одышку и головокружение, страдают память, внимание и работоспособность. Врачи и ученые пока не понимают причин этого состояния, а надежных методов лечения не существует. Исследователи из США узнали, как «длительный» ковид можно было предупредить.
В среднем один мясокомбинат за сутки образует 30 тонн мясных отходов, из которых устаревшие технологии и оборудование позволяют переработать всего 30-50%. Неполная утилизация отходов (субпродукты, туши, просрочка) приводит к серьезному загрязнению окружающей среды. В результате разлагающиеся отходы выделяют токсичные вещества — аммиак, сероводород и нитраты. Чтобы решить проблему, ученые Пермского Политеха разработали новое оборудование и технологию, позволяющую эффективно утилизировать до 90% отходов. Они трансформируются в протеиновую смесь (применяется в спортивном питании, БАДах), технический жир (мыло и глицерин для косметики) и коллаген (пищевая добавка для здорового питания).
Распространено мнение, что, чем чаще пара занимается сексом, тем сильнее каждый из партнеров доволен отношениями. Международная команда исследователей проверила этот тезис.
В 2006 году исследователи из Великобритании объявили, что легендарный антикитерский механизм, древнегреческий «компьютер», мог быть всего лишь игрушкой для демонстрации астрономических явлений. Авторы нового исследования подтвердили это, построив математическую модель на основе данных своих коллег, которая показала, что шестерни устройства заклинивало при запуске. Но несмотря на полученные результаты, ученые пытаются спасти репутацию древнего чуда техники, обвинив предыдущую команду в ряде ошибок.
Бонобо в два раза чаще отказывались участвовать в эксперименте, если получали менее ценную награду, чем сородич. Такая реакция не была связана с разочарованием в человеке — приматы показали врожденное неприятие несправедливости.
До 13 тысяч лет назад в Северной Америке жил вид, который ученые до недавнего времени считали волком. Компания Colossal Biosciences объявила о возрождении этого вымершего вида, но биологические детали ставят ее заявление под серьезное сомнение.
Известный американский отраслевой обозреватель Эрик Бергер взял интервью у экипажа космического корабля Boeing, из-за технических проблем которого два астронавта задержались на орбите на девять месяцев вместо одной недели. Детали, которые они озвучили, указывают на серьезные проблемы Starliner, о которых ранее умалчивали. Люди провели немало времени при глубоко нештатной температуре. При слегка другом сценарии миссии экипаж корабля мог погибнуть. Официальные заявления NASA и Boeing сразу после июньского полета к МКС, судя по интервью, были заведомо неправдивыми.
Многие знают, как популярны сувениры из окаменелостей — зубы древних акул или полированные панцири аммонитов. Но чем реже встречаются такие артефакты, тем они ценнее, то есть на них можно много заработать. И это проблема для палеонтологов. Американский специалист по тираннозаврам оценил ущерб, который нанесла коммерческая добыча костей T. rex и подсчитал среднюю цену таких образцов. Оказалось, больше половины найденных тирексов находится в частных руках, а значит, для науки они недоступны или ненадежны.

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии