Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.
Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Простой логический вопрос поставил в тупик даже самый продвинутый ИИ
Исследователи из некоммерческой организации по исследованию искусственного интеллекта LAION показали, что даже самые сложные большие языковые модели (LLM) можно поставить в тупик простым вопросом.

В статье, которая еще не прошла рецензирование, исследователи рассказали, как задавали разным моделям генеративного ИИ вопрос: «У Алисы есть [X] братьев, а также [Y] сестры. Сколько сестер у брата Алисы?».
Ответить не столь сложно. Например, у Алисы три брата и две сестры, значит, у каждого из братьев две сестры плюс сама Алиса. Таким образом, у каждого брата по три сестры.
Специалисты тестировали модели компании OpenAI: GPT-3, GPT-4 и GPT-4o; Anthropic Claude 3 Opus, Gemini от Google и модели Llama компании Meta*, а также Mextral от Mistral AI, Dbrx от Mosaic и Command R+ от Coher. Когда ИИ задали вопрос, то оказалось, что он явно не оправдывает ожиданий.
Только одна модель, новая GPT-4o, добилась успеха в логическом тесте. Остальные не могли понять, что Алиса тоже сестра каждого из братьев в ее семье.
* Деятельность Meta (соцсети Facebook и Instagram) запрещена в России как экстремистская.
Рыжие кошки давно привлекали внимание генетиков: большинство из них — самцы, среди самок такой окрас встречается значительно реже. Точку в этом вопросе поставили исследователи из Японии, обнаружив мутацию, отвечающую за рыжий окрас у домашних кошек.
Американцу Оскару Ларрайнсарe 41 год. Семь лет он жил с мочевым пузырем размером с грецкий орех, пока команда американских хирургов из Южной Калифорнии не совершила невозможное. Сегодня мужчина впервые за долгие годы смог ощутить, что значит жить полноценно.
Животные давно демонстрируют биологам особенности поведения, отличающие одних особей от других, — это называют индивидуальностью, кто-то робкий и не так хорош в охоте, а кто-то быстрее других умеет добывать ядра орехов. Если у высших животных вроде приматов такие черты характера могут сохраняться по мере развития, то у не столь продвинутых это неочевидно. Биологи проверили индивидуальность у социальных пауков, но она оказалась короткоживущей.
Экс-спикер Минобороны Армении Арцрун Ованнисян в эфире армянского Общественного телевидения решил «развеять миф» о Второй мировой войне. В частности, он заявил, что выигрыш Сталинградской битвы был не спасением для страны. Напротив, если бы немцы победили, уверен он, была бы создана объединенная историческая Армения — куда вошли бы земли, сегодня удерживаемые Турцией. Так ли все было на самом деле?
Споры вокруг выделения антропоцена в самостоятельную геологическую эпоху не утихли после официального отказа Международного союза геологических наук, наоборот, разожглись сильнее. Шведские геологи, придерживаясь логики союза, решили оценить легитимность других периодов кайнозойской эры и выяснили, что доказательства в пользу голоцена слабее, чем у антропоцена. Если идти дальше, то и половину ступеней кайнозоя можно откинуть.
Рыжие кошки давно привлекали внимание генетиков: большинство из них — самцы, среди самок такой окрас встречается значительно реже. Точку в этом вопросе поставили исследователи из Японии, обнаружив мутацию, отвечающую за рыжий окрас у домашних кошек.
Да, с волосами и люком все так. У космонавта Суниты Уильямс волосы на МКС плавали свободно, а у Кэти Пэрри и прочих в полете 14 апреля 2025 года — нет. Но это не значит, что суборбитального космического полета первого чисто женского экипажа не было или что он был инсценировкой. Причем, в общем-то, чтобы понять это, даже не нужно обладать специальными знаниями.
Мощнейшее отключение электроэнергии за последние 20 лет истории Европы случилось уже неделю назад, а испанские власти пока так и не объявили о его причинах. Это логично: как мы покажем ниже, ответ на вопрос, кто виноват, получится очень неполиткорректным. И, более того, противоречащим линии правящей в Испании партии. Но мы живем за тысячи километров от нее, поэтому можем себе позволить аполитичный анализ случившегося. Так что же произошло на самом деле и каковы наши шансы увидеть подобное у себя дома?
Инженеры компании UST Inc. разработали передовой рельсовый беспилотник, способный передвигаться на скорости до 500 километров в час. Юнибус U5-75304 предназначен для перевозки пассажиров и может в перспективе заменить среднемагистральную авиацию. Давайте узнаем, как конструктивные особенности обеспечивают продолжительное движение на больших скоростях, комфорт и безопасность пассажирам.

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии