Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.
Инфографика: затраты на обучение больших языковых моделей
Обучение продвинутых больших языковых моделей искусственного интеллекта, таких как ChatGPT компании OpenAI и Gemini Ultra от Google, требует миллионов долларов, причем затраты быстро растут.

На инфографике, представленной выше, показан рост затрат на обучение моделей искусственного интеллекта, основанный на отчете Стэнфордского университета за 2024 год.
В прошлом году стоимость обучения GPT-4 оценивалась в 78,4 миллиона долларов, что значительно превышает стоимость модели PaLM (540B) от Google , которая стоила 12,4 миллиона долларов всего годом ранее.
Для сравнения: стоимость обучения Transformer, ранней модели искусственного интеллекта, разработанной в 2017 году, составила всего 930 долларов. Кстати, эта модель играет основополагающую роль в формировании архитектуры многих крупных языковых моделей, используемых сегодня.
Модель искусственного интеллекта Google Gemini Ultra стоит еще дороже — ошеломляющие 191 миллион долларов. По состоянию на начало 2024 года модель превосходит GPT-4 по нескольким показателям, в первую очередь по тесту массового многозадачного понимания языка (MMLU). Этот тест служит важнейшим критерием для оценки возможностей больших языковых моделей. Например, он известен тем, что оценивает знания и навыки решения проблем в 57 предметных областях.
Учитывая эти проблемы, компании, занимающиеся искусственным интеллектом, находят новые решения для обучения языковых моделей и для борьбы с растущими затратами.
Они включают в себя ряд подходов, таких как создание моделей меньшего размера, предназначенных для выполнения конкретных задач. Другие компании экспериментируют с созданием собственных синтетических данных для использования в системах искусственного интеллекта. Однако явного прорыва пока не видно.
Анализ более 150 тысяч древних звезд Млечного Пути показал, что возраст космоса, судя по всему, близок к 13,8 миллиарда лет. Авторы нового исследования заключили, что сценарии, в которых Вселенную приходится делать заметно «моложе» ради решения хаббловского кризиса, плохо согласуются с наблюдениями. Это важно, поскольку возраст старейших светил — один из немногих независимых способов проверить космологические модели не по данным ранней Вселенной, а по объектам нашей собственной Галактики.
Мы много знаем о том, как цивилизации до нас строили дома и дороги, но с объектами материальной культуры дела обстоят сложнее. Ремесленные техники часто хранились в строгом секрете и могли быть случайно утрачены при неудачном стечении обстоятельств. Так случилось с ювелирной техникой цзинь чжэ сы.
Японские исследователи выловили у берегов Окинавы пластиковую бутылку с узким горлышком, внутри которой сидел большой живой краб. В итоге ученые смогли найти ответы на несколько возникших в связи с этой находкой вопросов: как краб попал в бутылку, сколько там находился и как ему удалось выжить?
Ученые Южного федерального университета исследовали новую светочувствительную молекулу и обнаружили, что она ведет себя совсем не так, как ожидалось. Благодаря необычным свойствам она может стать основой для создания умных материалов, сенсоров и лекарств, которые будут активироваться светом именно там, где нужно, например, для борьбы с опасными бактериями.
Авторы нового исследования провели сравнительный анализ видов паукообразных и выяснили, какие эволюционные и биомеханические факторы делают одних пауков быстрыми, а других — медленными. Параллельно ученые выделили из этой группы рекордсмена по скорости перемещения.
Сотрудники факультета экономических наук НИУ ВШЭ показали, что точность прогноза рождаемости в России можно улучшить почти в полтора раза, если добавить в модель динамику поисковых запросов по темам, связанным с беременностью и родами. В наиболее эффективных моделях ошибка прогноза снижается с 4,6 до 3,2%.
Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.
Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.
Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии