Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.
Инфографика: затраты на обучение больших языковых моделей
Обучение продвинутых больших языковых моделей искусственного интеллекта, таких как ChatGPT компании OpenAI и Gemini Ultra от Google, требует миллионов долларов, причем затраты быстро растут.

На инфографике, представленной выше, показан рост затрат на обучение моделей искусственного интеллекта, основанный на отчете Стэнфордского университета за 2024 год.
В прошлом году стоимость обучения GPT-4 оценивалась в 78,4 миллиона долларов, что значительно превышает стоимость модели PaLM (540B) от Google , которая стоила 12,4 миллиона долларов всего годом ранее.
Для сравнения: стоимость обучения Transformer, ранней модели искусственного интеллекта, разработанной в 2017 году, составила всего 930 долларов. Кстати, эта модель играет основополагающую роль в формировании архитектуры многих крупных языковых моделей, используемых сегодня.
Модель искусственного интеллекта Google Gemini Ultra стоит еще дороже — ошеломляющие 191 миллион долларов. По состоянию на начало 2024 года модель превосходит GPT-4 по нескольким показателям, в первую очередь по тесту массового многозадачного понимания языка (MMLU). Этот тест служит важнейшим критерием для оценки возможностей больших языковых моделей. Например, он известен тем, что оценивает знания и навыки решения проблем в 57 предметных областях.
Учитывая эти проблемы, компании, занимающиеся искусственным интеллектом, находят новые решения для обучения языковых моделей и для борьбы с растущими затратами.
Они включают в себя ряд подходов, таких как создание моделей меньшего размера, предназначенных для выполнения конкретных задач. Другие компании экспериментируют с созданием собственных синтетических данных для использования в системах искусственного интеллекта. Однако явного прорыва пока не видно.
Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.
Астрономы впервые использовали гравитационные волны, чтобы косвенно оценить параметры одного из ключевых процессов термоядерного горения в массивных светилах. Именно от него зависит, какие звезды взрываются, какие превращаются в черные дыры и как во Вселенной появляются углерод и кислород — элементы, без которых не было бы ни планет, ни жизни.
Десятого мая 1940 года вермахт пришел в движение. Через 42 суток англо-французские армии были разгромлены, а Франция капитулировала. Как это произошло, ведь союзники имели больше солдат, танков и пушек, чем немцы? В СССР причиной посчитали нежелание французов воевать, немцы же, говорили советские военные, не внесли в стратегию ничего нового. Реальность была строго обратной: разгром Франции был новым словом в войне, и такой же сценарий Гитлер применил против СССР через год. Что именно произошло и отчего советское руководство не смогло осознать случившееся?
Метеорный поток Эта-Аквариды достигнет своего максимума в ночь с 5 на 6 мая. Его частицы — осколки самой знаменитой кометы в истории, которая появляется над Землей раз в 76 лет. Ученый Пермского Политеха рассказал, как этот звездопад связан с кометой Галлея, почему у него есть «брат-близнец» и где лучше всего за ним наблюдать.
Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.
Астрономы впервые использовали гравитационные волны, чтобы косвенно оценить параметры одного из ключевых процессов термоядерного горения в массивных светилах. Именно от него зависит, какие звезды взрываются, какие превращаются в черные дыры и как во Вселенной появляются углерод и кислород — элементы, без которых не было бы ни планет, ни жизни.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
Термоядерные электростанции не смогут конкурировать по цене с возобновляемыми источниками энергии из-за медленного удешевления технологии. По расчетам, расходы на каждую новую установку падали максимум на 8% — много раз ниже ранних ожиданий венчурных инвесторов. Это перечеркивает экономический смысл финансовых вливаний, и мир может никогда не увидеть дешевой термоядерной энергии.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии