• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Инфографика: затраты на обучение больших языковых моделей

Обучение продвинутых больших языковых моделей искусственного интеллекта, таких как ChatGPT компании OpenAI и Gemini Ultra от Google, требует миллионов долларов, причем затраты быстро растут.

Затраты на обучение больших языковых моделей / © visualcapitalist
Затраты на обучение больших языковых моделей / © visualcapitalist

На инфографике, представленной выше, показан рост затрат на обучение моделей искусственного интеллекта, основанный на отчете Стэнфордского университета за 2024 год.

В прошлом году стоимость обучения GPT-4 оценивалась в 78,4 миллиона долларов, что значительно превышает стоимость модели PaLM (540B) от Google , которая стоила 12,4 миллиона долларов всего годом ранее.

Для сравнения: стоимость обучения Transformer, ранней модели искусственного интеллекта, разработанной в 2017 году, составила всего 930 долларов. Кстати, эта модель играет основополагающую роль в формировании архитектуры многих крупных языковых моделей, используемых сегодня.

Модель искусственного интеллекта Google Gemini Ultra стоит еще дороже — ошеломляющие 191 миллион долларов. По состоянию на начало 2024 года модель превосходит GPT-4 по нескольким показателям, в первую очередь по тесту массового многозадачного понимания языка (MMLU). Этот тест служит важнейшим критерием для оценки возможностей больших языковых моделей. Например, он известен тем, что оценивает знания и навыки решения проблем в 57 предметных областях.

Учитывая эти проблемы, компании, занимающиеся искусственным интеллектом, находят новые решения для обучения языковых моделей и для борьбы с растущими затратами.

Они включают в себя ряд подходов, таких как создание моделей меньшего размера, предназначенных для выполнения конкретных задач. Другие компании экспериментируют с созданием собственных синтетических данных для использования в системах искусственного интеллекта. Однако явного прорыва пока не видно.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

Написать комментарий
Предстоящие мероприятия
4 июля, 09:30
Любовь С.

Анализ более 150 тысяч древних звезд Млечного Пути показал, что возраст космоса, судя по всему, близок к 13,8 миллиарда лет. Авторы нового исследования заключили, что сценарии, в которых Вселенную приходится делать заметно «моложе» ради решения хаббловского кризиса, плохо согласуются с наблюдениями. Это важно, поскольку возраст старейших светил — один из немногих независимых способов проверить космологические модели не по данным ранней Вселенной, а по объектам нашей собственной Галактики.

4 июля, 17:28
Evgenia Vavilova

Мы много знаем о том, как цивилизации до нас строили дома и дороги, но с объектами материальной культуры дела обстоят сложнее. Ремесленные техники часто хранились в строгом секрете и могли быть случайно утрачены при неудачном стечении обстоятельств. Так случилось с ювелирной техникой цзинь чжэ сы.

3 июля, 12:20
Татьяна Зайцева

Японские исследователи выловили у берегов Окинавы пластиковую бутылку с узким горлышком, внутри которой сидел большой живой краб. В итоге ученые смогли найти ответы на несколько возникших в связи с этой находкой вопросов: как краб попал в бутылку, сколько там находился и как ему удалось выжить?

29 июня, 13:56
ЮФУ

Ученые Южного федерального университета исследовали новую светочувствительную молекулу и обнаружили, что она ведет себя совсем не так, как ожидалось. Благодаря необычным свойствам она может стать основой для создания умных материалов, сенсоров и лекарств, которые будут активироваться светом именно там, где нужно, например, для борьбы с опасными бактериями.

1 июля, 09:42
Игорь Байдов

Авторы нового исследования провели сравнительный анализ видов паукообразных и выяснили, какие эволюционные и биомеханические факторы делают одних пауков быстрыми, а других — медленными. Параллельно ученые выделили из этой группы рекордсмена по скорости перемещения.

30 июня, 10:59
НИУ ВШЭ

Сотрудники факультета экономических наук НИУ ВШЭ показали, что точность прогноза рождаемости в России можно улучшить почти в полтора раза, если добавить в модель динамику поисковых запросов по темам, связанным с беременностью и родами. В наиболее эффективных моделях ошибка прогноза снижается с 4,6 до 3,2%.

10 июня, 11:51
Александр Березин

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

25 июня, 16:20
Любовь С.

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

25 июня, 15:09
Марк Чернов

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

[miniorange_social_login]