06.02.2024, 10:44

Полина Меньшова

15,7 тыс

Аспирант доказал, что вековой математический закон способен ускорить обучение ИИ

❋ 6.5

Согласно исследованию Массачусетского технологического института (США), кодирование симметрий поможет языковым моделям обучаться на меньшем количестве данных. Это доказал аспирант, который применил закон Вейля к работе с нейросетями и сформулировал связь между симметричностью данных и размером обучающей выборки.

Технологии

# закон вейля

# искусственный интеллект

# машинное обучение

# нейросети

Кадр из сериала «Теория большого взрыва» / © wbd.com / Автор: Наталья Федосеева

Чтобы языковая модель работала корректно, ее необходимо обучить на достаточном количестве данных (обучающая выборка). Далее алгоритм тестируют на других данных, которые называются валидационной выборкой. Чем меньше нейросеть ошибается на валидации, тем выше точность алгоритма и качественнее результат работы.

Иногда, чтобы обучить алгоритм, нужно большое количество данных. Если они есть, обучение просто занимает много времени. Когда их не хватает, как бывает, например, в вычислительной химии, это напрямую влияет на результаты исследований. Аспирант Массачусетского технологического института Бехруз Тахмасеби (Behrooz Tahmasebi) еще в студенческие годы предположил, что машинное обучение можно рассмотреть в плоскости дифференциальной геометрии.

Закон, который использовал Тахмасеби, больше века назад сформулировал немецкий математик Герман Вейль. Полученную им формулу традиционно применяли к физическим процессам, например к колебанию струны. Аспирант заметил: закон связан с оценкой входных данных (измеряет сложность спектральной информации), однако не учитывает симметрию. Тахмасеби допустил, что адаптированная формула может облегчить машинное обучение.

В соавторстве с доцентом Технического университета Мюнхена (Германия), приглашенным преподавателем МТИ Стефани Джегелкой (Stefanie Jegelka) Тахмасеби сформулировал и доказал теорему, которая демонстрирует линейную зависимость между количеством симметрий во входных данных и скоростью обучения нейросети. Если алгоритм обучается на изображениях, которые можно разделить на две симметричные части, то нейросетевой модели при кодировании симметрий понадобится «запомнить» в два раза меньше информации (половину картинки) и потратить в два раза меньше времени. Если симметричных фрагментов в каждом компоненте выборки 10, то и время обучения нейросети снизится в 10 раз. Точность алгоритма при этом не пострадает или даже увеличится.

С помощью открытия Тахмасеби и Джегелки можно решать и менее очевидные задачи. Допустим, нейросети необходимо выбрать все картинки, на которых есть цифра «3». Если не учитывать симметрии, то алгоритм будет внимателен к ее местонахождению (вверху поля, внизу, по центру, справа и так далее) и положению (перевернута, наклонена). Когда симметричность данных закодируют, модель узнает цифру «3» на изображении вне зависимости от того, как ее на нем разместили.

В научной статье, которую высоко оценили на Конференции по машинному обучению и вычислительной нейронауке и препринт которой доступен на arxiv.org, Тахмасеби и Джегелка сделали еще один значимый вывод. Если использовать многомерную симметрию, преимущество будет экспоненциальным. Вторая теорема исследователей демонстрирует, что это максимальный результат, которого можно достичь. Представленный в работе алгоритм при этом универсален: он применим к любым симметриям — в том числе к тем, которые откроют в будущем.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.

Технологии

# закон вейля

# искусственный интеллект

# машинное обучение

# нейросети

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Удивительные женщины Арабского Востока

Российская государственная библиотека

Москва

Лекция

24 Июн

Бесплатно

Как идеи превращаются в реальное изменение системы

Университет ИТМО

Онлайн

Лекция

24 Июн

Бесплатно

Как русские цари себе жен выбирали

Библиотека роста и карьеры

Санкт-Петербург

Лекция

24 Июн

Бесплатно

Все пилотируемые полеты с рекордным удалением от Земли

Москва

Миры, которые мы не видим: история поиска экзопланет

Московский Планетарий

Москва

Лекция

25 Июн

Бесплатно

От канарейки в доме до ястреба в аэропорту

Московский зоопарк

Москва

Лекция

25 Июн

Бесплатно

Как мозг обманывает. Природа ошибок мышления

Библиотека им. М.А. Светлова

Москва

Лекция

26 Июн

Бесплатно

Амир Тимур и его империя

Российская государственная библиотека

Москва

Лекция

26 Июн

600 ₽

Урарту: между историей, археологией и экспериментом

Центр «Архэ»

Онлайн

Популярное

За сутки

За неделю

За месяц

21 июня, 16:10

Evgenia Vavilova

В джунглях Борнео нашли нового сверхпаразита

Паразитические организмы иногда не учитывают, что сами могут оказаться целью паразита более высокого уровня. Сосредотачивая все свои силы на инфицировании и размножении, они остаются беззащитными перед агрессивным специализированным нахлебником.

Биология

# Борнео

# грибы

# кордицепс

# муравьи

# паразитизм

# паразиты

22 июня, 15:08

ФизТех

Физики нашли «невидимую» для атома тулия длину волны

Группа ученых из МФТИ, Российского квантового центра, ФИАН, МГТУ имени Баумана и НИЯУ МИФИ экспериментально определила длину волны, при которой поляризуемость атома тулия в основном состоянии равна нулю. Лазер с таким излучением практически не взаимодействует с атомами тулия в решетке. Результаты работы могут найти применение в квантовых симуляторах, оптических ловушках и прецизионных измерениях.

ФизТех

# атом

# квантовые технологии

# редкоземельные металлы

# физика

22 июня, 16:15

Губкинский университет

Ультразвук позволил улучшить качество нефти прямо на месторождении

Ученые РГУ нефти и газа (НИУ) имени И. М. Губкина разработали технологию изменения структуры молекул нефти с помощью энергии кавитационных полей, которые создаются при воздействии ультразвука. Технология позволяет облагораживать нефть, меняя ее физико-химические характеристики и снижая долю нежелательных составляющих веществ. Для проведения полевых испытаний ее реализовали в мобильном исполнении с применением управляемых ультразвуковых полей. Разработанное исследовательское оборудование может применяться на любом месторождении, включая удаленные и труднодоступные.

Губкинский университет

# добыча нефти

# нефтепереработка

# нефть

# технологии

# ультразвук

21 июня, 16:10

Evgenia Vavilova

В джунглях Борнео нашли нового сверхпаразита

Биология

# Борнео

# грибы

# кордицепс

# муравьи

# паразитизм

# паразиты

21 июня, 10:23

Николай Цыгикало

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Интригующие испытания высотного ракетного двигателя Raptor Vacuum для корабля Starship, верхней ступени сверхракеты Илона Маска, парадоксальны. Его работа на уровне моря уже сама по себе загадка. Ведь, по классическим представлениям, высотные двигатели на уровне моря корректно не работают. А сопло RaptorVAC на наземном стенде извергает реактивную струю без всяких признаков нарушения работы. Как такое может быть?

Космонавтика

# NASA

# SpaceX

# StarShip

# двигатели

# космос

# ракета

# ракетные двигатели

# США

# технологии

Выбор редакции

22 июня, 15:08

ФизТех

Физики нашли «невидимую» для атома тулия длину волны

ФизТех

# атом

# квантовые технологии

# редкоземельные металлы

# физика

10 июня, 11:51

Александр Березин

Американские ученые заявили о первом в истории создании GPS-помех из космоса — русскими спутниками

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

Оружие и техника

# GPS

# космонавтика

# космос

# спутники

25 мая, 14:00

Андрей Серегин

Правящие семьи в доколумбовом Перу веками практиковали браки между родственниками

В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.

Археология

# Анды

# брак между родственниками

# инки

# раскопки

27 мая, 17:06

Александр Березин

Илон Маск обвинил военных США в использования Starlink на дронах-камикадзе

Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.

Космонавтика

# SpaceX

# Starlink

# космос

# США

[miniorange_social_login]

Аспирант доказал, что вековой математический закон способен ускорить обучение ИИ

По теме

Зеркальный лабиринт алгоритмов: математики объяснили, почему искусственный интеллект деградирует, обучаясь на собственных ошибках

За последние пять лет ИИ стал на девять процентов точнее выявлять рак кожи

Как искусственный интеллект спасет отечественное ЖКХ

Популярное

Комментарии

Последние новости:

Лесной паук создал «баллисту» для охоты на муравьев

Стресс обострил зрение и ускорил принятие решений у шмелей

Опасные для человека бактерии выжили в марсианских условиях

Прыгающий ген впервые поймали за «переездом» между видами

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Жанна д’Арк: как неграмотная девушка определила будущее мира

Они прилетели из чужих миров: как Оумуамуа, комета Борисова и 3I/ATLAS изменили астрономию

Татуированные кочевники: как в России спасают редких соколов-бало́банов

Последние комментарии

Самые обсуждаемые

Большая часть даже Солнечной системы оказалась не проверена на техносигнатуры

Главная ошибка Вашингтона: почему США не смогли победить Иран?

Земля в прошлом могла «заразить» жизнью подледный океан Европы

В джунглях Борнео нашли нового сверхпаразита