©2023, Naked Science. Все права защищены. Naked Science, сетевое издание. Свидетельство о регистрации СМИ Эл № ФС77-70708 от 15.08.2017. Редакция не несет ответственности за достоверность информации в рекламных объявлениях. При копировании материалов ссылка на сайт обязательна. Обработка персональных данных осуществляется в соответствии с ФЗ от 27.07.2006 N 152-ФЗ «О персональных данных».Отключить AMP-версию

Рубрика Технологии

Статистик: машинное обучение провоцирует кризис в науке

Многие исследователи для анализа данных используют машинное обучение. Однако, похоже, это стало причиной некоторых проблем.

На недавней научной конференции American Association for the Advancement of Science в Вашингтоне статистик из Университета Райса Дженевера Аллен высказала серьезное предупреждение, что ученые используют алгоритмы машинного обучения для поиска паттернов в данных даже тогда, когда алгоритмы сосредотачиваются на шуме, который невозможно воспроизвести в повторном эксперименте.

«На сегодня у науки есть осознание кризиса воспроизводимости, — говорит Аллен. — Я бы даже рискнула утверждать, что большая его часть связана с применением техник машинного обучения в науке».

Согласно словам Аллен, проблема может возникнуть, когда ученые соберут большой объем геномных данных, а затем для выявления кластеров схожих геномных профилей воспользуются алгоритмами машинного обучения, которые они плохо понимают.

«Часто такие исследования не выглядят неточными, пока не будет выпущен следующий очень крупный набор данных, к которому кто-то снова применит эти техники, и не скажет: “Боже мой, результаты этих двух исследований не совпадают”», — продолжает Аллен.

Она также утверждает, что проблема с машинным обучением в том, что оно ищет закономерности даже там, где их нет и в помине. Она предполагает, что решением станут алгоритмы нового поколения, которые будут лучше справляться с оценкой надежности генерируемых ими же предсказаний.

«Вопрос в том, можем ли мы действительно доверить совершаемые сегодня открытия применению техник машинного обучения к большим наборам данных? — говорит Аллен. — Во многих случаях ответ, скорее всего, будет следующим: “Не без перепроверки”, — но уже ведутся работы над системами машинного обучения нового поколения, которые оценят неточность и воспроизводимость их предсказаний».

Следующая статья Число «плоскоземельщиков» растет из-за YouTube »

Предыдущая статья « Ученые описали девять новых видов древних насекомых

Nikolas Smirnov says:

20.02.2019 at 05:29

Люди тоже постоянно находят закономерности там где их на самом деле нет. Называется Апофения.

Предлагаю на основании этого отказаться от использования людей в науке....