Статистик: машинное обучение провоцирует кризис в науке
Многие исследователи для анализа данных используют машинное обучение. Однако, похоже, это стало причиной некоторых проблем.
На недавней научной конференции American Association for the Advancement of Science в Вашингтоне статистик из Университета Райса Дженевера Аллен высказала серьезное предупреждение, что ученые используют алгоритмы машинного обучения для поиска паттернов в данных даже тогда, когда алгоритмы сосредотачиваются на шуме, который невозможно воспроизвести в повторном эксперименте.
«На сегодня у науки есть осознание кризиса воспроизводимости, — говорит Аллен. — Я бы даже рискнула утверждать, что большая его часть связана с применением техник машинного обучения в науке».
Согласно словам Аллен, проблема может возникнуть, когда ученые соберут большой объем геномных данных, а затем для выявления кластеров схожих геномных профилей воспользуются алгоритмами машинного обучения, которые они плохо понимают.
«Часто такие исследования не выглядят неточными, пока не будет выпущен следующий очень крупный набор данных, к которому кто-то снова применит эти техники, и не скажет: “Боже мой, результаты этих двух исследований не совпадают”», — продолжает Аллен.
Она также утверждает, что проблема с машинным обучением в том, что оно ищет закономерности даже там, где их нет и в помине. Она предполагает, что решением станут алгоритмы нового поколения, которые будут лучше справляться с оценкой надежности генерируемых ими же предсказаний.
«Вопрос в том, можем ли мы действительно доверить совершаемые сегодня открытия применению техник машинного обучения к большим наборам данных? — говорит Аллен. — Во многих случаях ответ, скорее всего, будет следующим: “Не без перепроверки”, — но уже ведутся работы над системами машинного обучения нового поколения, которые оценят неточность и воспроизводимость их предсказаний».
Ученые РТУ МИРЭА и Сибирского федерального университета создали программный комплекс, который анализирует учебные планы вузов быстрее секунды и находит в них слабые места. Большинство учебных планов содержат скрытые противоречия, дублирования и неочевидные перекосы в подготовке специалистов. Это важно, потому что от качества учебного плана напрямую зависит, какие реальные навыки получат студенты и насколько они будут востребованы работодателями.
Около четырех миллиардов лет назад Солнечная система пребывала в хаосе: гигантские планеты сближались, меняли орбиты и выбрасывали своих соседей в межзвездное пространство. Хотя шансы на «выживание» лун Юпитера и Урана в этот период были крайне малы, астрономы показали, что их судьба может хранить следы древней катастрофы с участием «потерянной» планеты.
Исследователи опросили более 60 тысяч испытуемых из разных стран и выяснили: чем больше человек зациклен на себе, тем холоднее он к своему партнеру. Правда, снижение накала страстей не всегда плохо, у этого есть и положительные стороны.
Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.
Исследователи опросили более 60 тысяч испытуемых из разных стран и выяснили: чем больше человек зациклен на себе, тем холоднее он к своему партнеру. Правда, снижение накала страстей не всегда плохо, у этого есть и положительные стороны.
Провинция Цзянсу была процветающим центром медицинской практики в Китае во времена династии Мин (1368-1644 годы нашей эры). Микроскопический анализ крошечных частиц на поверхности хирургических ножниц и пинцета из гробницы китайского врача помог выявить следы вещества, получаемого из ядовитого растения, которое, по мнению исследователей, применялось как местная анестезия во время операций.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии