Ученые из Сколтеха разработали подход для агрегации и картирования данных о качестве воды, почвы и воздуха для сельскохозяйственных, промышленных и природоохранных целей. Предложенный алгоритм принимает разрозненные измерения параметров среды — уровней загрязняющих веществ, содержания микроорганизмов — в разных точках заданного региона, прогнозирует их значения и отображает в виде тепловой карты. А еще на основе данных природоохранных стандартов он может выводить единую метрику качества среды и генерировать по ней карту, которая вбирает в себя сразу все параметры.
Исследование опубликовано в Scientific Reports. «Люди разрушают и загрязняют окружающую среду — почву, воду, воздух. Поэтому нужны эффективные способы оценивать и отслеживать ее состояние, чтобы охранять природные ресурсы и оптимально их использовать», — объясняет один из авторов исследования, Полина Трегубова из Сколтеха. Если бы можно было в каждой точке некоторой области взять пробы воды, например, и проанализировать их по каждому параметру, получилась бы идеальная карта, но так, очевидно, не бывает.
«Вместо этого мы заполняем пробелы интерполяцией, то есть программа достраивает недостающие значения, пытаясь „угадать“ их на основании имеющихся данных из окружающих областей», — добавляет первый автор статьи, аспирант Сколтеха Артем Никитин. Путем интерполяции данных алгоритм сначала строит отдельную карту региона на каждый параметр: карту кислотности воды, карту содержания пестицидов и так далее. Каждый «пиксель» на карте — участок в 100 квадратных метров.
На этом работа алгоритма не заканчивается. После того как программа предсказала и визуализировала непрерывное изменение каждого параметра по отдельности, она использует операцию под кодовым названием «хитроумная агрегация данных» для синтеза единой метрики — индекса качества воды (почвы, воздуха и так далее). По нему строится общая карта качества.
«Процедура агрегации отталкивается от санитарных норм и прочих стандартов качества, которые нужно подать на вход алгоритма. В этой статье использовались нормативные документы по воде, но подобные отраслевые или государственные стандарты по сельхозпочвам и любым другим средам тоже можно задействовать, — поясняют ученые. — Прелесть этого решения в его гибкости: его можно масштабировать на любой регион, по которому доступны данные измерений, и любую среду, для которой есть нормативы у ВОЗ, корпораций или на национальном уровне».