УДК [556.555:574.5]:51-7
AGRIS M40

Применение алгоритма Isolation Forest для обоснования уникальности водоемов в группе карстовых озер

Работа выполнена в рамках проекта РФФИ 20-05-00303\20

Применение алгоритма Isolation Forest для обоснования уникальности водоемов в группе карстовых озер
©Расулова А. М., ORCID: 0000-0003-4400-2000, SPIN-код: 3888-6462, канд. ф.-м. наук, Санкт-Петербургский Федеральный исследовательский центр РАН, г. Санкт-Петербург, Россия, ARasulova@gmail.com
©Измайлова А. В., ORCID: 0000-0003-1705-6863, SPIN-код: 9660-9805, д-р геогр. наук, Санкт-Петербургский Федеральный исследовательский центр РАН, Государственный гидрологический институт, г. Санкт-Петербург, Россия, ianna64@mail.ru

Аннотация. Совершенствование научных основ развития и расширения сети особо охраняемых природных территорий требует поиска алгоритмов, которые можно было бы использовать для выявления уникальных экосистем. Алгоритмизация процесса идентификации аномалий предоставляет возможность не только обрабатывать большие массивы данных, но и приводит к получению объективных и сопоставимых между собой оценок. Целью настоящего исследования является выявление наиболее оптимальных механизмов для идентификации аномальных значений среди морфометрических характеристик карстовых озер, которые могут свидетельствовать об уникальности всей озерной экосистемы. В рамках данной статьи исследование проводилось на основе математического анализа выборок, построенных по различным признакам на основе базы данных WORLDLAKE. В качестве методов анализа были использованы статистические методы и алгоритм машинного обучения «Изолированный лес» (Isolation Forest (iForest)). В результате применения алгоритма iForest к выборке морфометрических параметров карстовых озер, состоящей из 738 объектов, были выявлены 43 аномальных водоема. Экспертная оценка итогового набора озер на предмет уникальности их экосистем показала, что выбранный метод идентификации аномальных значений хорошо подходит для поставленной задачи. Многие озера с индексом аномальности выше 60% могут быть признаны уникальными благодаря необычности своих абиотических характеристик, ряд обладает и своеобразной биотой. В аномальные объекты попали такие хорошо известные озера, как Церик-Кель, Чрвено, Салда, Трихонис, Вегоритис, Петрон и др. При этом для большинства из них аномалии были выявлены сразу для нескольких параметров. Таким образом примененный алгоритм для выявления аномальных морфометрических характеристик озерных котловин, позволил получить интересные выборки для дальнейшего экспертного анализа всей озерной экосистемы на предмет ее уникальности.

Ключевые слова: озерная экосистема, уникальные озера, идентификация аномалий, карстовые озера, изолированный лес, дерево решений.

Application of the Isolation Forest Algorithm to Substantiate the Uniqueness of Water Bodies in the Group of Karst Lakes
©Rasulova A., ORCID: 0000-0003-4400-2000, SPIN-code: 3888-6462, Ph.D., St. Petersburg Federal Research Center of the Russian Academy of Sciences, St. Petersburg, Russia, ARasulova@gmail.com
©Izmailova A., ORCID: 0000-0003-1705-6863, SPIN-code: 9660-9805, Dr. habil., St. Petersburg Federal Research Center of the Russian Academy of Sciences, State Hydrological Institute, St. Petersburg, Russia, ianna64@mail.ru

Abstract. Improving the scientific foundations for the development and expansion of the network of specially protected natural areas requires the search for algorithms that could be used to identify unique ecosystems. Algorithmization of the anomaly identification process provides an opportunity not only to process large amounts of data but also leads to obtaining objective and comparable estimates. The purpose of this research is to identify the most optimal mechanisms for identifying anomalous values for the morphometric characteristics of karst lakes, which may indicate the uniqueness of the entire lake ecosystem. Within the framework of this article, the study was carried out based on a mathematical analysis of samples built for various characteristics based on the WORLDLAKE database. Statistical methods and the Isolation Forest (iForest) machine learning algorithm were used as methods of analysis. As a result of applying the iForest algorithm to a sample of morphometric parameters of karst lakes, consisting of 738 objects, 43 anomalous water bodies were identified. An expert assessment of the final set of lakes for the uniqueness of their ecosystems showed that the chosen method for identifying anomalous values is well suited for the task at hand. Many lakes with an anomaly index above 60% can be recognized as unique due to the unusualness of their abiotic characteristics; a number of them also have a peculiar biota. The anomalous objects included such well-known lakes as Tserik-Kol’, Crveno, Salda Lake, Trihonida, Vegoritida, Petron, etc. Moreover, for most of them, anomalies were detected for several parameters at once. Thus, the applied algorithm for identifying anomalous morphometric characteristics of lakes made it possible to obtain interesting samples for further expert analysis of the entire lake ecosystem for its uniqueness.

Keywords: lake ecosystem, unique lakes, identification of anomalies, karst lakes, Isolated Forest, decision tree.

Ссылка для цитирования:

Расулова А. М., Измайлова А. В. Применение алгоритма Isolation Forest для обоснования уникальности водоемов в группе карстовых озер // Бюллетень науки и практики. 2021. Т. 7. №11. С. 63-79. https://doi.org/10.33619/2414-2948/72/08

Cite as (APA):

Rasulova, A., & Izmailova, A. (2021). Application of the Isolation Forest Algorithm to Substantiate the Uniqueness of Water Bodies in the Group of Karst Lakes. Bulletin of Science and Practice, 7(11), 63-79. (in Russian). https://doi.org/10.33619/2414-2948/72/08