Теперь биологи и ML-специалисты по всему миру смогут использовать нейросеть для разработки собственных систем мониторинга водоемов и отслеживать важные экологические тренды.
В открытый доступ выложены датасеты, модели машинного обучения и документация для мониторинга. Такой набор поможет тестировать гипотезы по детекции, сегментации и классификации объектов в разных научных проектах. В частности разработчики смогут выявлять проблемы в балансе микроорганизмов водных объектов, и следовательно — помогать сохранять водоемы в неизменном состоянии дольше.
Изначально нейросеть разрабатывалась для проекта «Точка №1», который длится с 1945 года. Ученые НИИ биологии Иркутского государственного университета более 75 лет анализируют фито- и зоопланктон Байкала для мониторинга состояния озера вручную. Нейросеть помогла автоматизировать и ускорить весь цикл исследований. Сейчас алгоритм умеет работать с 70 формами планктона и продолжает обучаться в облачном сервисе для разработки и эксплуатации ML-алгоритмов Yandex DataSphere. В создании технологии также участвовали компания MaritimeAI и Фонд поддержки прикладных экологических разработок и исследований «Озеро Байкал».
«Доступность технологий — один из наших ключевых приоритетов. Яндекс не только систематически выкладывает в опенсорс свои собственные решения, но и помогает развивать открытый исходный код в совместных проектах со сторонними разработчиками. Яндекс является лидером среди российских компаний по вкладу в опенсорс, по данным ossindex. Публикуя алгоритм экомониторинга с MaritimeAI, мы продолжаем следовать нашим главным принципам. Разработка поможет не просто решить задачу конкретной научной группы, а тестировать гипотезы о состоянии водных объектов повсюду. Ведь Байкал — далеко не единственное место на планете, где ведется подобный мониторинг», — рассказал Алексей Башкеев, руководитель платформы Yandex Cloud.
Алгоритм опубликован на GitHub по открытой лицензии Apache 2.0.