Исследователи используют своего рода машинное обучение, известное как анализ настроений, чтобы оценить успехи и неудачи сохранения дикой природы с течением времени. В своем исследовании, появившемся 19 марта в Узоры.- Новый научный журнал открытого доступа от Cell Press. Исследователи оценили тезисы более чем 4000 исследований реинтродукции видов за четыре десятилетия и обнаружили, что в целом мы становимся все лучше и лучше при реинтродукции видов в дикую природу. Они говорят, что машинное обучение может быть использовано в этой и других областях для определения лучших методов и решений из постоянно растущего объема научных исследований.

«Мы хотели извлечь некоторые уроки из обширной литературы по биологии консервации о программах реинтродукции, которые мы могли бы использовать здесь, в Калифорнии, когда мы пытаемся вернуть морских выдр туда, где они не бродили десятилетиями». говорит старший автор Кайл Ван Хоутан (@kylevanhoutan), главный научный сотрудник Аквариума Монтерей Бэй. «Но перед нами стояли миллионы слов и тысячи рукописей. Нам было интересно, как мы можем извлечь из них данные, которые мы могли бы проанализировать, и поэтому обратились к обработке естественного языка».

Обработка естественного языка. это разновидность машинного обучения, которая анализирует строки человеческого языка для извлечения полезной информации, по существу позволяя компьютеру читать документы как человек. Анализ настроений, который исследователи использовали в этой статье, более конкретно рассматривает обученный набор слов, которым была присвоена положительная или отрицательная эмоциональная ценность, чтобы оценить позитивность или негативность текста в целом.

По мнению AI, изучение научных рефератов делает все возможное для сохранения дикой природы.

Исследователи использовали базу данных Web of Science для идентификации 4313 видов исследований по реинтродукции, опубликованных с 1987 по 2016 год с рефератами с возможностью поиска. Затем они использовали несколько «готовых» лексиконов для анализа настроений. Это означало, что словам в них уже был присвоен показатель настроения, основанный на таких вещах, как обзоры фильмов и ресторанов. для построения модели, которая могла бы дать каждому абстракту общее представление. Гол. «Нам не нужно было обучать модели, поэтому после их запуска в течение нескольких часов мы внезапно получили все эти результаты». говорит Ван Хутан. «Оценки дали нам тенденцию с течением времени, и мы могли бы запросить результаты, чтобы увидеть, какое настроение было связано с исследованиями панд, калифорнийских кондоров или коралловых рифов».

READ  Google запрещает Samsung вмешиваться в Android

Тенденции, которые они видели, предполагали больший успех сохранения. «Со временем гораздо меньше неопределенности в оценке настроений в исследованиях, и мы видим, что проекты по реинтродукции становятся более успешными. И это очень важно». говорит он. «Глядя на тысячи исследований, кажется, что мы становимся лучше, и это обнадеживает».

«Если мы собираемся максимизировать наши природоохранные расходы, нам нужно быстро оценить, что работает, а что нет». говорит соавтор исследования Лукас Джоппа, директор по охране окружающей среды в Microsoft. «Машинное обучение, и, в частности, обработка естественного языка, имеет возможность просеивать результаты и проливать свет на истории успеха, которые могут извлечь другие».

Чтобы убедиться, что их результаты были точными, исследователи рассмотрели наиболее распространенные показатели позитивных настроений (и, следовательно, успех сохранения) в своих результатах и ​​нашли такие слова, как «успех», «защитить», «рост», «поддержка», «помощь», "и" выгода "; слова, которые указывали на негативные настроения, были такими, как «угрожать», «потеря», «риск», «угроза», «проблема» и «убить». Эти слова соответствуют тому, что они, как биологи, занимающиеся вопросами сохранения природных ресурсов, обычно используют для обозначения успеха и неудачи в своих собственных исследованиях. Они также обнаружили, что тенденции, описываемые анализом настроений для конкретных программ реинтродукции, которые известны как успехи или неудачи (например, реинтродукция калифорнийского кондора), соответствуют известным результатам.

READ  Microsoft заявляет, что обновления для Windows 10X могут быть установлены за 90 секунд - Morning Tick

Исследователи говорят, что готовый для них анализ настроений работал на удивление хорошо, вероятно потому, что многие слова, используемые в биологии сохранения, являются частью нашей повседневной лексики и поэтому были точно закодированы с соответствующим настроением. В других областях они думают, что необходимо будет проделать дополнительную работу для разработки и обучения модели, которая могла бы точно кодировать чувство более технического, специфичного для области языка и синтаксиса. Другое препятствие, по их словам, заключается в том, что только ограниченное число статей, которые они пытались проанализировать, имели открытый доступ, что означало, что им приходилось оценивать рефераты, а не полные статьи. «Мы действительно просто царапаем поверхность, но это определенно шаг в правильном направлении». говорит Ван Хутан.

Тем не менее, они действительно думают, что это метод, который можно и нужно применять более широко как в биологии сохранения, так и в других областях, чтобы понять огромное количество исследований, которые сейчас проводятся и публикуются. «Так много работы по сохранению на местах остается незамеченным мировым сообществом по сохранению, и этот документ показывает, как машинное обучение может помочь восполнить этот пробел в информации». говорит Джоппа.

READ  Как Платить NFC Xiaomi

«Многие из этих методов уже более десяти лет используются в коммерческих условиях, но мы надеемся перевести их в такие среды, как наша, для борьбы с изменением климата или пластического загрязнения или для содействия сохранению исчезающих видов». говорит Ван Хутан. «Существует множество данных, которые находятся у нас под рукой, но это спящий гигант, потому что он не должным образом курирован или организован, что затрудняет анализ. Мы хотим связать людей с идеями, возможностями и техническими решениями, которые они могут не иначе столкнуться, чтобы мы могли принести некоторый прогресс в эти, казалось бы, неразрешимые проблемы ".