Ученые продемонстрировали, что популярная нейросеть Segment Anything Model (SAM), разработанная для распознавания объектов на фотографиях, способна эффективно выделять сигналы китов из сейсмических данных, не имея предварительной подготовки на аудиозаписях этих животных. 

В ходе тестирования система идентифицировала вокализацию китов Брайда с точностью, превышающей 96 процентов.

Исследование провела группа экспертов под руководством Чжо Сяо из Университета Гуанси Миньцзу, а его результаты опубликованы в журнале Seismological Research Letters. 

Авторы предложили необычный подход: звуковые сигналы китов преобразовываются в спектрограммы — визуальные графики изменения частоты звука во времени, которые нейросеть, специализирующаяся на поиске объектов, может анализировать как обычные изображения.

Для проверки гипотезы исследователи использовали данные сейсмической станции на острове Сеян, расположенном в заливе Бэйбу Южно-Китайского моря. Были проанализированы записи за январь и июль 2021 года, чтобы учесть сезонные особенности вокализации китов Брайда в этой ключевой кормовой акватории.

Как нейросеть выделяет китов из шума

Перед подачей данных в модель информация проходила многоступенчатую очистку от помех, включавшую спектральное вычитание, гауссово сглаживание и адаптивную фильтрацию. 

После подготовки система не просто определяла наличие или отсутствие сигнала, а точно выделяла на спектрограмме границы каждого отдельного крика кита. 

Как отмечают авторы, модель не только обнаружила более 96 процентов сигналов, но и выявила эпизоды, пропущенные при ручном анализе, а также успешно избежала части ложных срабатываний.

«Система правильно обнаруживала сигналы более чем в 96% случаев по всем сезонным наборам данных, при этом ей удалось выявить некоторые эпизоды, которые ранее были пропущены при ручном анализе записей», — сообщают авторы исследования.

Дополнительная проверка показала, что подход работает не только для китов Брайда. 

Исследователи успешно протестировали систему на записях финвалов из Ирландии и синих китов из Канады; после адаптации параметров метод сохранил высокую эффективность, что указывает на его универсальность для различных видов китообразных и морских регионов.

Сезонные ритмы и перспективы технологии

Анализ собранных данных выявил выраженные сезонные различия в поведении китов Брайда: зимой средний интервал между двумя акустическими импульсами в их сигналах составлял 6,93 секунды, тогда как летом он увеличивался до 11,70 секунды. 

Авторы полагают, что это может отражать более активную координацию между животными в зимний период и более одиночный характер коммуникации летом.

Исследователи подчеркивают, что технология все еще допускает ложные срабатывания и пропуски, но в будущем планируют объединить акустические и сейсмические наблюдения с океанографическими данными, а также создать специализированную версию модели для распознавания сигналов китов. 

Эта работа подтверждает, что современные универсальные ИИ-модели способны находить применение далеко за пределами изначальных задач: инструмент для анализа изображений стал помощником в мониторинге популяций китов — одной из ключевых задач морской экологии и охраны млекопитающих.