
Nowe narzędzie Google do badania mowy delfinów
Google, we współpracy z Georgia Institute of Technology oraz Wild Dolphin Project (WDP), opracowało model sztucznej inteligencji DolphinGemma, którego celem jest analiza i zrozumienie komunikacji delfinów. Dzięki niemu możliwe będzie przybliżenie się do koncepcji komunikacji międzygatunkowej. Projekt został ogłoszony przy okazji National Dolphin Day, podkreślając jego znaczenie dla badań nad mową ssaków morskich.
Dziesięciolecia obserwacji pod wodą
Od 1985 roku WDP prowadzi najdłuższe nieprzerwane badania terenowe nad delfinami, dokumentując dźwięki charakterystyczne dla różnych kontekstów zachowań. Wśród nich wyróżniają się whistles – swoiste imiona, „squawks” – dźwięki związane z agresją, oraz „buzzes” – kliknięcia słyszane podczas zalotów i polowań. Wiedza ta stała się fundamentem do trenowania zaawansowanych modeli AI.
Cel: odkrycie struktury językowej
Analiza prowadzona przez WDP ma na celu zidentyfikowanie reguł gramatycznych i struktury w sygnałach dźwiękowych delfinów. Zakłada się, że istnieją w nich powtarzalne wzorce i logiczne ciągi, które mogą świadczyć o istnieniu formy języka. Takie podejście wymaga zarówno precyzyjnych danych, jak i narzędzi zdolnych do ich przetwarzania.
Model AI przystosowany do podwodnej akustyki
DolphinGemma to audio-in, audio-out system stworzony z myślą o przetwarzaniu złożonych sekwencji dźwięków. Wykorzystuje tokenizator SoundStream oraz architekturę opartą na rodzinie modeli Gemma, znanych z efektywności działania. Dzięki 400 milionom parametrów, DolphinGemma może być uruchamiany nawet na smartfonach Google Pixel, wykorzystywanych przez naukowców w terenie.
Przewidywanie i generowanie dźwięków
Model potrafi nie tylko analizować, ale także przewidywać kolejne dźwięki w sekwencji oraz generować nowe dźwięki przypominające naturalne sygnały delfinów. Takie możliwości pozwalają na znaczne przyspieszenie analizy oraz odkrywanie wcześniej niezauważonych struktur w komunikacji delfinów.
CHAT – dialog człowieka z delfinem
Równolegle rozwijany jest system CHAT (Cetacean Hearing Augmentation Telemetry), który nie tyle tłumaczy mowę delfinów, co tworzy wspólny, uproszczony system znaków. Delfinom prezentowane są sztuczne „gwizdy” powiązane z obiektami, co ma zachęcić je do naśladowania tych dźwięków w celu ich „zamówienia”.
Współdziałanie CHAT i DolphinGemma
W miarę postępów w rozumieniu naturalnej komunikacji dzięki DolphinGemma, możliwe stanie się włączenie autentycznych dźwięków do systemu CHAT. Ułatwi to budowanie bardziej intuicyjnego interfejsu między człowiekiem a delfinem, bazującego na rzeczywistych wzorcach zachowań tych zwierząt.
Nowoczesne technologie w służbie nauce
Smartfony Google Pixel służą jako mobilne centra przetwarzania danych akustycznych. Umożliwiają wykrycie naśladownictwa dźwięku, jego identyfikację oraz natychmiastowe powiadomienie badacza poprzez podwodne słuchawki przewodzące dźwięk przez kości. Nowa generacja systemu będzie działać na modelu Pixel 9.
Zalety kompaktowego sprzętu
Wykorzystanie smartfonów pozwala zredukować wielkość sprzętu, zmniejszyć zużycie energii i poprawić łatwość konserwacji systemu. Integracja DolphinGemma z CHAT pomoże także w szybszym rozpoznawaniu intencji delfinów, czyniąc interakcję bardziej płynną i naturalną.
Otwartość modelu dla naukowców
Google zapowiada, że DolphinGemma zostanie udostępniony jako open model latem 2025. Choć obecnie trenowany jest na delfinach atlantyckich, może zostać dostosowany do analizy komunikacji innych gatunków waleni, wspierając globalne badania nad ich językiem.