Google colabora con expertos en delfines para desarrollar una IA que interprete su lenguaje
Google ha revelado su más reciente desarrollo: DolphinGemma, un modelo de lenguaje avanzado, cuyo propósito es facilitar a los investigadores el estudio de las comunicaciones entre delfines y, potencialmente, descubrir su significado exacto, según las propias palabras de la compañía.
La compañía ha comentado que «desde hace décadas, entender los chasquidos, silbidos y pulsos emitidos por los delfines ha sido un desafío científico«, y ahora buscan no solo escuchar, sino también interpretar con precisión los complejos patrones de comunicación de estos mamíferos marinos para poder responder de manera realista.
El innovador modelo de IA ha sido entrenado para reconocer la estructura de los sonidos de los delfines y crear nuevas secuencias sonoras que imitan las naturales. Según la empresa, esto representa un avance significativo «en el camino hacia la comunicación entre especies» y «expande los horizontes de la inteligencia artificial».
La aspiración de entender a los animales no es algo reciente. Es interesante recordar un evento donde a un delfín solitario en Dinamarca, tras años de aislamiento, le colocaron un micrófono y la grabación de su «monólogo» resultó ser sorprendentemente humana.
Cómo opera la nueva IA de DeepMind de Google
Desde 1985, el Proyecto Delfín Salvaje o WDP ha estado investigando de forma submarina a una comunidad específica de delfines moteados del Atlántico (Stenella frontalis) en las Bahamas, observándolos a lo largo de generaciones de manera «no invasiva». Han acumulado décadas de grabaciones de video y audio subacuáticas, que están meticulosamente correlacionadas con las identidades individuales de los delfines, sus historias de vida y comportamientos observados.
El WDP ha logrado observar y analizar la comunicación y las interacciones sociales naturales de los delfines. El trabajo submarino permite a los científicos asociar directamente los sonidos con comportamientos específicos, una tarea complicada de realizar desde la superficie.
Por décadas, han vinculado ciertos tipos de sonidos con comportamientos específicos. Por ejemplo, han identificado silbidos particulares que usan las madres y sus crías para reunirse, o ciertos zumbidos comúnmente asociados con el cortejo o la persecución de tiburones.
«Este análisis exhaustivo de la comunicación natural es la base del trabajo de WDP y proporciona un contexto crucial para cualquier análisis de IA», según Google.
Funcionamiento de DolphinGemma
Con base en esta valiosa información, Google ha desarrollado DolphinGemma, diseñado para analizar la compleja y natural comunicación de los delfines, lo cual describen como «una tarea colosal».
Este modelo de IA utiliza tecnologías de audio específicas de Google: el tokenizador SoundStream captura eficazmente los sonidos de los delfines, que son procesados posteriormente por una arquitectura de modelo diseñada para manejar secuencias complicadas.
Este modelo, que cuenta con aproximadamente 400 millones de parámetros, es del tamaño ideal para funcionar directamente en los teléfonos Pixel que utiliza el WDP en sus estudios. Según The Verge, Google ha optimizado DolphinGemma para aprovechar su propia tecnología de audio, lo que permite usar dispositivos Pixel sin la necesidad de hardware especializado, además de mejorar la sostenibilidad del sistema, reducir el consumo energético y los costos.
Inspirado en los hallazgos de Gemma
Este modelo se fundamenta en los hallazgos de Gemma, un conjunto de modelos ligeros y abiertos de Google, derivados de la misma investigación y tecnología que alimenta nuestros modelos Gemini. Ha sido entrenado con una extensa base de datos acústica de delfines del Atlántico salvajes que posee WDP. Como menciona Google:
DolphinGemma actúa como un modelo de audio de entrada y salida que procesa secuencias de sonidos naturales de delfines para identificar patrones, estructuras y, en última instancia, predecir los sonidos que probablemente seguirán en una secuencia, similar a cómo los grandes modelos lingüísticos para humanos predicen la siguiente palabra o frase en una oración.
Actualmente, WDP está empezando a implementar DolphinGemma. Según indican, el modelo puede ayudar a los investigadores a descubrir estructuras ocultas y posibles significados en la comunicación natural de los delfines, una tarea que antes requería un enorme esfuerzo humano.
Además de analizar la comunicación natural, WDP está también explorando la posible interacción bidireccional mediante tecnología en el océano.

¡Hola! Soy Valentina, miembro del equipo de MuyMac. Mi pasión por la escritura y mi compromiso con la divulgación de noticias relacionadas con la sociedad y la naturaleza me han llevado a formar parte de este proyecto increíble.