Google ha equipado a Gemini con una funcionalidad altamente solicitada por sus usuarios. Desde ahora, tanto en su versión de escritorio como en las aplicaciones móviles, el chatbot de inteligencia artificial admite la carga de archivos para su análisis, incluidos los audios.
Así, es posible subir grabaciones de audio en tus interacciones con Gemini para que el sistema realice resúmenes o transcripciones según lo requieras. Esto resultará extremadamente útil para aquellos que utilizan frecuentemente este tipo de archivos, tanto en ámbitos académicos como laborales.
Si eres un estudiante que acostumbra grabar sus clases (o fragmentos de estas) con el móvil, ahora puedes cargar estas grabaciones en Gemini para obtener transcripciones. Además, puede generar resúmenes que faciliten la comprensión del material de manera más sencilla.
Para quienes en su entorno laboral realizan grabaciones de audio, ya sea en forma de entrevistas o notas personales, Gemini ofrece la posibilidad de procesar esta información automáticamente, evitando el esfuerzo manual. Las aplicaciones de esta nueva función son diversas y en Google son conscientes del interés que había generado entre los usuarios.
Josh Woodward, director de Google Labs y de la aplicación Gemini, anunció en X (anteriormente Twitter) que el soporte para audios era una de las características más demandadas por los usuarios. Por lo tanto, si estás interesado en probar esta nueva herramienta, puedes hacerlo accediendo a gemini.google.com o mediante las aplicaciones para iOS y Android.
Cómo subir y transcribir audios mediante Gemini
Si utilizas Gemini desde un ordenador a través de su página web, puedes subir un archivo de audio haciendo clic en el icono «+» y seleccionando Subir archivos. Solo necesitas elegir el archivo deseado y añadir la instrucción correspondiente para que el chatbot la ejecute. Por ejemplo, si junto con la grabación indicas «Transcríbela», la inteligencia artificial se encargará de convertir el audio en texto.
El procedimiento es muy similar en las aplicaciones para Android e iPhone. Simplemente toca en «+» y luego en Archivos. Después, busca el audio que deseas analizar, y el resto del proceso es idéntico. También puedes formular instrucciones en forma de pregunta («¿De qué trata este audio?», por ejemplo), o pedir un resumen si se trata de un archivo extenso.
Cabe destacar que el soporte para audios en Gemini está sujeto a ciertos límites. Por ejemplo, la IA puede procesar solamente archivos en formatos estándar como MP3, WAV, FLAC o M4A. Si necesitas analizar audios de WhatsApp, probablemente debas convertirlos primero, ya que suelen estar en formato OPUS y no son compatibles.
Además, si utilizas la versión gratuita de Gemini, podrás procesar audios de hasta 10 minutos de duración. Con las versiones de pago, como Google AI Pro o Google AI Ultra, el límite se extiende hasta 3 horas. Los archivos pueden ser de hasta 100 MB de peso y se pueden cargar hasta 10 archivos en un mismo prompt. Si los archivos están comprimidos, también es posible subir hasta 10 archivos por ZIP.

Hola, soy Carlos, parte del equipo de MuyMac. Me apasiona compartir las últimas novedades en entretenimiento y conectarte con el mundo del cine, la música y la cultura pop.