23/06/2025
Google acaba de actualizar su modelo de inteligencia artificial Gemini con una función que podría cambiar la forma en que descubrimos música. Ahora, con solo tararear, reproducir o grabar una canción, Gemini puede decirte cuál es, al estilo Shazam. El avance refuerza la integración entre IA y entretenimiento, y posiciona a Google un paso más cerca de tener un asistente verdaderamente todo en uno.
Gemini es el sistema de IA multimodal de Google, sucesor de Bard, que combina texto, imágenes, audio y video. Con la nueva actualización, ahora es capaz de reconocer canciones de manera muy similar a lo que hace Shazam (Apple) o SoundHound, pero directamente desde el entorno de Gemini.
Esto significa que, en vez de abrir otra app, podés preguntarle directamente:
"¿Qué canción es esta?"
Y Gemini se encargará de analizar el audio -ya sea tarareado, grabado o reproducido desde una fuente externa- para identificar el tema.
La función está integrada en la app de Gemini (actualmente en Android), y se activa simplemente reproduciendo una canción cerca del teléfono o incluso cantando parte de la letra o la melodía.
La IA utiliza modelos de reconocimiento de patrones de audio entrenados con miles de canciones y fragmentos para lograr resultados precisos incluso con ruido ambiente o interpretaciones no profesionales (como un tarareo desafinado).
Aunque todavía está en fase inicial, la precisión de la herramienta es sorprendente, según usuarios que ya la probaron.
Hasta ahora, identificar una canción requería aplicaciones específicas. Gemini rompe con esa lógica: la idea es que todo lo puedas hacer con una sola herramienta inteligente, sin salir del flujo de conversación con la IA.
Además, al estar conectada al ecosistema de Google, podría vincular directamente la canción con YouTube, YouTube Music, búsquedas relacionadas, artistas y más, lo que da un paso más hacia una experiencia musical integrada.
Gemini reconoce canciones a partir de texto, voz o sonido en tiempo real.
Puede seguir la conversación luego de identificar la canción (por ejemplo: "¿Quién la canta?", "¿Tiene otras similares?", etc.).
Está integrada con otros servicios de Google, lo que permite, por ejemplo, armar una playlist en YouTube Music sin salir de la app.
Es multimodal: además de audio, también trabaja con imágenes y video.
Shazam sigue siendo muy eficiente, pero Gemini lo supera en versatilidad gracias a su capacidad conversacional y contexto ampliado.
Por ahora, esta función está disponible en la app Gemini para dispositivos Android en mercados seleccionados. Se espera que llegue pronto a más regiones y también a través del asistente de Google en versiones futuras de Android e incluso en ChromeOS.
Aún no hay fecha confirmada para su integración completa con iOS o su expansión global.
Google avanza con fuerza en el terreno de la inteligencia artificial, y sumar el reconocimiento de música a Gemini no es solo un detalle: es un paso clave para convertirla en una herramienta total, útil y cotidiana. El futuro de los asistentes virtuales parece estar cada vez más cerca, y esta vez... también tiene ritmo.
COMPARTE TU OPINION | DEJANOS UN COMENTARIO
Los comentarios publicados son de exclusiva responsabilidad de sus autores y las consecuencias derivadas de ellos pueden ser pasibles de sanciones legales.
23/06/2025
18/06/2025
Inteligencia Artificial
17/06/2025