SAM Audio: La IA que define el futuro de la edición de sonido

Meta
(Crédito de imagen: Meta)

¿Estás listo para vivir una experiencia de edición de audio y video como nunca antes? De ser así, no te pierdas ningún detalle a continuación, pues Meta acaba de presentar SAM Audio, un modelo de inteligencia artificial de última generación diseñado para segmentar cualquier sonido de una mezcla compleja, utilizando comandos de texto, visuales o de tiempo.

El modelo permite grabar un video de una banda y poder aislar la guitarra o las voces con un solo clic; o bien, usar un comando de texto para eliminar el molesto ruido de tráfico de un video filmado en exteriores; o incluso, quitar los ladridos de un perro de toda una grabación de pódcast.

SAM Audio, la más reciente adición a la colección Segment Anything, hace que la separación de audio de calidad profesional sea más accesible e intuitiva que nunca. Este enfoque imita la forma natural en que las personas interactúan con el sonido, permitiendo aislar cualquier elemento de una mezcla de audio compleja. El modelo tiene el potencial de transformar la edición de audio y video, e impulsar la innovación en áreas como la música, la creación de pódcasts, la televisión, el cine, la investigación científica y la accesibilidad.

El Primer Modelo Unificado para la Separación de Audio

Hasta ahora, la segmentación y edición de audio ha sido un espacio fragmentado, con múltiples herramientas diseñadas para usos únicos. SAM Audio es el primer modelo unificado en apoyar casos de uso que coinciden con la manera en que las personas piensan naturalmente sobre el audio, ofreciendo un rendimiento de vanguardia en diversos escenarios del mundo real.

SAM Audio soporta tres métodos de comandos (prompts) que se pueden usar de forma individual o combinada para un control preciso:

  • Comando de Texto: Simplemente se escriben frases como "ladrido de perro" o "voz cantada" para extraer sonidos específicos.
  • Comando Visual: Se hace clic en la persona u objeto en el video que está generando el sonido para aislar su audio.
  • Comando de Segmento de Tiempo (Span Prompting): Una primicia en la industria, este método permite marcar los segmentos de tiempo donde ocurre el audio que se desea extraer.

Potencial Ilimitado para Creadores

Existe un enorme potencial en casos de uso como el aislamiento de sonido y el filtrado de ruido, ayudando a las personas a dar vida a sus visiones creativas. SAM Audio ya está siendo utilizado para construir herramientas más creativas en diversas aplicaciones.

SAM Audio está disponible para ser probado hoy mismo en el Segment Anything Playground, una nueva plataforma donde se pueden explorar los modelos más recientes. Los usuarios pueden seleccionar entre una colección de activos de audio y video, o subir los suyos propios para experimentar las capacidades de SAM Audio. El modelo también se encuentra disponible para su descarga.

Hay gran entusiasmo por integrar el audio a la colección de modelos Segment Anything. Se considera que SAM Audio es el mejor modelo de separación de audio disponible en el mercado.

Antonio Quijano
Editor