Fashion

Las herramientas de generación de voz de ElevenLabs se lanzan fuera de la beta

ElevenLabs, la plataforma viral impulsada por IA para crear voces sintéticas, lanzó hoy su plataforma fuera de la beta con soporte para más de 30 idiomas.

Utilizando un nuevo modelo de IA desarrollado internamente, ElevenLabs dice que sus herramientas ahora son capaces de identificar automáticamente idiomas, incluidos el coreano, el holandés y el vietnamita, y generar discursos 'emocionalmente ricos' en esos idiomas.

En combinación con el nuevo modelo, los clientes de ElevenLabs pueden aprovechar la herramienta de clonación de voz de la plataforma para hablar en casi 30 idiomas sin necesidad de escribir primero texto.

'ElevenLabs se inició con el sueño de hacer que todo el contenido sea universalmente accesible en cualquier idioma y en cualquier voz', dijo el CEO y cofundador de ElevenLabs, Mati Staniszewski, en un comunicado. 'Con este lanzamiento, estamos un paso más cerca de hacer realidad este sueño y poner voces de IA de calidad humana disponibles en cada dialecto. Nuestras herramientas de generación de texto a voz ayudan a nivelar el campo de juego y a llevar capacidades de audio hablado de alta calidad a todos los creadores por ahí'.

Fundada por Staniszewski, quien trabajó anteriormente en Palantir, y su amigo de la infancia Piotr Dabkowski, ex empleado de Google, ElevenLabs ha sido noticia en los últimos meses por razones tanto buenas como aborrecibles.

Inspirados por el doblaje mediocre de películas estadounidenses que Staniszewski y Dabkowski veían de niños en Polonia, la pareja se propuso diseñar una plataforma que pudiera hacerlo mejor, empleando, por supuesto, IA.

ElevenLabs se lanzó en beta a finales de enero, y rápidamente ganó impulso, debido a la alta calidad de sus voces generadas y la generosa capa gratuita. Pero como se señaló anteriormente, la publicidad no ha sido consistentemente positiva, especialmente una vez que actores malintencionados explotaron la plataforma para sus propios fines.

En respuesta, ElevenLabs dijo que introduciría un conjunto de nuevas medidas de seguridad, como limitar la clonación de voz a cuentas pagas y proporcionar una nueva herramienta de detección de IA.

ElevenLabs aún no ha tenido que lidiar con la otra controversia que se gesta en torno a su plataforma y otras similares: su amenaza para la industria de la actuación de voz.

Motherboard escribe sobre cómo cada vez más se pide a los actores de voz que renuncien a los derechos sobre sus voces para que los clientes puedan usar IA para generar versiones sintéticas que eventualmente podrían reemplazarlos. Mientras tanto, correos electrónicos internos vistos por The New York Times indican que Activision Blizzard, uno de los mayores editores de juegos del mundo, está trabajando en herramientas para la 'clonación de voz' asistida por IA.

Parecería que ElevenLabs ve esto como la progresión natural de las cosas, promocionando su trabajo con editores como Storytel; plataformas de medios como TheSoul Publishing y MNTN para audiolibros y contenido de radio; y editores como Embark Studios y Paradox Interactive para videojuegos (Storytel y TheSoul Publishing son inversores estratégicos). La empresa afirma tener más de un millón de usuarios registrados en los espacios creativos, de entretenimiento y editoriales que han creado contenido de audio equivalente a 10 años.

ElevenLabs, que recientemente recaudó $19 millones de inversores, incluidos Andreessen Horowitz y el cofundador de DeepMind Mustafa Suleyman a una valoración de $99, tiene planeado eventualmente extender sus modelos de IA a la toma de doblaje de voz, siguiendo los pasos de startups como Papercup y Deepdub y construyendo lo que llama 'una base para poder transferir emociones e inflexiones de un idioma a otro'.

Además, ElevenLabs dice que planea introducir un mecanismo que permitirá a los usuarios compartir voces en la plataforma, aunque los detalles aún son nebulosos.

Related Articles

Back to top button