La plataforma de audio Pocket FM, respaldada por Lightspeed Ventures, ha anunciado que se ha asociado con la empresa de clonación de voz ElevenLabs para convertir rápidamente contenido de texto, como guiones, en secuencias de audio utilizando IA.

Pocket FM, que recaudó 103 millones de dólares en financiación Serie D en marzo, dijo a TechCrunch en ese momento que ya estaba experimentando con la capacidad de convertir contenido de texto en audio utilizando la tecnología de ElevenLabs. Ahora, la empresa con sede en India ha ampliado la asociación para que la herramienta de conversión esté disponible para todos los creadores durante las próximas semanas.

En fase de pruebas, Pocket FM ya ha producido 30.000 horas de series de audio utilizando la tecnología de inteligencia artificial de ElevenLab. Con el nuevo lanzamiento, la startup espera triplicar su biblioteca de contenido a más de 100.000 horas de contenido de audio este año. Pocket FM también dijo que durante la fase experimental, las herramientas impulsadas por IA ayudaron a reducir el costo de producción de audio en un 90%.

Conversión de texto a audio con Pocket FM
Credito de imagen: bolsillo fm

El cofundador y director de tecnología de Pocket FM, Pratik Dixit, dijo a TechCrunch que con esta asociación, la compañía quiere facilitar a los escritores la conversión de sus escritos en series de audio.

«Tenemos más de 250.000 escritores (incluidos los escritores de la plataforma de escritura Pocket Novel de la compañía) y esta asociación reduce los costos de configuración y grabación de audio para ellos», dijo.

Dijo: «Incluso con una buena configuración de equipos y herramientas de grabación, los escritores pueden producir alrededor de 30 minutos de contenido de audio de alta calidad por día. Con herramientas de inteligencia artificial, esta producción puede ser 10 veces mayor».

Pocket FM ha creado una herramienta integrando la tecnología de ElevenLabs, a través de la cual ofrece 50 voces para escritores que quieran convertir sus contenidos. El cofundador de ElevenLabs, Mati Staniszewski, dijo que la herramienta de su empresa comprende el contexto de la escritura e infiere automáticamente los sentimientos a través de la voz.

Staniszewski dijo: «Al trabajar con Pocket FM, estamos implementando nuestros nuevos modelos que comprenden mejor el estilo de escritura e impulsan la emocionalidad».

Según los datos recopilados de la interacción de los usuarios con dicho contenido, la plataforma también planea sugerir voces que sean más adecuadas para escritores de un género en particular, dijo Dixit.

Pocket FM no es la única plataforma de series de audio que está experimentando con herramientas impulsadas por IA. Kooku FM, respaldado por Google, está utilizando GPT-4, Cloud, BandLabs e incluso ElevenLabs para ayudar a sus escritores en varias etapas de la creación, incluido el perfeccionamiento de guiones, la creación de miniaturas y la adición de efectos de sonido y conversión de audio en audio.

Kuku FM le dijo a TechCrunch que también está trabajando en el uso de herramientas de creación visual como Midjorn y Runway para crear anuncios relacionados con el contenido.

Calidad del contenido e impacto en los artistas.

La promesa de las herramientas impulsadas por IA es generar más contenido más rápidamente, pero eso no significa que el contenido sea bueno. La respuesta de Pocket FM para apoyar el descubrimiento y mostrar contenido de calidad es refinar sus algoritmos de búsqueda y experimentar con la participación del usuario.

«Si un autor publica una serie de audio, promocionamos ese contenido para seleccionar usuarios y observamos las métricas de participación. Si estas métricas son positivas, lo promocionamos aún más», dijo Dixit.

El uso de IA podría generar resultados más rápidos y bibliotecas de contenido más grandes para estas plataformas, pero también disminuiría el papel de los locutores que trabajan con ellas. La Asociación de Locutores de la India (AVA) ha expresado su preocupación por el creciente impacto de la IA.

Amrinder Singh Sodhi, secretario general de la asociación, dijo: «Si la IA se vuelve dominante, seremos destruidos. Como locutores, necesitamos alguna regulación para que nuestro sustento esté protegido». dijo a la publicación india Scroll,

Sodi también le contó a Scroll sobre incidentes en los que locutores fueron llamados a los estudios para grabar muestras para entrenar la IA sin obtener su consentimiento ni informarles.

«A nivel emocional, me asusta. Al usar IA, esencialmente estás diluyendo la experiencia humana de contar historias. Se pierde la conexión emocional», dijo a TechCrunch el locutor Aditya Mattoo, con sede en Delhi.

Dijo que brindar acceso a voces premium a personas que no tienen el gusto y las habilidades para producir contenido de calidad inundaría el mercado con contenido deficiente.

Cuando preguntamos sobre el impacto de la generación de voz impulsada por IA en Pocket FM, la compañía no respondió directamente a la pregunta. Sin embargo, Dixit dijo que en sus experimentos la interacción con el contenido generado por IA es «tan buena como la producción de voz en off humana». Cabe destacar que la empresa también está trabajando en tecnología para incorporar múltiples voces en una única salida de audio.

Tanto Pocket FM como Kuku FM actualmente no etiquetan su contenido indicando si se ha utilizado IA en el proceso de producción.

Source link