WellSaid Labs, una startup de voz con inteligencia artificial, está redoblando su apuesta por su nicho de clientes empresariales e industrias reguladas, con la esperanza de que un enfoque detrás de escena más inteligente dé frutos para su negocio en el largo plazo, incluso cuando competidores más llamativos atraen atención y controversia generalizadas.
La compañía con sede en Bellevue, Washington, lanzó el lunes una nueva versión de su plataforma de texto a voz con IA basada en voz con software Studio rediseñado y un modelo de voz Caruso de próxima generación que promete mejores flujos de trabajo, calidad de audio mejorada y controles personalizados, entre otras características.
A diferencia de los modelos abiertos de generación de voz que recopilan datos disponibles públicamente, el sistema de WellSaid se basa exclusivamente en grabaciones de voz autorizadas de actores, un enfoque de modelo cerrado que, según dice, respeta la propiedad intelectual y atrae a sectores como el de la salud, el legal y el financiero.
El último lanzamiento de WellSaid es un momento clave para la compañía: el resultado de años de investigación interna que ahora llega al mercado en una forma que aclara su enfoque en los usuarios empresariales e institucionales, dijo en una entrevista Chris Johnson, director de productos y tecnología de WellSaid.
“Estamos comprometidos a ser la mejor solución empresarial del mercado”, afirmó Johnson. “Muchas de estas innovaciones nos ayudan a hacerlo realidad”.
WellSaid, que surgió de la incubadora AI2 en Seattle en 2019, trabaja con grandes clientes empresariales, incluidos LinkedIn, T-Mobile, ServiceNow y Accenture.
La empresa causó una gran impresión en el público en 2023 cuando NPR planeta del dinero utilizó la tecnología de WellSaid para crear una versión sintética de la voz del ex presentador Robert Smith, una réplica casi perfecta que sorprendió a los oyentes y demostró tanto la promesa como los posibles problemas del audio artificial realista.
Pero WellSaid ha intentado ocasionalmente acceder a la conversación más amplia de la industria. El problema se puso de relieve por la ausencia en el mapa de mercado de CB Insights de las principales empresas emergentes de inteligencia artificial de voz, lideradas por el destacado ElevenLabs, que ha estado en el centro de la controversia sobre el uso de su tecnología para crear voces falsas de inteligencia artificial de figuras públicas y otros.
Los ejecutivos de WellSaid dicen que esperan corregir este descuido en particular, pero el problema refleja una estructura más amplia entre las empresas corporativas de IA, particularmente en el área de Seattle, que a menudo enfatizan la confianza, la gobernanza y los escenarios regulatorios en una cultura tecnológica todavía enamorada de los experimentos de Silicon Valley y las aplicaciones de consumo.
Según LinkedIn, la empresa emplea a unas 70 personas, algo menos que hace un año.
WellSaid ha experimentado cierta rotación en su liderazgo, incluidos tres directores ejecutivos en menos de dos años, comenzando con el fundador Matt Hawking, luego Brian Cook y ahora Benjamin Dorr, quien reemplazó a Cook a principios de este año después de desempeñarse como director financiero.
“Cada voto está asociado con una persona real, y esa persona recibe regalías de las ganancias obtenidas en WellSaid”, dijo Dorr en un episodio reciente del podcast Master Move. “Creo que lo que hacemos bien con nuestros actores de doblaje nos permite hacerlo bien para las empresas que nos eligen, y no creo que todos los demás puedan decir eso”.



