Apps

El sistema text-to-speech de Baidu puede imitar varios acentos

La compañía asegura que su sistema puede reconocer patrones y adaptarlos por sí mismo

Baidu, una de las grandes empresas chinas de tecnología, está trabajando duro para que su sistema text-to-speech (texto-a-voz) suene cada vez más humano y al parecer lo está logrando. Según los últimos reportes, Deep Voice ha mejorado tanto que ahora puede imitar acentos de diferentes regiones. La nueva versión, llamada Deep Voice 2 ha podido aprender de cientos de voces diferentes con menos de media hora de escuchar a cada una de ellas. Anteriormente, alcanzar un resultado como este hubiera tomado cerca de 20 horas, para una sola voz.

Baidu asegura que su sistema es tan avanzado que puede encontrar características compartidas entre las distintas voces de entrenamiento por si solo, sin requerir asistencia o guía de ningún tipo. Además, la empresa reveló que Deep Voice 2 puede crear voces de manera eficiente incluso al tomar muchas muestras pequeñas de una gran cantidad de voces distintas.

Esto quiere decir que es probable que pronto empecemos a escuchar a nuestros asistentes virtuales hablar con voces que representen mejor a las personas con las que interactuamos día a día. Yo, por mi parte, no puedo esperar a preguntarle a Sirio “¿Quiobo, cómo estás?” Y que Siri me responda “Quiobo… bien.”

Deja tu comentario

Nuevo

  • Nuevo

  • Trending

  • Lo Mejor

Subir