Text-To-Speech, la tecnología para personas con trastornos de habla

Text-To-Speech, tecnología creada por Xiaomi Al Lab, es una innovación que permite generar una voz personalizada para usuarios con trastorno de habla. El proyecto desarrollado por la subdivisión del fabricante tecnológico chino ofrece a sus usuarios una herramienta que rompe con la habitual voz electrónica de los asistentes inteligentes que comúnmente se puede escuchar en varios dispositivos de la empresa.

El proyecto pertenece a Own My Voice el cual significa “Mi propia voz”, fue desarrollado por el Comité Técnico de la marca, el cual, buscó visibilizar la relación de Xiaomi con el movimiento global Tech for Good. Dicho movimiento promueve el desarrollo de la tecnología e inteligencia artificial de manera sustentable de la mano con el servicio del bien común y la inclusión que, a su vez, busca “ofrecer la posibilidad de que todos disfruten de una vida mejor a través de la innovación tecnológica”.

Este corriente pone sobre la mesa La Agenda 2030, el cual establece un plan global que tiene como objetivo erradicar la pobreza, el cambio climático y reducir las desigualdades sociales en todo el mundo. Una idea adoptada por grandes empresas de la industria y de innovación tecnológica en el mundo. En la actualidad ya cuenta con la participación de 193 países de las Naciones Unidas.

Own My Voice representa un gran avance ya que los investigadores del gigante chino lograron desarrollar una nueva síntesis de voz, con el objetivo de que los usuarios con trastornos de habla puedan acceder a servicios más humanizados y sobre todo, puedan comunicarse con “su propia voz”. Para poder conseguirlo, el equipo de Xiaomi reclutó a más de 200 voluntarios para que donaran sus voces y así desarrollar y producir la voz más adecuada para el destinatario o la persona que lo fuera a requerir.

“La tecnología de texto a voz espontánea ha demostrado que también se puede adoptar en áreas de accesibilidad y, sobre todo, mejorar la experiencia del usuario”, comentó el fabricante en un comunicado.

Su funcionamiento es a partir de algoritmos, los cuales se combinaron con una tecnología de voz avanzada desarrollada por la empresa, posteriormente la voz real fue seleccionada y se manipuló con una modificación acústica para construir un sonido completamente nuevo y original.

Más tarde utilizaron la tecnología Text-To-Speech para entrenar el modelo de IA, esto permitió que la voz sintetizada de los asistentes inteligentes tuviera más parecido a la voz de una persona real. Gracias a este modelo se mejoró la entonación, la repetición, las pausas, la estructura y algunas otras características del habla.

Según los desarrolladores, esta herramienta es capaz de “sustituir la sensación monótona y antinatural de la voz electrónica” en los dispositivos, por una sensación más natural, humana y realista. Si advertimos y atendemos las necesidades de los grupos minoritarios en una fase temprana, el proceso de difusión de la tecnología podría acortarse”, expresó el presidente del Comité de Tech for Good, Zhu Xi, respecto a la aplicación de este desarrollo.

En la actualidad han equipado diferentes dispositivos inteligentes con el asistente de voz de Inteligencia Artificial (IA) de Xiaomi, Xiaoai . Esto lo hicieron para analizar su funcionamiento en otros equipos. Finalmente, la compañía expresó que se encuentra orgullosa de dicho proyecto y que continuará recibiendo los comentarios y las opiniones de los usuarios. Señalaron que más adelante planean estudiar su viabilidad y esperan llevar la innovación a ámbitos más amplios.

 

Fuente: Infobae

Publicaciones relacionadas

Botón volver arriba