Facebook
Gaceta digital FI Ingenieria en Marcha
Comunicafi TVIngenieria comunicafi_unam
Vida Académica
2016-02-17
El reto de la Prueba de Turing
Integrantes del Laboratorio de Tecnologías del Lenguaje dan conferencias sobre síntesis de voz.
Por: DIE
Fotografía: Cortesía DIE
Comunicafi
MI Fernando del Río en el congreso ICSPS 2016

La famosa Prueba de Turing establece que una máquina posee inteligencia artificial si es capaz de establecer una conversación con un humano sin que éste note que está conversando con una máquina y no con un congénere.

Habría mucho que aclarar sobre esta prueba, inclusive que el propio Turing no la describió exactamente como en el párrafo anterior. Supongamos que ahora se define una "prueba reducida de Turing", consistente en que una persona escuche una voz, que puede proceder de otra persona o de una máquina, y sea indistinguible. Éste es uno de los objetivos del Laboratorio de Tecnologías del Lenguaje de la División de Ingeniería Eléctrica de la FI.

Referente a esta prueba reducida de Turing, el doctor Abel Herrera Camacho, responsable del laboratorio mencionado, impartió la conferencia plenaria Natural Speech Synthesis en el congreso International Conference on Signal Processing Systems, en Auckland, Nueva Zelanda, el pasado mes de diciembre. Asimismo, el maestro Fernando del Río participó con la ponencia Towards Gendered Mexican Spanish Emotive Speech Synthesis, de coautoría con el doctor Herrera.

Por otra parte, el alumno doctoral del Laboratorio Carlos Franco Galván presentó los artículos Síntesis de Voz Utilizando Modelos Ocultos de Markov y Description of the most Relevant Speech Parameterization Methods and Possible new Lines of Investigation, en la Reunión de Otoño ROC&C organizada por el Institute of Electrical and Electronics Engineers Sección México, realizada a fines de noviembre en Acapulco.

Profundizando en el tema, el doctor Herrera asegura que las técnicas actuales aún no pasan la prueba reducida de Turing, pero han obtenido una voz bastante inteligible y casi natural. De hecho en el Laboratorio de Tecnologías del Lenguaje se ha creado ya un sistema de síntesis para el español hablado en México. Si lo desea, el lector puede escuchar algunas frases sintetizadas en el sitio http://tecnolenguajes.byethost17.com/

Las técnicas más recientes de síntesis de voz son de este siglo. Se basan en modelos ocultos de Markov que, a su vez, son modelos basados en matemáticas no determinísticas. En la Facultad se imparten dos asignaturas de estas matemáticas: Probabilidad y Estadística en muchas carreras, y no es lejano el día en que se incorpore Procesos Estocásticos como una tercera en todos los planes de estudio de las ingenierías, y no sólo en una carrera como hasta hoy.

La investigación en síntesis automática de voz es relevante para los ingenieros porque empresas mexicanas se ven obligadas a comprar los derechos de sintetizadores extranjeros en aplicaciones varias, como llamadas telefónicas de mensajes automáticos. Mientras que otros usos como la respuesta y contestación automática telefónica están ya comercializándose ampliamente en otros países (en México de forma incipiente) con resultados aceptables por los usuarios.

Asimismo, la creciente utilización de dispositivos móviles implica la interacción hombre-máquina a través del lenguaje, por lo que las empresas líderes en el mundo están realizando hoy arduas investigaciones para mejorar la comprensión del lenguaje y su emisión a través de la síntesis.

De esta forma se abre la oportunidad de México para ofrecer sistemas de síntesis de voz diseñados en la UNAM a empresas nacionales y extranjeras en muchas aplicaciones tecnológicas.