Módulo de detección de errores de pronunciación del idioma inglés utilizando una red transformadora integrado en un chatbot.
Fecha
2022-01
Autores
Martínez Quezada, Marcos Eduardo
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Autónoma de Ciudad Juárez
Resumen
El proceso de globalización en cualquier ámbito ha requerido una mayor capacitación personal. El dominio del idioma inglés es uno de los factores de preparación mayormente demandados por las empresas. Sin embargo, existen personas a las que se les dificulta desarrollar las habilidades requeridas para dominar un nuevo idioma, de las cuales, la pronunciación es una de ellas. Algunos estudiantes que están aprendiendo un segundo idioma no cuentan con un compañero de estudio que les ayude a mejorar la habilidad del habla mediante la práctica.
Existen herramientas computacionales empleadas para ayudar a aprendices de un segundo idioma a mejorar su habilidad de pronunciación. En las últimas décadas fue ampliamente utilizado el algoritmo Goodness of Pronunciation (GOP), para realizar esta tarea, sin embargo, su funcionamiento se veía mermado al analizar oraciones largas. Posteriormente, la propiedad de memoria de las Redes Neuronales Recurrentes (RNN, por sus siglas en inglés) solucionaría parcialmente dicho problema ya que, al igual que el algoritmo GOP, se perdía información en secuencias demasiado largas. Con la llegada de la red transformadora se logró procesar secuencias completas con una mejora en el rendimiento, además sin perder información. Este tipo de red fue empleada en un inicio para problemas de texto, sin embargo, comenzó a utilizarse para la detección de voz gracias a su rendimiento. Adicionalmente, se suele utilizar un algoritmo de alineación de secuencias para lograr implementar la detección de errores de pronunciación.
Esta investigación se enfoca en el desarrollo de un sistema de detección de errores de pronunciación empleando técnicas de Inteligencia Artificial con la finalidad de ayudar a los usuarios a mejorar su pronunciación del idioma inglés estadounidense. Principalmente fueron tres las tecnologías implementadas: 1) un modelo reconocedor de voz utilizando una red transformadora, 2) un algoritmo de alineación de cadenas y 3) un chatbot desarrollado con el Lenguaje de Etiquetado de Inteligencia Artificial. La combinación de lo anterior dio como resultado un sistema capaz de mostrar al usuario las palabras en donde se detectaron errores de pronunciación.
Descripción
El proceso de globalización en cualquier ámbito ha requerido una mayor capacitación personal. El dominio del idioma inglés es uno de los factores de preparación mayormente demandados por las empresas. Sin embargo, existen personas a las que se les dificulta desarrollar las habilidades requeridas para dominar un nuevo idioma, de las cuales, la pronunciación es una de ellas. Algunos estudiantes que están aprendiendo un segundo idioma no cuentan con un compañero de estudio que les ayude a mejorar la habilidad del habla mediante la práctica.
Existen herramientas computacionales empleadas para ayudar a aprendices de un segundo idioma a mejorar su habilidad de pronunciación. En las últimas décadas fue ampliamente utilizado el algoritmo Goodness of Pronunciation (GOP), para realizar esta tarea, sin embargo, su funcionamiento se veía mermado al analizar oraciones largas. Posteriormente, la propiedad de memoria de las Redes Neuronales Recurrentes (RNN, por sus siglas en inglés) solucionaría parcialmente dicho problema ya que, al igual que el algoritmo GOP, se perdía información en secuencias demasiado largas. Con la llegada de la red transformadora se logró procesar secuencias completas con una mejora en el rendimiento, además sin perder información. Este tipo de red fue empleada en un inicio para problemas de texto, sin embargo, comenzó a utilizarse para la detección de voz gracias a su rendimiento. Adicionalmente, se suele utilizar un algoritmo de alineación de secuencias para lograr implementar la detección de errores de pronunciación.
Esta investigación se enfoca en el desarrollo de un sistema de detección de errores de pronunciación empleando técnicas de Inteligencia Artificial con la finalidad de ayudar a los usuarios a mejorar su pronunciación del idioma inglés estadounidense. Principalmente fueron tres las tecnologías implementadas: 1) un modelo reconocedor de voz utilizando una red transformadora, 2) un algoritmo de alineación de cadenas y 3) un chatbot desarrollado con el Lenguaje de Etiquetado de Inteligencia Artificial. La combinación de lo anterior dio como resultado un sistema capaz de mostrar al usuario las palabras en donde se detectaron errores de pronunciación.
Palabras clave
Reconocimiento Automático de Voz., Chatbot., Red Transformadora., Distancia de Levenshtein., Error de Pronunciación.