• Repositorio Institucional Universidad de Pamplona
  • Producción Editorial Universidad de Pamplona
  • Revistas
  • Revista Colombiana de Tecnologias de Avanzada (RCTA)
  • Please use this identifier to cite or link to this item: http://repositoriodspace.unipamplona.edu.co/jspui/handle/20.500.12744/9478
    Title: Aprendizaje profundo para selección de opciones numéricas por voz como herramientas para chatbot
    Authors: Jiménez Moreno, Robinson
    Castro Pescador, Andrés Mauricio
    Espitia Cubillos, Anny Astrid
    Keywords: aprendizaje profundo
    inteligencia artificial
    robótica
    aplicación
    chatbot
    Issue Date: 1-Jan-2025
    Publisher: Aldo Pardo García, Revista Colombiana de Tecnologías de Avanzada, Universidad de Pamplona.
    Citation: Jiménez Moreno, R., Castro Pescador, A. M., & Espitia Cubillos, A. A. (2025). Aprendizaje profundo para selección de opciones numéricas por voz como herramientas para chatbot. REVISTA COLOMBIANA DE TECNOLOGIAS DE AVANZADA (RCTA), 1(45), 74–81. https://doi.org/10.24054/rcta.v1i45.3044
    Series/Report no.: 74;81
    Abstract: This document presents the design of a voice-operated chatbot-type assistant that works following a dialogue model between user and robot, which is trained with deep learning algorithms, using a database of spectrograms constructed from male and female voices, based on the short-time Fourier transform and Mel frequency cepstral coefficients as signal preprocessing techniques. For the recognition and classification of voice patterns, five convolutional network architectures are designed with the same parameters. The performance achieved in the training of the networks is compared, where all degrees of accuracy were greater than 92.8%. It is observed that the number of layers of the networks affects the number of learning parameters, their degree of accuracy and digital weight; in general, a greater number of layers increases both the training time and the classification time. Finally, for validation through a chatbot App, the selected network is applied to the completion of a survey that uses a Likert scale from 1 to 5, where users, in addition to saying the selected option, confirm it with a Yes or No, the App plays the audio of each question, shows its identification, listens and confirms the user's answers. The selected network design is concluded, allowing the development of chatbot applications based on audio interaction.
    Description: Este documento presenta el diseño de un asistente tipo chatbot operado por voz que funciona siguiendo un modelo de dialogo entre usuario y robot, el cual es entrenado con algoritmos de aprendizaje profundo usando una base de datos de espectrogramas, construidos a partir de voces tanto masculinas como femeninas, basados en la transformada de Fourier de corto tiempo y los coeficientes cepstrales de frecuencia Mel como técnicas de preprocesamiento de señales. Para el reconocimiento y clasificación de patrones de voz se diseñan cinco arquitecturas de red convolucional con los mismos parámetros. Se compara el desempeño en el entrenamiento de las redes donde todas obtuvieron grados de exactitud superior al 92.8%, se observa que el número de capas de las redes afecta el número de parámetros de aprendizaje, su grado de exactitud y peso digital, en general mayor cantidad de capas incrementa tanto el tiempo de entrenamiento como el tiempo de clasificación. Finalmente, para su validación mediante un App de chatbot, el diseño de la red seleccionada es aplicado al diligenciamiento de una encuesta que usa una escala de Likert de 1 a 5, en donde los usuarios además de decir la opción seleccionada la confirman con un Sí o un No, la App reproduce el audio de cada pregunta, muestra su identificación, escucha y confirma las respuestas del usuario. Se concluye el diseño de red seleccionado permite desarrollar aplicaciones de chatbot basadas en interacción por audio.
    URI: http://repositoriodspace.unipamplona.edu.co/jspui/handle/20.500.12744/9478
    ISSN: 1692-7257
    2500-8625
    Appears in Collections:Revista Colombiana de Tecnologias de Avanzada (RCTA)

    Files in This Item:
    File Description SizeFormat 
    Art08_V1_N45_2025_esp.pdfArt08_V1_N45_2025_esp701,73 kBAdobe PDFView/Open


    Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.