Análisis de las tecnologías de reconocimiento de voz que permitan la comunicación a través de internet

dc.contributor.advisorVecino Pico, Hugo
dc.contributor.authorIriarte Villalba, Beatriz Eugenia
dc.contributor.authorLeón Robles, Diana Paola
dc.contributor.authorLozada García, Claudia Liliana
dc.contributor.cvlacVecino Pico, Hugo [0000151211]spa
dc.contributor.orcidVecino Pico, Hugo [0000-0002-5935-0641]spa
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.coverage.spatialBucaramanga (Santander, Colombia)spa
dc.date.accessioned2024-08-22T12:17:46Z
dc.date.available2024-08-22T12:17:46Z
dc.date.issued2003
dc.degree.nameIngeniero de Sistemasspa
dc.description.abstractEl reconocimiento de voz es un proceso que va acompañado de un alto prado de complejidad debido a los diferentes aspectos que encierra esta tecnología y al sinnúmero de características propias tanto del lenguaje como del hablante. Es aquí donde empiezan a jugar un papel muy importante no solo los patrones sintácticos, que dependiendo de una gramática lingüística (por ejemplo, el español), asignan una estructura a las oraciones, sino también los patrones semánticos que se relacionan directamente con el significado de las palabras. Además, la aplicación de una prosodia adecuada contribuye al éxito de las aplicaciones basadas en el reconocimiento de voz. Cabe recordar, que la prosodia es la rama do la lingüística que analiza y representa aquellos elementos no vei bales de la expresión oral, tales como el acento, los tonos, la entonación y el ritmo incluyendo pausas, timbre y velocidad de habla. Existen también varias formas de categorizar la manera como el sistema se adapta a las entradas del usuario, ya sean dependientes del orador (el usuario entrena al sistema), independientes del orador y adaptativos. De igual manera, se debe definir la forma como se llevará a cabo la interacción con el usuario, en el sentido de qué tipo de entrada se aceptará: palabras aisladas o habla continua.spa
dc.description.abstractenglishSpeech recognition is a process that is accompanied by a high level of complexity due to the different aspects that this technology involves and the countless characteristics of both the language and the speaker. This is where not only syntactic patterns, which depending on a linguistic grammar (for example, Spanish), assign a structure to sentences, but also semantic patterns that are directly related to the meaning of words, begin to play a very important role. In addition, the application of an adequate prosody contributes to the success of applications based on speech recognition. It should be remembered that prosody is the branch of linguistics that analyzes and represents those non-verbal elements of oral expression, such as accent, tones, intonation and rhythm, including pauses, timbre and speech rate. There are also several ways of categorizing the way in which the system adapts to user input, whether they are speaker-dependent (the user trains the system), speaker-independent and adaptive. Likewise, the way in which interaction with the user will be carried out must be defined, in the sense of what type of input will be accepted: isolated words or continuous speech.spa
dc.description.degreelevelPregradospa
dc.description.learningmodalityModalidad Presencialspa
dc.description.tableofcontentsINTRODUCCIÓN...................................................................................................................................................................................... 20 1. LA DISCAPACIDAD Y SU RELACIÓN CON LAS TECNOLOGÍAS INFORMÁTICAS.......................................................................... 22 1.1 Definición de discapacidad...................................................................................................................................................... 22 1.2 Clases de discapacidad...................................................................................................................................................... 23 1.2.1 Discapacidades visuales...................................................................................................................................................... 23 1.2.2 Discapacidades de movimiento o motrices................................................................................................................................. 24 1.2.3 Discapacidades auditivas ..............................................................................................................................................................24 1.2.4 Discapacidades cognitivas y de lenguaje ..................................................................................................................................24 1.3 Grado de afectación........................................................................................................................................................................25 1.4 Accesibilidad a internet.................................................................................................................................................................25 1.5 Utilidades para mejorar la accesibilidad...................................................................................................................................27 1.5.1 Utilidades de entrada de voz......................................................................................................................................................27 1.5.2 Teclados en pantalla...................................................................................................................................................................27 1.5.4 Dispositivos de entrada alternativos......................................................................................................................................... 1.6 Software especializado......................................................................................................................................................27 1.6.1 Para discapacidades visuales......................................................................................................................................................27 1.6.2 Para discapacidades Auditivas...................................................................................................................................................... 28 1.6.3 Para discapacidades motrices...................................................................................................................................................... 28 1.6.4 Para discapacidades cognitivas y de lenguaje ............................................................................................................................28 2. EL RECONOCIMIENTO DE VOZ REALIZADO DIRECTAMENTE POR EL COMPUTADOR................................................................. 29 2.1 Motores de Reconocimiento...................................................................................................................................................... 31 2.1.1 Motor TTS (Text-to-Speech) ......................................................................................................................................................32 2.1.2 Motor SR (Speech Recognition) ..............................................................................................................................................33 2.2 Técnicas de Reconocimiento...................................................................................................................................................... 34 2.2.1 DTW (Dynamic Type Warping) ......................................................................................................................................................35 2.2.2 Modelos Ocultos de Maikov ......................................................................................................................................................36 2 2 3 Redes Neuronales...................................................................................................................................................... 36 2.2.4 Motor SDK 5.1 de Microsoft ......................................................................................................................................................36 3. MARCO CONCEPTUAL...................................................................................................................................................... 40 3.1 VoiceXML.......................................................................................................................................................................................... 40 3.1.1 Características de VoiceXML...................................................................................................................................................... 40 3.1.2 Arquitectura de VoiceXML...................................................................................................................................................... 41 3.1.3 Funcionamiento de VoiceXML...................................................................................................................................................... 42 3.1.4 Etiquetas VoiceXML ......................................................................................................................................................45 3.2 XML....................................................................................................................................................................................................... 47 3.2.1 Orígenes y Objetivos de XML ......................................................................................................................................................48 3.2.2 Características de XML...................................................................................................................................................... 49 3.2.3 Diferencias entre XML y HTML......................................................................................................................................................49 3.2.4 DTD (Document Type Definition)...........................................................................................................................................51 3.2.5 I terramientas para trabajar con XML...................................................................................................................................52 3.3 JAVA .............................................................................................................................................................................................53 3.3.1 Características de Java......................................................................................................................................................57 3.3.3 Arquitectura de Java .....................................................................................................................................................................58 3.3.4 Api’s de Java.................................................................................................................................................................................... 3.3.5 Java Speech Api...................................................................................................................................................... 3.3.6 Aplicabilidad de las tecnologías de voz............................................................................................................................... 3.3.8 Motores de reconocimiento de voz ...................................................................................................................................68 3.4 Visual Basic..................................................................................................................................................................................... 69 4. MICROSOFT SPEECH API...................................................................................................................................................... 72 4.1 Aspectos generales..................................................................................................................................................................... 72 4.2 Arquitectura básica...................................................................................................................................................................... 73 4.3 Gramáticas................................................................................................................................................................................... 75 4.3.1 Gramática de normalización inversa de texto..................................................................................................................... 75 4.3.2 Gramáticas independientes del contexto ...............................................................................................................................75 4.3.3 Gramáticas del dictado ................................................................................................................................................................76 4.3.4 Gramáticas de contextos específicos......................................................................................................................................... 76 4.3.5 Gramáticas definidas por la aplicación...................................................................................................................................... 76 4.3.6 Funciones gramaticales................................................................................................................................................................ 77 4.4 Consideraciones específicas ..........................................................................................................................................................78 4.4.1 Motores de SR y TTS................................................................................................................................................................. 78 4.4.2 Degradación y deterioración...................................................................................................................................................... 78 4.4.3 Unicode......................................................................................................................................................................................... 79 4.4.4 Word spotting y phrase spotting............................................................................................................................................ 79 4.4.5 Bugs y problemas de la SARI...................................................................................................................................................... 79 5. SITUACIÓN ACTIJAI. DE I AS APLICACIONES BASADAS FN RECONOCIMIENTO DE VOZ .................................................. 6. DESARROLLO DEL PRUYEC IO Y APLICABILIDAD DE LAS HERRAMIENTAS.................................................. 84 7. DISEÑO METODOLÓGICO...................................................................................................................................................... 87 7.1 Validar Usuario...................................................................................................................................................... 90 7.1.1 Captura de requerimientos...................................................................................................................................................... 90 7.1.2 Análisis y diseño...................................................................................................................................................... 90 7.2 Ingresar Información...................................................................................................................................................... 93 7.2.1 Captura de requerimientos..................................................................................................................................................... 93 7.2.2 Análisis y diseño......................................................................................................................................................................... 93 7.3 Envío de correo.............................................................................................................................................................................. 97 7.3.1 Captura de requerimientos...................................................................................................................................................... 97 7.3.2 Análisis y diseño....................................................................................................................................................................... 98 7.4 Agregar Contactos .....................................................................................................................................................................101 7.4.1 Captura de requerimientos...................................................................................................................................................... 101 7.4.2 Análisis y diseño.......................................................................................................................................................................... 101 8. CONCLUSIONES................................................................................................................................................................................ 104 9. RECOMENDACIONES........................................................................................................................................................................ 106 BIBLIOGRAFÍA .........................................................................................................................................................................................107 ANEXOS........................................................................................................................................................................................................spa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.identifier.repourlrepourl:https://repository.unab.edu.cospa
dc.identifier.urihttp://hdl.handle.net/20.500.12749/26145
dc.language.isospaspa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.relation.referencesH. Frías. Discapacidad, Conceptos. http://www.revistaunika.com.mx/concepto.htm, Septiembre. 2002.spa
dc.relation.referencesDefinición de discapacidad. http://www.microsoft.com/spain/accesibilidad/microsoft/understand.Iitm, Septiembre. 2002.spa
dc.relation.referencesDiscapacidad Motriz. http://www.forempv.ccoo.es/Proyectos/1999/1225/herramienta%2044-1.htm, Octubre. 2002spa
dc.relation.referencesLa Nación l.ine. http://www.lanacion.com.ar/coberturaespecial/porlosdemas/preguntas.asp, Enero. 2003spa
dc.relation.referenceshttp://www.microsoft.com/latam/accesibilidad/microsoft/overview.asp, Noviembre. 2002.spa
dc.relation.referencesGuías para personas con discapacidades de movilidad. http://www.microsoft.com/spain/accesibilidad/training/mobility.htm, Febrero. 2003.spa
dc.relation.referencesUtilidades para mejorar la accesibilidad de los equipos. http://www.microsoft.com/latam/accesibilidad/microsoft/computers.asp, Enero.2003.spa
dc.relation.referencesTecnologías de la Lengua, http://www.imim.es/quark/num19/019021.htm, Febrero. 2003.spa
dc.relation.referencesTecnologías del Habla. http://www.tid.es/presencia/publicaciones/comsid/esp/articulos/vol23/habla/habla.html, Febrero. 2003.spa
dc.relation.referencesTechnology Overview. http://www.microsoft.com/speech/evaluation/techover/, Febrero. 2003.spa
dc.relation.referencesReconocimiento de Voz Automático. http://www.euskalnet.net/iosus/speech/recog.html, Febrero. 2003.spa
dc.relation.referencesPreguntas Frecuentes, SpeechWare. http://speechware.be/spa/faq.htm, Febrero. 2003,spa
dc.relation.referencesE. Anderson. ¿Que es VoiceXML? http://www.galiloo.edu/wp/display/810/812.wimpy, Septiembre. 2002.spa
dc.relation.referencesY. Hernández; P. Perez y C. Rebate. Noticias, Portales de Voz. http://www.conpalabras.com/noticias/noticia01_cuerpo.html, Octubre. 2003spa
dc.relation.referencesa. López. VoiceXML. http://www.eupmt.es/projectes/tardor0102/telematica/andresdelafuentelopez.doc, Noviembre. 2002.spa
dc.relation.referencesJ. Calero; C. Rodríguez y J. A. Villaverde. Acceso Vocal a Contenidos de Internet. http://www.tid.es/presencia/publicaciones/comsid/esp/20/4XX.PDF, Febrero. 2003.spa
dc.relation.referencesS. McGlashan et al. Voice eXtensible Markup Language (VoiceXML) Versión 2.0. http://www.w3.org/TR/2003/CR-voicexml20-20030128/, Diciembre. 2003.spa
dc.relation.referencesIntroducción a XML. http://www.xml.com.ve/introduccion/introxml.html, Febrero. 2003.spa
dc.relation.referencesM. A. Álvarez. Qué es XML? http://www.desarrolloweb.com/articulos/449.php?manual=18, Enero. 2003.spa
dc.relation.referencesEstructura de un documento XML. http://www.ulpgc.es/otros/tutoriales/xml/Estructura.html, Marzo. 2003.spa
dc.relation.referencesXML. http://www.ramon.org/xml/articulos/intro_xml-html.htm, Febrero. 2003.spa
dc.relation.referencesVentajas de XML.spa
dc.relation.referencesJ. M. Calvo. XML, Futuro del Web. http://www.ubiquando.com.co/ubiquando/tecnologia/xml.xml, Febrero, 2003.spa
dc.relation.referencesCaractorísticas do Java. http.7/usuar¡os.lycos.os/jokcs/OkUpAs/javacaractor¡st¡cas.htm, Marzo. 2003.spa
dc.relation.referencesClases de Java. http://www1 ,ceit.es/Asígnaturas/lnformat2/Clases/f JracUUU I/PracUl.pdt, Abril. 2003.spa
dc.relation.referencesIntroducción a Java, http://www.monografias.com/trabaios/java/java.shtml, Marzo. 2003.spa
dc.relation.referencesJ. Ríos. ¿Por dónde empezar? http://vjuegos.cem.itesm.mx/de/donde_empezar03.html, Marzo. 2003.spa
dc.relation.referencesSun Microsystems. Apis de Java. http://atenea.udistrital.edu.co/estudiantes/lcerquera/apis.html, Marzo. 2003.spa
dc.relation.referencesSun Microsystems. What is the Java Speech Api? http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide- 0.7/lntroduction.html#7804, Marzo. 2003.spa
dc.relation.referencesSun Microsystems. http://java.sun.eom/products/java-media/speech/forDevelopers/jsapi-guide-0.7/7408, Marzo. 2003.spa
dc.relation.referencesSun Microsystems. Speech Recognition: Javax.speech.recognition. http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide- 0.7/Recognition.html#7408, Marzo. 2003.spa
dc.relation.referencesVisual Basic: Guía del Estudiante, http://www.fedesoft.com.ar/pagina_n6.htm, Abril. 2003.spa
dc.relation.referencesL. Suarez. Visual tíasic. http://www.monografias.com/trabajos2/guiavb/guiavb.shtml, Abril. 2003.spa
dc.relation.referencesVisual Rasic como Plataforma de Desarrollo. http://www3.rincondclvago.com/apuntcs/doscarga.php700026968, Abril. 2003.spa
dc.relation.referencesJ. Moreno. Arquitectura de la Interfaz Microsoft Speech Api 4.0 http://www.infor.uva.eS/~descuder/proyectos/sapi/Arquit.html#, Mayo. 2003.spa
dc.relation.referencesCloud Gardon JSAPI. http://www.cloudgarden.com/JSAPI/index.html, Mayo. 2003.spa
dc.relation.referencesSpeech I ikis http:/Av'.*.,'*.'.o2a com/Sp 1 inko htm#Artic|es/Publicafions, Mayo 2003spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordsSystems engineerspa
dc.subject.keywordsTechnological innovationsspa
dc.subject.keywordsAutomatic voice recognitionspa
dc.subject.keywordsHearing disabilitiesspa
dc.subject.keywordsComputerspa
dc.subject.keywordsNeural networksspa
dc.subject.keywordsComputer architecturespa
dc.subject.keywordsComputer network architecturespa
dc.subject.keywordsComputer software (Development)spa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembInnovaciones tecnológicasspa
dc.subject.lembArquitectura de computadoresspa
dc.subject.lembArquitectura de redes de computadoresspa
dc.subject.lembDesarrollo de softwarespa
dc.subject.proposalReconocimiento automático de la vozspa
dc.subject.proposalDiscapacidades auditivasspa
dc.subject.proposalComputadorspa
dc.subject.proposalRedes neuronalesspa
dc.titleAnálisis de las tecnologías de reconocimiento de voz que permitan la comunicación a través de internetspa
dc.title.translatedAnalysis of voice recognition technologies that enable communication over the Internetspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTrabajo de Gradospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
2003_Iriarte_Villalba_Beatriz.pdf
Tamaño:
25.08 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
829 B
Formato:
Item-specific license agreed upon to submission
Descripción: