Análisis de las tecnologías de reconocimiento de voz que permitan la comunicación a través de internet
| dc.contributor.advisor | Vecino Pico, Hugo | |
| dc.contributor.author | Iriarte Villalba, Beatriz Eugenia | |
| dc.contributor.author | León Robles, Diana Paola | |
| dc.contributor.author | Lozada García, Claudia Liliana | |
| dc.contributor.cvlac | Vecino Pico, Hugo [0000151211] | spa |
| dc.contributor.orcid | Vecino Pico, Hugo [0000-0002-5935-0641] | spa |
| dc.coverage.campus | UNAB Campus Bucaramanga | spa |
| dc.coverage.spatial | Bucaramanga (Santander, Colombia) | spa |
| dc.date.accessioned | 2024-08-22T12:17:46Z | |
| dc.date.available | 2024-08-22T12:17:46Z | |
| dc.date.issued | 2003 | |
| dc.degree.name | Ingeniero de Sistemas | spa |
| dc.description.abstract | El reconocimiento de voz es un proceso que va acompañado de un alto prado de complejidad debido a los diferentes aspectos que encierra esta tecnología y al sinnúmero de características propias tanto del lenguaje como del hablante. Es aquí donde empiezan a jugar un papel muy importante no solo los patrones sintácticos, que dependiendo de una gramática lingüística (por ejemplo, el español), asignan una estructura a las oraciones, sino también los patrones semánticos que se relacionan directamente con el significado de las palabras. Además, la aplicación de una prosodia adecuada contribuye al éxito de las aplicaciones basadas en el reconocimiento de voz. Cabe recordar, que la prosodia es la rama do la lingüística que analiza y representa aquellos elementos no vei bales de la expresión oral, tales como el acento, los tonos, la entonación y el ritmo incluyendo pausas, timbre y velocidad de habla. Existen también varias formas de categorizar la manera como el sistema se adapta a las entradas del usuario, ya sean dependientes del orador (el usuario entrena al sistema), independientes del orador y adaptativos. De igual manera, se debe definir la forma como se llevará a cabo la interacción con el usuario, en el sentido de qué tipo de entrada se aceptará: palabras aisladas o habla continua. | spa |
| dc.description.abstractenglish | Speech recognition is a process that is accompanied by a high level of complexity due to the different aspects that this technology involves and the countless characteristics of both the language and the speaker. This is where not only syntactic patterns, which depending on a linguistic grammar (for example, Spanish), assign a structure to sentences, but also semantic patterns that are directly related to the meaning of words, begin to play a very important role. In addition, the application of an adequate prosody contributes to the success of applications based on speech recognition. It should be remembered that prosody is the branch of linguistics that analyzes and represents those non-verbal elements of oral expression, such as accent, tones, intonation and rhythm, including pauses, timbre and speech rate. There are also several ways of categorizing the way in which the system adapts to user input, whether they are speaker-dependent (the user trains the system), speaker-independent and adaptive. Likewise, the way in which interaction with the user will be carried out must be defined, in the sense of what type of input will be accepted: isolated words or continuous speech. | spa |
| dc.description.degreelevel | Pregrado | spa |
| dc.description.learningmodality | Modalidad Presencial | spa |
| dc.description.tableofcontents | INTRODUCCIÓN...................................................................................................................................................................................... 20 1. LA DISCAPACIDAD Y SU RELACIÓN CON LAS TECNOLOGÍAS INFORMÁTICAS.......................................................................... 22 1.1 Definición de discapacidad...................................................................................................................................................... 22 1.2 Clases de discapacidad...................................................................................................................................................... 23 1.2.1 Discapacidades visuales...................................................................................................................................................... 23 1.2.2 Discapacidades de movimiento o motrices................................................................................................................................. 24 1.2.3 Discapacidades auditivas ..............................................................................................................................................................24 1.2.4 Discapacidades cognitivas y de lenguaje ..................................................................................................................................24 1.3 Grado de afectación........................................................................................................................................................................25 1.4 Accesibilidad a internet.................................................................................................................................................................25 1.5 Utilidades para mejorar la accesibilidad...................................................................................................................................27 1.5.1 Utilidades de entrada de voz......................................................................................................................................................27 1.5.2 Teclados en pantalla...................................................................................................................................................................27 1.5.4 Dispositivos de entrada alternativos......................................................................................................................................... 1.6 Software especializado......................................................................................................................................................27 1.6.1 Para discapacidades visuales......................................................................................................................................................27 1.6.2 Para discapacidades Auditivas...................................................................................................................................................... 28 1.6.3 Para discapacidades motrices...................................................................................................................................................... 28 1.6.4 Para discapacidades cognitivas y de lenguaje ............................................................................................................................28 2. EL RECONOCIMIENTO DE VOZ REALIZADO DIRECTAMENTE POR EL COMPUTADOR................................................................. 29 2.1 Motores de Reconocimiento...................................................................................................................................................... 31 2.1.1 Motor TTS (Text-to-Speech) ......................................................................................................................................................32 2.1.2 Motor SR (Speech Recognition) ..............................................................................................................................................33 2.2 Técnicas de Reconocimiento...................................................................................................................................................... 34 2.2.1 DTW (Dynamic Type Warping) ......................................................................................................................................................35 2.2.2 Modelos Ocultos de Maikov ......................................................................................................................................................36 2 2 3 Redes Neuronales...................................................................................................................................................... 36 2.2.4 Motor SDK 5.1 de Microsoft ......................................................................................................................................................36 3. MARCO CONCEPTUAL...................................................................................................................................................... 40 3.1 VoiceXML.......................................................................................................................................................................................... 40 3.1.1 Características de VoiceXML...................................................................................................................................................... 40 3.1.2 Arquitectura de VoiceXML...................................................................................................................................................... 41 3.1.3 Funcionamiento de VoiceXML...................................................................................................................................................... 42 3.1.4 Etiquetas VoiceXML ......................................................................................................................................................45 3.2 XML....................................................................................................................................................................................................... 47 3.2.1 Orígenes y Objetivos de XML ......................................................................................................................................................48 3.2.2 Características de XML...................................................................................................................................................... 49 3.2.3 Diferencias entre XML y HTML......................................................................................................................................................49 3.2.4 DTD (Document Type Definition)...........................................................................................................................................51 3.2.5 I terramientas para trabajar con XML...................................................................................................................................52 3.3 JAVA .............................................................................................................................................................................................53 3.3.1 Características de Java......................................................................................................................................................57 3.3.3 Arquitectura de Java .....................................................................................................................................................................58 3.3.4 Api’s de Java.................................................................................................................................................................................... 3.3.5 Java Speech Api...................................................................................................................................................... 3.3.6 Aplicabilidad de las tecnologías de voz............................................................................................................................... 3.3.8 Motores de reconocimiento de voz ...................................................................................................................................68 3.4 Visual Basic..................................................................................................................................................................................... 69 4. MICROSOFT SPEECH API...................................................................................................................................................... 72 4.1 Aspectos generales..................................................................................................................................................................... 72 4.2 Arquitectura básica...................................................................................................................................................................... 73 4.3 Gramáticas................................................................................................................................................................................... 75 4.3.1 Gramática de normalización inversa de texto..................................................................................................................... 75 4.3.2 Gramáticas independientes del contexto ...............................................................................................................................75 4.3.3 Gramáticas del dictado ................................................................................................................................................................76 4.3.4 Gramáticas de contextos específicos......................................................................................................................................... 76 4.3.5 Gramáticas definidas por la aplicación...................................................................................................................................... 76 4.3.6 Funciones gramaticales................................................................................................................................................................ 77 4.4 Consideraciones específicas ..........................................................................................................................................................78 4.4.1 Motores de SR y TTS................................................................................................................................................................. 78 4.4.2 Degradación y deterioración...................................................................................................................................................... 78 4.4.3 Unicode......................................................................................................................................................................................... 79 4.4.4 Word spotting y phrase spotting............................................................................................................................................ 79 4.4.5 Bugs y problemas de la SARI...................................................................................................................................................... 79 5. SITUACIÓN ACTIJAI. DE I AS APLICACIONES BASADAS FN RECONOCIMIENTO DE VOZ .................................................. 6. DESARROLLO DEL PRUYEC IO Y APLICABILIDAD DE LAS HERRAMIENTAS.................................................. 84 7. DISEÑO METODOLÓGICO...................................................................................................................................................... 87 7.1 Validar Usuario...................................................................................................................................................... 90 7.1.1 Captura de requerimientos...................................................................................................................................................... 90 7.1.2 Análisis y diseño...................................................................................................................................................... 90 7.2 Ingresar Información...................................................................................................................................................... 93 7.2.1 Captura de requerimientos..................................................................................................................................................... 93 7.2.2 Análisis y diseño......................................................................................................................................................................... 93 7.3 Envío de correo.............................................................................................................................................................................. 97 7.3.1 Captura de requerimientos...................................................................................................................................................... 97 7.3.2 Análisis y diseño....................................................................................................................................................................... 98 7.4 Agregar Contactos .....................................................................................................................................................................101 7.4.1 Captura de requerimientos...................................................................................................................................................... 101 7.4.2 Análisis y diseño.......................................................................................................................................................................... 101 8. CONCLUSIONES................................................................................................................................................................................ 104 9. RECOMENDACIONES........................................................................................................................................................................ 106 BIBLIOGRAFÍA .........................................................................................................................................................................................107 ANEXOS........................................................................................................................................................................................................ | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
| dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
| dc.identifier.repourl | repourl:https://repository.unab.edu.co | spa |
| dc.identifier.uri | http://hdl.handle.net/20.500.12749/26145 | |
| dc.language.iso | spa | spa |
| dc.publisher.faculty | Facultad Ingeniería | spa |
| dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
| dc.publisher.program | Pregrado Ingeniería de Sistemas | spa |
| dc.relation.references | H. Frías. Discapacidad, Conceptos. http://www.revistaunika.com.mx/concepto.htm, Septiembre. 2002. | spa |
| dc.relation.references | Definición de discapacidad. http://www.microsoft.com/spain/accesibilidad/microsoft/understand.Iitm, Septiembre. 2002. | spa |
| dc.relation.references | Discapacidad Motriz. http://www.forempv.ccoo.es/Proyectos/1999/1225/herramienta%2044-1.htm, Octubre. 2002 | spa |
| dc.relation.references | La Nación l.ine. http://www.lanacion.com.ar/coberturaespecial/porlosdemas/preguntas.asp, Enero. 2003 | spa |
| dc.relation.references | http://www.microsoft.com/latam/accesibilidad/microsoft/overview.asp, Noviembre. 2002. | spa |
| dc.relation.references | Guías para personas con discapacidades de movilidad. http://www.microsoft.com/spain/accesibilidad/training/mobility.htm, Febrero. 2003. | spa |
| dc.relation.references | Utilidades para mejorar la accesibilidad de los equipos. http://www.microsoft.com/latam/accesibilidad/microsoft/computers.asp, Enero.2003. | spa |
| dc.relation.references | Tecnologías de la Lengua, http://www.imim.es/quark/num19/019021.htm, Febrero. 2003. | spa |
| dc.relation.references | Tecnologías del Habla. http://www.tid.es/presencia/publicaciones/comsid/esp/articulos/vol23/habla/habla.html, Febrero. 2003. | spa |
| dc.relation.references | Technology Overview. http://www.microsoft.com/speech/evaluation/techover/, Febrero. 2003. | spa |
| dc.relation.references | Reconocimiento de Voz Automático. http://www.euskalnet.net/iosus/speech/recog.html, Febrero. 2003. | spa |
| dc.relation.references | Preguntas Frecuentes, SpeechWare. http://speechware.be/spa/faq.htm, Febrero. 2003, | spa |
| dc.relation.references | E. Anderson. ¿Que es VoiceXML? http://www.galiloo.edu/wp/display/810/812.wimpy, Septiembre. 2002. | spa |
| dc.relation.references | Y. Hernández; P. Perez y C. Rebate. Noticias, Portales de Voz. http://www.conpalabras.com/noticias/noticia01_cuerpo.html, Octubre. 2003 | spa |
| dc.relation.references | a. López. VoiceXML. http://www.eupmt.es/projectes/tardor0102/telematica/andresdelafuentelopez.doc, Noviembre. 2002. | spa |
| dc.relation.references | J. Calero; C. Rodríguez y J. A. Villaverde. Acceso Vocal a Contenidos de Internet. http://www.tid.es/presencia/publicaciones/comsid/esp/20/4XX.PDF, Febrero. 2003. | spa |
| dc.relation.references | S. McGlashan et al. Voice eXtensible Markup Language (VoiceXML) Versión 2.0. http://www.w3.org/TR/2003/CR-voicexml20-20030128/, Diciembre. 2003. | spa |
| dc.relation.references | Introducción a XML. http://www.xml.com.ve/introduccion/introxml.html, Febrero. 2003. | spa |
| dc.relation.references | M. A. Álvarez. Qué es XML? http://www.desarrolloweb.com/articulos/449.php?manual=18, Enero. 2003. | spa |
| dc.relation.references | Estructura de un documento XML. http://www.ulpgc.es/otros/tutoriales/xml/Estructura.html, Marzo. 2003. | spa |
| dc.relation.references | XML. http://www.ramon.org/xml/articulos/intro_xml-html.htm, Febrero. 2003. | spa |
| dc.relation.references | Ventajas de XML. | spa |
| dc.relation.references | J. M. Calvo. XML, Futuro del Web. http://www.ubiquando.com.co/ubiquando/tecnologia/xml.xml, Febrero, 2003. | spa |
| dc.relation.references | Caractorísticas do Java. http.7/usuar¡os.lycos.os/jokcs/OkUpAs/javacaractor¡st¡cas.htm, Marzo. 2003. | spa |
| dc.relation.references | Clases de Java. http://www1 ,ceit.es/Asígnaturas/lnformat2/Clases/f JracUUU I/PracUl.pdt, Abril. 2003. | spa |
| dc.relation.references | Introducción a Java, http://www.monografias.com/trabaios/java/java.shtml, Marzo. 2003. | spa |
| dc.relation.references | J. Ríos. ¿Por dónde empezar? http://vjuegos.cem.itesm.mx/de/donde_empezar03.html, Marzo. 2003. | spa |
| dc.relation.references | Sun Microsystems. Apis de Java. http://atenea.udistrital.edu.co/estudiantes/lcerquera/apis.html, Marzo. 2003. | spa |
| dc.relation.references | Sun Microsystems. What is the Java Speech Api? http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide- 0.7/lntroduction.html#7804, Marzo. 2003. | spa |
| dc.relation.references | Sun Microsystems. http://java.sun.eom/products/java-media/speech/forDevelopers/jsapi-guide-0.7/7408, Marzo. 2003. | spa |
| dc.relation.references | Sun Microsystems. Speech Recognition: Javax.speech.recognition. http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide- 0.7/Recognition.html#7408, Marzo. 2003. | spa |
| dc.relation.references | Visual Basic: Guía del Estudiante, http://www.fedesoft.com.ar/pagina_n6.htm, Abril. 2003. | spa |
| dc.relation.references | L. Suarez. Visual tíasic. http://www.monografias.com/trabajos2/guiavb/guiavb.shtml, Abril. 2003. | spa |
| dc.relation.references | Visual Rasic como Plataforma de Desarrollo. http://www3.rincondclvago.com/apuntcs/doscarga.php700026968, Abril. 2003. | spa |
| dc.relation.references | J. Moreno. Arquitectura de la Interfaz Microsoft Speech Api 4.0 http://www.infor.uva.eS/~descuder/proyectos/sapi/Arquit.html#, Mayo. 2003. | spa |
| dc.relation.references | Cloud Gardon JSAPI. http://www.cloudgarden.com/JSAPI/index.html, Mayo. 2003. | spa |
| dc.relation.references | Speech I ikis http:/Av'.*.,'*.'.o2a com/Sp 1 inko htm#Artic|es/Publicafions, Mayo 2003 | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
| dc.subject.keywords | Systems engineer | spa |
| dc.subject.keywords | Technological innovations | spa |
| dc.subject.keywords | Automatic voice recognition | spa |
| dc.subject.keywords | Hearing disabilities | spa |
| dc.subject.keywords | Computer | spa |
| dc.subject.keywords | Neural networks | spa |
| dc.subject.keywords | Computer architecture | spa |
| dc.subject.keywords | Computer network architecture | spa |
| dc.subject.keywords | Computer software (Development) | spa |
| dc.subject.lemb | Ingeniería de sistemas | spa |
| dc.subject.lemb | Innovaciones tecnológicas | spa |
| dc.subject.lemb | Arquitectura de computadores | spa |
| dc.subject.lemb | Arquitectura de redes de computadores | spa |
| dc.subject.lemb | Desarrollo de software | spa |
| dc.subject.proposal | Reconocimiento automático de la voz | spa |
| dc.subject.proposal | Discapacidades auditivas | spa |
| dc.subject.proposal | Computador | spa |
| dc.subject.proposal | Redes neuronales | spa |
| dc.title | Análisis de las tecnologías de reconocimiento de voz que permitan la comunicación a través de internet | spa |
| dc.title.translated | Analysis of voice recognition technologies that enable communication over the Internet | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | spa |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
| dc.type.local | Trabajo de Grado | spa |
| dc.type.redcol | http://purl.org/redcol/resource_type/TP |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 2003_Iriarte_Villalba_Beatriz.pdf
- Tamaño:
- 25.08 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 829 B
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
