THALES-UPM

 

  • José Manuel Pardo (IP)
  • Ricardo de Córdoba
  • Javier Ferreiros
  • José Carlos González
  • José Miguel Goñi
  • Juan Manuel Montero
  • Verónica López
  • Julián David Echeberry
  • Beatriz Martínez González
  • Juan Fernández Fernández
  • Sara Lana
  • Julio Villena

 

El grupo Tecnologías de Audio, Habla y Lenguaje Natural en Sistemas Inteligentes está formado por componentes del Grupo de Sistemas Inteligentes y el Grupo de Tecnología del Habla de la Universidad Politécnica de Madrid que se han unido con la finalidad de conformar un equipo multidisciplinar y sinérgico que persiga uno de los objetivos básicos de consorcio: el acceso y la recuperación de información multimedia y multilingüe.

El Grupo de Sistemas Inteligentes ha trabajado en Tecnologías de la Lengua desde 1990. En este campo, colaboran estrechamente con el Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid y con el Laboratorio de Bases de Datos Avanzadas de la Universidad Carlos III de Madrid. Las áreas de actividad incluyen el desarrollo de recursos lingüísticos para castellano, algoritmos y estructuras de datos para el manejo eficiente de esos recursos, así como herramientas de análisis morfosintáctico. En estos ámbitos, el grupo ha registrado algunos resultados en el Registro de la Propiedad Intelectual (recursos de la plataforma ARIES y biblioteca para la gestión de estructuras TRIE) y los ha transferido a la industria (en estos momentos son comercializados por la empresa DAEDALUS, S.A., spin-off del grupo constituida en 1998). En el apartado de aplicaciones, el Grupo de Sistemas Inteligentes ha trabajado especialmente en el ámbito de la recuperación de información multilingüe, en particular a través del foro CLEF.

El Grupo de Tecnología del Habla, estable desde finales de los años 70, desarrolla actividades científicas y tecnológicas en reconocimiento automático de habla, identificación y verificación de locutores, segmentación automática de habla en locutores, reconocimiento de idioma, comprensión de lenguaje natural,conversión texto a habla con emociones, sistemas avanzados de diálogo persona-máquina en entornos inteligentes, sistemas de traducción entre lenguas, con amplia experiencia en la traducción de voz a LSE y aplicaciones de ayudas a personas con limitaciones. Dicho grupo ha desarrollado desde 1978 sistemas de síntesis de voz de alta calidad en castellano y de reconocimiento, diálogo y comprensión de habla en distintas condiciones de vocabulario, locutores y tipo de habla. Ha colaborado con distintas empresas nacionales e internacionales en estos temas, ha comercializado varios sistemas basados en la tecnología desarrollada en el Grupo (con empresas como Speech Plus, Digital Equipment Corporation, Telia Promotor Infovox, Hewlett Packard, Dygra etc.) y ha integrado herramientas y sistemas de diseño propio en entornos empresariales, demostrando capacidad de transferencia tecnológica También ha participado en diversos proyectos europeos (ESPRIT, LRE, LE, TIDE, IST), nacionales y regionales, relacionados con esta área de investigación, disponiendo de los equipos y herramientas más avanzados para el desarrollo de la tecnología del habla. En 1993 recibió el Premio Reina Sofía 1993 de Rehabilitación e Integración y en 1995 fue organizador del congreso internacional EUROSPEECH 95 en Madrid, habiendo participado en el grupo IST 03 de la NATO y en el European Language and Speech Network Executive Board. Sus miembros han realizado estancias en centros de prestigio como MIT, UC Berkeley, University of Colorado, Cambridge University, University of Aachen, University of Edinburgh y SRI. En el área de recuperación de información en documentos hablados, un miembro del equipo ha participado en la evaluación internacional de diarización en 2006 (junto con el ICSI de Berkeley) habiendo ganado la competición. Este año, el Grupo de Tecnología del Habla participa también en esta competición.

Entre los proyectos de I+D y contratos en los que el grupo ha participado durante los últimos cinco años directamente relacionados con las líneas del consorcio destacan: ISAIAS: Desarrollo de Tecnología del habla para el tratamiento automático de información en reuniones y seminarios (TIC2000-0198-P4-04, 2001-2002); INVOCA: Interfaces vocales para control de tráfico aéreo (financiado por AENA, 2001-2003); GEMINI: Generic Environment for Multilingual Interactive Natural Interfaces (EU-IST-2001-32343, 2002-2004); RESINTRA: Apoyo a la introducción de las técnicas de reconocimiento y síntesis de voz en los procesos de simulación y cálculo de carga de trabajo (financiado por AENA, 2005-2008); Study on the Prospective of Speech-based Interfaces for future Digital Services (150794-2007 F1ED-ES, EU, 2007-2008); Desarrollo de un sistema de traducción de voz a lengua de signos española para un servicio público de atención personal (Plan Avanza, PAV-070000-2007-567, 2007-2008); ROBONAUTA: Integración de sistemas de reconocimiento en entornos de robótica móvil, reconocimiento automático de habla en entornos hostiles y en mecanismos de respuesta basados en síntesis de voz con emociones (MCYT DPI2007-66846-c02-02, 2007-2010); SD-TEAM: Modelos dinámicos de gestión de diálogo en sistemas multimodales y multidominio (MCYT, TIN2008-06856-C05-03/TIN, 2008- 2011); BRAVO: Búsqueda de Respuestas Avanzada Multimodal y Multilingüe (TIN2007-67407-C03-03, 2007-2010); ITECBAN: Infraestructura Tecnológica y Metodológica de Soporte para un Core Bancario (Programa CENIT, 2006-2010); RIMMEL: Recuperación de Información Multilingüe y Multimedia y su Evaluación (MCYT, TIN2004-07588-C03-01, 2004-2007); SADE: Servicios Avanzados Domóticos e Inmóticos en MIDAS (MCYT, TIC2003-09192-C11-06, 2003-2004); MIRACLE: Sistema de Recuperación de Información Multilingüe y su Evaluación por la Iniciativa Europea CLEF (Comunidad de Madrid TIC 07T/0055, 2003-2004); y OMNIPAPER: Smart Access to European Newspapers (Programa ESPRIT. IST-2001-32174, 2002-2004).

 

 
RocketTheme Joomla Templates