Tesis Doctoral "Estudio y nuevas estrategias en el uso de las Entidades Nombradas en el clustering bilingüe de noticias"

Doctorando: Soto Montalvo Herranz

Directores: Raquel Martínez Unanue (UNED), Víctor Fresno Fernández (UNED)

Fecha: miércoles 27 de febrero de 2013, a las 11:30h

Lugar de defensa: Salón de Grados, Edificio Departamental II, Escuela Técnica Superior de Ingeniería Informática, Universidad Rey Juan Carlos (Campus de Móstoles)


Resumen

En esta tesis el interés se centra en el clustering de noticias, agrupando las noticias en base a su similitud temática, con independencia de la lengua en la que las noticias estén escritas. Como unidad de texto fundamental se estudian las Entidades Nombradas, unidades de información que pueden hacer referencia a personas, lugares, organizaciones, fechas y datos de tiempo o valores numéricos y porcentajes, entre otros elementos. Considerando el estilo de redacción de las noticias,  donde lo primordial es informar, y donde en un porcentaje alto se describen uno o más sucesos específicos, es habitual encontrar Entidades Nombradas con información acerca de los protagonistas del suceso o evento que se describe en la noticia, así como cuándo y dónde se produce.

Se realizan estudios y se plantean propuestas sobre cómo utilizar las  Entidades Nombradas en cada una de las etapas de un proceso de clustering. El objetivo principal de la tesis es aprovechar lo máximo posible las Entidades Nombradas, de forma que permita mejorar los resultados del clustering de noticias.

 
RocketTheme Joomla Templates