Tesis Doctoral "La expresión oral en español lengua extranjera: interlengua y análisis de errores basado en corpus"

Doctorando: Leonardo Campillos Llanos

Directores: Antonio Moreno Sandoval y Paula Gozalo Gómez (UAM)

Fecha: lunes 17 de diciembre de 2012, 11:00h

Lugar de defensa: Sala de Juntas, Facultad de Filosofía y Letras, Universidad Autónoma de Madrid


Resumen

La tesis estudia el desarrollo de la expresión oral (interlengua oral) de cuarenta estudiantes universitarios de español como lengua extranjera de niveles A2 y B1 (MCER). El método de obtención de datos es una entrevista semiespontánea, tomando cuatro participantes por cada lengua materna (L1) a fin de comparar los datos. Las lenguas maternas de los informantes pertenecen a la familia románica (portugués, italiano y francés), germánica (inglés, neerlandés y alemán), eslava (polaco), sino tibetana (chino) y a las lenguas de Japón (japonés); asimismo, un grupo heterogéneo de alumnos posee un origen lingüístico mixto (finés, húngaro, coreano y turco). Igualmente, se ha entrevistado a cuatro hablantes nativos de edad similar (grupo de control) para establecer comparaciones acerca del léxico o las categorías usadas en la producción oral y los errores del habla.

El estudio se fundamenta en la metodología de diversos ámbitos: la lingüística de corpus, la enseñanza de lenguas extranjeras, el análisis de errores y la investigación en adquisición de segundas lenguas. Las entrevistas fueron grabadas y transcritas a mano, y procesadas informáticamente. Uno de los resultados del proyecto es la compilación de un corpus oral de errores de aprendices de español para la consulta y el análisis, y cuya metodología de recogida se expone en la tesis.

El resto de resultados que se presentan se ha obtenido en el análisis del corpus. Por una parte, el análisis se centró en los aspectos formales (recuento de palabras, riqueza léxica, léxico y categorías más frecuentes). Para ello, se procedió a la anotación morfológica del corpus mediante un analizador informático para el español (GRAMPAL), anotación que se revisó posteriormente para corregir ambigüedades y seguir los criterios definidos según nuestra consideración de unidad léxica. Por otra parte, se realizó el análisis de errores de producción oral en el nivel léxico, gramatical, de pronunciación y pragmático discursivo. Para este fin se diseñó una tipología de errores, se anotó manualmente el corpus con etiquetas XML para los errores y se desarrolló una interfaz de consulta. Para cada punto lingüístico abordado, se detallan cuestiones como la evidencia de un mayor o menor progreso en el dominio lingüístico o la posible influencia de la lengua materna de los alumnos en el proceso de adquisición.

La tesis se acompaña de la lista de lemas producidos por los no nativos y un conjunto de tablas resumen que sintetizan los principales errores y dificultades de cada grupo lingüístico en nuestros datos.

 

Summary

The thesis studies the development of oral expression (oral interlanguage) of forty university learners of Spanish as a Foreign Language from A2 and B1 levels (CEFR). The data collection method is a semi spontaneous interview, with four participants for each mother tongue in order to compare the data. Learners’ mother tongues belong to the Romance languages (Portuguese, Italian and French), Germanic languages (English, Dutch and German), Slavonic languages (Polish), Sino-Tibetan languages (Chinese) and the languages from Japan (Japanese); besides, a heterogeneous group has a mixed linguistic background (Finnish, Hungarian, Korean and Turkish). With a view to comparing the data, four native speakers in a similar age range have been interviewed with the same procedure (control group) so as to compare the oral production of vocabulary and grammar categories as well as the errors made in speech.

The study is based on the methodology of four areas: Corpus Linguistics, Second Language Acquisition research, Second Language Teaching/Learning and Error Analysis. The interviews were recorded, manually transcribed, and computationally processed. One of the results achieved is the collection of a Spanish learner language oral corpus for search and analysis purposes, the collection methodology of which is explained in the thesis.

The rest of the results here presented were obtained in the corpus analysis. On the one hand, the analysis focuses on formal aspects (word count, lexical richness, most frequent words, and most frequent categories). For this task, the corpus was part of speech tagged by means of an automatic tagger for Spanish language (GRAMPAL); afterwards, this tagging was manually revised in order to correct ambiguities and follow the criteria established according to our definition of lexical unit. On the other hand, we performed the error analysis of the oral production at different linguistic levels (lexis-semantics, grammar, pronunciation and pragmatics discourse). For this goal, an error typology was designed, the corpus was manually annotated with XML error tags, and a search interface was developed. For every linguistic point studied, we have given details of issues such as the evidence of progress in proficiency level, or the possible influence of the learners’ mother tongue in the acquisition process.

The thesis also includes a list of the most frequent lemmas used by non-native speakers and a set of tables which summarize the main errors and difficulties found in our data for each learner group.

 

 

 
RocketTheme Joomla Templates