Fuentes

 

Una mirada retrospectiva sitúa los orígenes de los corpus orales en el siglo XIX, época en la que se comenzaron a recopilar textos con distintos fines: lingüísticos, filológicos o literarios. Pero la aparición de los primeros corpus electrónicos se ubica en la década de 1960, años durante los cuales se produjeron avances tecnológicos que lo permitieron.

 

Actualmente, son numerosos los corpus que circulan de distintas lenguas, los mismos presentan diversidad de formatos y finalidades. Los más conocidos dentro de la variedad española son el CREA (Corpus de Referencia del Español Actual) de la Real Academia Española y el CORDE (Corpus diacrónico del español).

 

El primero incluye más de 200 millones de palabras desde el año 1975 hasta la actualidad y está compuesto por subcorpus tales como, Corpus Oral de referencia del español contemporáneo Corlec, ACUAH Análisis de la Conversación de la Universidad de Alcalá de Henares; ALFAL Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico de la Asociación de Lingüística y Filología de América Latina, Caracas-77 y Caracas-87; CEAP Corpus de Encuestas de Asunción de Paraguay; COVJA Corpus oral de la variedad juvenil universitaria del español hablado en Alicante; COVJA Corpus para el estudio del español hablado en Santiago de Compostela; CSMV Corpus Sociolingüístico de Mérida-Venezuela; Universidad de los Andes; material procedente de Internet(Pino, 1998 ; Pino y Sánchez, 1999).

 

Por su parte, el CORDE es una colección de las primeras fuentes españolas, que hasta ahora contiene 70 millones de palabras.

 

Otro reconocido corpus es el CUMBRE (Corpus lingüístico del español contemporáneo), representativo del español oral y escrito de todos los países de habla hispana, que ha sido utilizado para la elaboración del primer diccionario de español basado en un corpus (Petra Procházková, 2006: 8;Sánchez, 1995).

 

En Argentina, en la década de 1980 aparecieron corpus escritos para la variedad del Litoral. El primero de ellos “El habla culta de la ciudad de Buenos Aires: materiales para su estudio” (Barrenechea, 1987) surgió del proyecto “Estudio coordinado de la norma lingüística culta de las principales ciudades de Hispanoamérica” dirigido por Lope Blanch y coordinado en Buenos Aires por la Dra. Ana María Barrenechea (1° etapa) y por la Dra. Ofelia Kovacci (2° etapa); más adelante apareció “El Léxico del habla culta de Buenos Aires” (Academia Argentina de Letras, 1998).

 

En cuanto a la variedad del español en San Juan, durante los años 1994-1995desde el proyecto “Estudio sociolingüístico del habla de San Juan” (INILFI-UNSJ)1 se constituyó una base de datos con el fin de abordar fenómenos de oralidad en discursos auténticos y espontáneos. Si bien no se llegó a su publicación, los discursos orales recolectados conforman los audios de la década de 1990 del presente corpus. Los parámetros que guiaron la recolección de las grabaciones, realizadas en cassettes, fueron sociolingüísticos: edad, género y nivel socio-educacional de los informantes.

 

1El equipo de investigación de este proyecto estuvo conformado por: Directora, Prof. Stella Jaime de Arrieta; Co-Directora, Prof. Mirtha Cuadros; Integrantes: Prof. Silvana Alaníz, Prof. Laura Villavicencio; Becaria de Investigación: Prof. Carmen Castro; Colaboradora: Alumna Marcela Nasrala.