Corpus Electrónico de Narrativa Tradicional Mexicana.Un impulso a la investigación y a la promoción cultural

Por Dra. Minerva Oropeza Escobar - Investigadora del CIESAS Golfo - México

Correo electrónico: mioro@ciesas-edu.mx

 

El desarrollo de la tecnología computacional y la creciente valoración de su uso para la comprensión de diversas problemáticas teóricas y aplicadas, ha impulsado la creación y el estudio de corpus lingüísticos y el surgimiento de un nuevo campo lingüístico: el de la lingüística de corpus. Se llama corpus electrónico a una colección de habla natural electrónicamente archivada y anotada (es decir, codificada) que permite diferentes operaciones de recuperación y procesamiento de datos, facilitando con ello diversos tipos de búsqueda y posibilidades de análisis.

Para el estudio del español se han desarrollado, a la fecha, varios corpora electrónicos, los cuales, en su mayoría, constan de textos escritos de carácter literario y periodístico o de materiales orales tomados de la radio y la televisión. Ocasionalmente, incluyen muestras de habla cotidiana.

Mientras que estos corpora son sumamente importantes para alcanzar una mejor comprensión del español mexicano –y del español en general- es necesario ampliar el alcance de los materiales disponibles mediante la incorporación de datos lingüísticos recolectados en diferentes contextos situacionales, y representativos de un mayor número de géneros discursivos y áreas geográficas. La disponibilidad y accesibilidad de estos cuerpos de datos impulsará significativamente la investigación lingüística así como diversos estudios de otras disciplinas interesadas en lengua, cultura e ideología.

El propósito del proyecto “Corpus electrónico de narrativa tradicional mexicana” es dar un paso en esa dirección mediante el diseño, actualización constante y difusión de un corpus electrónico para el estudio de narrativa tradicional del estado de Veracruz. La primera etapa del proyecto, de coordinación interinstitucional CIESAS-Universidad de California en Santa Bárbara, fue auspiciada por UC MEXUS y CONACYT como parte del programa de Proyectos en Conjunto, Convocatoria 2007 (beca núm. CB-07-127), siendo corresponsables del mismo la Dra. Minerva Oropeza Escobar y el Dr. Stefan Th. Gries, respectivamente, y contando con la valiosa asesoría del Dr. John W. Du Bois.

El corpus electrónico, que estará disponible en fecha próxima a través de la página web del CIESAS-Golfo, es variado en su composición y procedencia. Ello obedece a que un amplio número de narraciones ha sido recopilado por investigadores, estudiantes y personal institucional, para diversos fines tales como la promoción cultural, la formación de antropólogos y lingüistas, la preparación de materiales de lectura para niños y adultos, la investigación académica, etc. Otros materiales que han sido publicados a la fecha, se encuentran disponibles en libros, cuadernillos, folletos y periódicos, y se dirigen a diferentes círculos de lectores, desde el infantil hasta el académico. Otros más han sido incluidos y analizados en tesis de licenciatura y posgrado.

Es importante mencionar que el corpus electrónico que nos ocupa es comprehensivo en varios respectos. En primer lugar, incluye no sólo textos obtenidos de narradores de edad avanzada, ampliamente reconocidos en sus comunidades, sino también de narradores maduros, jóvenes, y también de niños; de modo que el corpus es representativo de diferentes generaciones.

Por otra parte, las personas que recopilaron los materiales no son sólo investigadores profesionales, estudiantes de licenciatura o posgrado, o promotores culturales, sino también estudiantes de primaria que registran la tradición oral de sus comunidades como parte de su proceso educativo.

Con relación a la cobertura lingüística y geográfica, cabe mencionar que lo que ofrecemos es sólo parte del acervo que compilamos durante varios meses de trabajo intensivo. En su estado actual, el corpus no es representativo de todo el estado, pues carece aun de materiales de algunas regiones y municipios. Asimismo, visto desde la perspectiva de su diversidad lingüística, aunque contamos con material narrativo de casi todas las lenguas indígenas del estado, algunas de ellas están subrepresentadas en términos del número de textos disponibles en la muestra. En este sentido, nuestro propósito es continuar procesando los materiales con que ya contamos, a la vez que alentar la recolección de materiales relevantes en aquéllas áreas geográficas o lenguas aun no incluidas o subrepresentadas en el corpus.

El avance logrado a la fecha, no habría sido posible sin la invaluable ayuda de instituciones académicas y gubernamentales (federales, estatales y municipales), así como de estudiantes e individuos comprometidos con la preservación, documentación y difusión de la tradición oral de Veracruz. Va para todos ellos nuestro agradecimiento y nuestra cordial invitación a mantener y ampliar dicha colaboración en las etapas subsecuentes del proyecto.