Por Antón Santamarina
Director do ILG, membro da Real Academia Galega, especialista en lexicografía e profesor na Universidade de Santiago de Compostela.
:: Xa está dispoñible a segunda versión do máis ambicioso proxecto lexicográfico galego. O seu director explica o proxecto e adianta as novidades previstas para as versións 3 e 4. Así mesmo, desde aquí podes ler algúns dos artigos recentes de Antón Santamarina sobre lexicografía dispoñibles na rede.
Levamos anos traballando nunha base de datos para un diccionario da lingua galega. Consta dun baleirado abundante de textos desde 1.600 para acó e comprende unha boa variedade de xéneros e rexistros. Pero para un diccionario de calquera lingua as obras lexicográficas precedentes son tamén unha fonte de información; na historia da nosa lexicografía se cadra se percibe isto de maneira máis chamativa ca en ningunha outra: unha voz (mesmo ás veces fantasma) é transmitida dun diccionario para outro con escasa ou ningunha reelaboración. No noso futuro diccionario, aínda que trataremos de basealo fundamentalmente en autoridades, non imos prescindir da información transmitida polos diccionarios; en moitos deles hai palabras que proceden de colleitas dialectolóxicas e que nunca entraron a formar parte do patrimonio literario e é nos diccionarios onde teñen a única documentación.
Nun principio tratamos de integrar tamén os diccionarios na base de datos xeral; teoricamente era posible: a entrada dun diccionario podería ser igual ca unha palabra calquera dun texto só que carecería de contexto á esquerda e o contexto da dereita sería unha definición (as máis das veces en castelán). Na práctica isto tiña moitos problemas; un deles é simplemente de cantidade: ás veces ese contexto da dereita (definición) pode ser una única palabra (un sinónimo en castelán) pero outras pode ser un tratado enciclopédico de catro ou cinco páxinas; nas definicións hai, por outra parte informacións moi heteroxéneas e difíciles de etiquetar e recuperar cunha base de datos convencional. Por todo iso acabamos considerando que era mellor construír unha base de datos diferente e específica para os diccionarios como fonte lexicográfica.
No curso desta elaboración pareceunos que podería ser útil non só para nós senón para un público máis amplo, principalmente o interesado polos problemas da lexicografía galega e mesmo tamén un consultor normal de diccionarios galegos. Desta maneira decidimos publicalo caendo así, sen querelo, na mesma idea que moito antes ca nós tiveran S. Gili i Gaia para o castelán co seu Tesoro ou D. Messner para o portugués co seu Dicionário de dicionários, só que o noso en formato electrónico. Outras linguas teñen tamén obras paracecidas.
Ata agora apareceron dúas edicións, unha no 2001 e outra no 2002. Na actualidade (agosto de 2002) está preparada unha terceira edición e avanzados os traballos dunha cuarta.
Teoricamente nesta obra caberían tódolos diccionarios galegos (incluídos os últimos de Xerais ou de Sotelo); por razóns obvias limitámonos só a aqueles que están fora de circulación comercial, basicamente tódolos do séc. XIX e os dos primeiros dous tercios do XX. Velaquí a lista de diccionarios incluídos (marco cun asterisco os que aparecerán na terceira edición neste mesmo ano 2002). A orde é cronolóxica:
1 *SARMIENTO. Tódalas voces glosadas, listadas ou exemplificadas extraídas das súas obras lexicográficas e epistolares conforme ás transcricións de Pensado (obras filolóxicas) e de Filgueira-Fortes (Epistolario).
2 *SOBREIRA, tamén os tres textos filolóxicos transcritos por Pensado, entre eles as Papeletas.
3 *E. R. (=Eugenio REGUERA Y PARDIÑAS?). Traducción de algunas voces, frases y locuciones gallegas, especialmente de agricultura, al castellano, segundo a transcrición de J. L. Pensado.
4. Francisco Javier RODRÍGUEZ, conforme á edición preparada por Antonio de la Iglesia.
5. PINTOS, Vocabulario, segundo a transcrición de Margarita Neira López e Xesús Riveiro Costas.
6. CUVEIRO.
7. VALLADARES, Diccionario e Nuevo suplemento, este transcrito por Maricarme García Ares.
8. Francisco PORTO REY, un Diccionario comezado en 1900, interrompido nos primeiros cadernos e publicado íntegro no 2000 segundo trnascr. de María Xesús Bugarín e Begoña González Rei.
9. LEIRAS, Vocabulario.
10. RAG, Diccionario, 1913-1928.
11. FILGUEIRA, TOBÍO, MAGARIÑOS e CORDAL, Vocabulario popular (inclúe o fragmento inédito: trevo-zuzar).
12. CARRÉ (4ª edición, última revisada).
13. Bernardo ACEVEDO Y HUELVES e Marcelino FERNÁNDEZ Y FERNÁNDEZ, Vocabulario del bable de occidente, 1932.
14. Aníbal OTERO, toda a súa obra lexicografica: as Hipótesis etimológicas referentes al gallego-portugués, publicadas en Cuadernos de Estudios Gallegos entre 1949-76; as Contribuciones al léxico gallego y asturiano publicadas en Homenaje al Exmo. Sr. Dr. D. Emilio Alarcos García, 1967; a Contribución al diccionario gallego, 1967; Algunas adiciones al léxico hispánico, Cuadernos de Estudios Gallegos, 1969; e o Vocabulario de San Jorge de Piquín, 1977.
15. José María PEREDA ÁLVAREZ, Aportaciones léxicas y folklóricas al estudio de la lengua gallega en Douro Litoral, 1953.
16. Eladio RODRÍGUEZ.
17. Apéndice ó Diccionario enciclopédico gallego-castellano de Eladio RODRÍGUEZ.
18. Elixio RIVAS, Frampas, contribución al diccionario gallego, 1978; Frampas II, 1988; e Frampas III (inédito, cedido polo autor para o Diccionario de diccionarios).
19. Constantino García González, Glosario de voces galegas de hoxe.
Adianto agora que temos prevista unha cuarta edición para o 2003 cos seguintes textos:
20. Francisco Javier RODRÍGUEZ, segundo o ms. do autor, moi diferente do texto publicado por de la Iglesia).
21. CARRÉ (1ª edición 1928-33).
22. José IBÁÑEZ FERNÁNDEZ, Diccionario galego da rima e galego-castelán.
23. X. Luís FRANCO GRANDE.
24. Mª C. RÍOS PANISSE, Nomenclatura de la flora y fauna marítimas de Galicia).
Os textos foron etiquetados segundo unha linguaxe estructurada: lema, categoría gramatical, definición. Cada un destes elementos, especialmente a definición é susceptible de marcaxes internas: texto en castelán, exemplos en galego, citas de autor, sinónimos, refráns, información gramatical, etc. Na práctica a complexidade da DTD (document text definition) acaba medrando enormemente entre outras razóns porque a micoestructura de cada diccionario varía. Pero desta maneira, mediante a fabricación de ferramentas axeitadas, pódese recuparar a información de modos moi variados. Entre as ferramentas incluídas ata agora están as que permiten facer consultas por lemas, por sinónimos, por voces galegas incluídas nas definicións e por voces castelás incluídas tamén nas definicións. Se facemos unha consulta por lemas, poñamos por caso xouba, aparecen en pantalla, sinóptica e cronoloxicamente, as definicións desta palabra en tódolos diccionarios que a inclúen. Se activamos unha busca por voces en castelán, poñamos por caso sardina, apareceranos unha lista de lemas na definición dos cales se usa a palabra sardina (sen dúbida na entrada sardiña, e seguramente tamén xouba, parrocha e probablemente ardora, banastra, espichar, saín, xeito entre outras) co cal temos case un diccionario castelán-galego de equivalentes e ideas afíns. Para o especialista hai maneira de facer buscas complexas (especialmente para os lemas). Estas ferramentas son susceptibles de mellorarase e incrementarse; entre as que se van incluir na 3ª edición figura a consulta de voces por localidades dado que unha boa parte dos textos incluídos (Acevedo, Otero, Rivas, Gracía, Panisse) indican os lugares en que se rexistra cada palabra. Na cuarta edición prevemos unha consulta na que se activen simultaneamente os lemas e os sinónimos dado que moitas veces os diccionaristas dan sinónimos que non figuran como entrada; e outra consulta na que se activen os nomes científicos da historia natural.
A lectura dos diccionarios non se fixo de maneira crítica; nos diccionarios galegos, como demostrou Pensado na súa Contribución a la crítica de la lexicografía gallega hai bastantes fantasmas e erros que se transmiten duns diccionarios para outros. Non acometemos este traballo, que sería moi laborioso e demoraría moito a aparición da obra; só nos limitamos a transcribir e corrixir grallas. A crítica lexicográfica é precisamente co diccionario de diccionarios como se pode ver moi facilitada.
Cremos que o diccionarista galego, o etimólogo e mesmo un usuario común pode encontrar unha ferramenta útil. Na terceira edición os lemas acumulados superan os 250.000 e os lemas diferentes pasan de 120.000. Hai moita información e de consulta doada sempre e cando se faga coa cautela que merecen obras escritas por lexicógrafos que non eran profesionais.
Antón Santamarina (ed.)
Diccionario de diccionarios
2ª versión, edición en CD-Rom
A Coruña: Fundación P. Barrié de la Maza, 2002
ISBN 84-89748-56-X
Páxinas web relacionadas:
Entrevista a Antón Santamarina. I e II en Canal Estudios Galegos
Artigos de A. Santamarina:
Sarmiento e a lexicografía galega, no supl. Revista das Letras, O Correo Galego (16.05.2002)
Algunhas reflexións sobre o seu significado na lexicografía galega no especial Día das Letras Galegas 2001. Eladio Rodríguez, de Vieiros