Kalinowski sostuvo que se valieron también de twitter para realizar el relevamiento y registro.


Palabras usadas para los rioplatenses como “guita” o “heladera”, términos guaraníticos como “angá”, que sugiere tanto paternidad como tristeza, o el “manso” cuyano que nada tiene que ver con el sosiego y la mesura -un manso caos sería un “flor” de caos- , son algunas de las nuevas incorporaciones de la tercera edición del Diccionario del habla de los argentinos, actualizado con la ayuda de Twitter.

Estas renovaciones, en los términos que integran el diccionario y en los métodos de selección de esos términos, fueron presentadas por Santiago Kalinowski, director del Departamento de Investigaciones Lingüísticas y Filológicas de la Academia Argentina de Letras, en una sesión plenaria especial del 8° Congreso de la Lengua Española.

“Esta tercera edición -las anteriores fueron en 2003 y 2008- es descriptiva, contiene citas documentales literarias, de prensa y de Internet, permite rastrear los sentidos de cada término a lo largo de la tradición lexicográfica argentina y se realizó con la ayuda de Twitter”, repasó Kalinowki.

Para identificar qué palabras pueden ser incorporadas desde la academia al léxico argentino, se utilizó, además del corpus de Twitter, el corpus del español del siglo XXI, lo que permitió “ajustar de manera muy precisa, sobre información estadística, la contrastividad, es decir, si una palabra se usa efectivamente sólo en Argentina”, indicó el investigador.

Tradicionalmente, explicó, los términos elegidos “tenían una gran descendencia de la marcación que hacía el Diccionario de la Lengua Española de la Real Academia (RAE)”, pero “ahora existe la posibilidad de revisar esa marcación, dando cuenta, por ejemplo, que la frecuencia de la palabra ‘heladera’ es demoledora en el Río de la Plata”.

Lo que hizo el “Diccionario del habla de los argentinos” fue dejar de atender a una frecuencia absoluta, que registra el uso de una palabra en todas las regiones del castellano, y atender la frecuencia normalizada, es decir, por región, como “una manera de equilibrar la información, porque expresa la cantidad de veces que aparece una palabra entre un millón y modera el peso que tiene España en la entrada Argentina, que es casi de tres palabras por habitante”, puntualizó.

De esa forma, por ejemplo, la Academia Argentina de Letras decidió que ‘heladera’ tenía que estar incluida en el diccionario que recoge el léxico diferencial que se usa en las 23 provincias el país “y por la misma razón introdujo entre sus nuevos términos ‘guita’, una palabra muy propia de nuestro léxico coloquial”.

Por otra parte, “el uso de Twitter como corpus lingüístico tuvo gran impacto en la confección del nuevo diccionario”, dentro del cual “se recolectaron casi 650 millones de palabras -es decir, secuencias de caracteres separados por un espacio-, agrupados por provincias, con una normalización muy básica: unos 80 millones de tuits, cerca de 56 mil usuarios y un vocabulario de más de siete millones de palabras”, dijo Kalinowski.

Se trata de un corpus muy ruidoso y con problemas muy específicos, “la ingeniería computacional que está detrás de la posibilidad de trabajar con Twitter, fue algo parecido a abrir el capó del auto y señalar el misterio del motor”, aseveró el investigador.

“Usamos un concepto tomado de la física, la entropía -explicó-, que cuando es baja significa que la palabra está concentrada en una región, caso contrario, si es alta, se usa uniformemente en todo el territorio”.

Con esa herramienta, la Academia Argentina de Letras se abocó a buscar regionalismos dentro del país y “encontró una manera más de exponer lo que todos sabemos: que la mayoría de las palabras del español las compartimos”, subrayó Kalinowski.

Con estos registros se determinaron las palabras que tuvieran mayor posibilidad de formar parte del léxico argentino: “De entre las primeras 5.000, 2.100 respondieron a esa posibilidad, lo que significa que de 2,38 palabras que usamos una es relevante lexicográficamente para los argentinos, muchas ya estaban en el diccionario y otras no teníamos ideas de que existían”.

Así, términos como “angá” (padre o tristeza en la región guaranítica de Misiones y Corrientes y Formosa) o ‘angaú’ (que significa falso, mentira, ficcional), “que para nosotros conformaban léxico extraterrestre, resulta que eran usados todos los días por millones de hablantes nativos del español”, graficó.

“Y por ese camino también llegaron términos como ‘asado’, que en Cuyo es como decir ‘quemado’ en Buenos Aires, o el sufijo ‘azo’ muy propio de esta provincia, como ‘aburridazo’, y una verdadera omisión que tenía el diccionario: “manso”, un intensificador también usado en Cuyo, que en el diccionario lleva como ejemplo la frase ‘manso embole’, que no es manso entonces, sino todo lo contrario, muy intenso”, concluyó.