lunes, 17 de agosto de 2020

La lingüista computacional que bucea en el diccionario y exhibe sus tesoros en Twitter

Se define a sí misma como filóloga y lingüista computacional. No es de extrañar, visto lo visto, que las palabras y la manera en la que se relacionan e interactúan sean para ella algo más que un oficio. Laura Martín-Pérez dedica parte de su tiempo a bucear en el diccionario. Como los arqueólogos que rescatan pecios en el fondo del océano, Martín-Pérez hace emerger en su cuenta de Twitter vocablos como cogitabundo (muy pensativo), garambaina (letra de trazos ilegibles, como la de los médicos), aloque (tinto claro o rosado) y pernear (impacientarse).

¿Por qué ese afán de bucear en el diccionario?

Cuando comencé a trabajar dentro del mundo del Procesamiento de Lenguaje Natural (PLN), una de las primeras tareas en las que participé fue listar las palabras más frecuentes del español. Me impresionó que no con muchas palabras se pudiera describir nuestro día a día, leer un periódico, expresar ideas. Y entonces pensé en los más de 93.000 lemas que tiene el diccionario de la Real Academia de la Lengua.

Todas las palabras existen por alguna razón; tienen una motivación. Fue entonces cuando pensé que el mundo que nos rodea podía ser expresado de una manera más rica, más exacta y más bella. Lo único que hacía falta era rescatar el significante, la palabra en sí. Así que bucear en el diccionario para encontrar palabras que se pudieran aplicar a nuestro día a día se convirtió en una rutina. Cuando buceo en el diccionario me topo también con palabras poco frecuentes, pero muy bellas. Estas últimas me encantan especialmente y me dan un poco de pena. Están ahí quietas en el diccionario… Casi nadie las usa. Me encanta bucear en el diccionario.

¿Cómo encuentras esas palabras tan raras y bonitas?

Lo primero que hay que pensar es en qué se va a buscar. No se puede buscar algo si no sabes qué buscas –lógicamente–. Siempre son dos ideas las que me motivan a buscar: ¿Habrá alguna palabra para…? o ¿habrá alguna palabra relacionada con…?

Si voy un día a la sierra, pienso qué palabras habrá relacionadas con el campo; si estoy en casa cocinando, pienso qué palabras habrá relacionadas con la cocina o si estoy jugando con mi perro, pienso qué palabras rodean a estos animales. Las palabras nos rodean y están ahí esperando a que las usemos.

Mi reacción siempre es la misma: ¡Anda! Hay una palabra para…

El Diccionario de la Real Academia de la Lengua no permite buscar por significado, es decir, no se puede saber qué palabras contienen en su definición, por ejemplo bondad o maldad. Conozco dos recursos digitales que sí que permiten estas búsquedas. El primero es el Diccionario Avanzado de la Real Academia de la Lengua y es de pago. El segundo es DIRAE, de Gabriel Rodríguez Alberich, y es de uso libre.

¿Qué palabras te sorprenden más? ¿Cuáles son tus favoritas?

Me sorprenden muchísimo palabras que perfectamente podríamos usar en nuestro día a día, pero que por desconocimiento, no las usamos.

También me gustan mucho las palabras cuya definición es visual, es decir, cuando leo la definición me imagino el concepto perfectamente en mi mente. Por ejemplo:
  • Flechería. Conjunto de flechas disparadas.
  • Laminera. Abeja suelta que se adelanta a las demás al olor del pasto que le agrada.
Me maravillan también las palabras que tienen una etimología con historia. Por ejemplo:
  • Gazpacho. Quizá del ár. hisp. *gazpáčo,y este del gr. γαζοφυλάκιον gazophylákion ‘cepillo de la iglesia’, por alus. a la diversidad de su contenido, ya que en él se depositaban como limosna monedas, mendrugos y otros objetos.
  • Tulipán. Del fr. tulipan,y este del turco tülbent ‘turbante’.
Estas podrían ser mis 10 palabras o expresiones favoritas del momento. No tienen un orden. Me gustan todas casi por igual… Intento incorporarlas a mi día a día y se las enseño a mi familia, compañeros de trabajo, amigos… Así es más fácil recordarlas.

¿Qué sorpresas que desconocemos se esconden en el diccionario?

Creo que no mucha gente conoce que en el DLE no solo se pueden buscar palabras, sino que se pueden buscar expresiones, anagramas, entradas del diccionario que comiencen por, terminen en o contengan alguna palabra o segmento de una palabra…

En el DIRAE o en el Diccionario Avanzado de la RAE además se puede buscar por cualquier elemento que contenga la definición. Por ejemplo, si se busca «loc. Adv.», se verán todas las locuciones adverbiales; o «desus.», se verán todas las palabras con la marca desusado.

¿Sabrías decir qué cantidad de palabras que viven en el diccionario no usamos y, sin embargo, no están marcadas como en desuso?

No puedo decir el número exacto de palabras, pero sí, sin duda utilizamos un porcentaje muy muy pequeño (¿habrá una palabra para muy muy pequeño? ¡Ajam! Existe tamarrusquito). He leído varios artículos y entradas de internet donde se dice que una persona no utiliza más de 300 palabras en su día a día. Me parecen poquísimas.

De hecho, ahora mismo llevo escritas 1.358 palabras, contando repeticiones (por ejemplo de se repite 116 veces. Sin repeticiones, he usado 525. Ahora quedaría lematizarlas, es decir, contar como únicas las formas, por ejemplo, diccionario y diccionarios… Como se ve, realmente no he utilizado muchas.

Creo que, en general, no sabemos usar bien el diccionario. ¿Qué debemos aprender a hacer? ¿Qué aconsejas tú?

Veo muchas consultas a la RAE en Twitter y pienso: ¿es que no pueden buscarlo en el diccionario? Y justamente después pienso que quizás no sepan buscar o no sepa la dirección web de la RAE o ni si quiera sepa que hay una aplicación móvil. Una vez me dijeron (hace años) que la RAE dejaba buscar tres palabras y luego tenías que pagar (atónita me quedé). Quizá no nos enseñen a manejar estos recursos o no tengamos el suficiente interés como para aprenderlo o retenerlo.

Creo que el primer contacto que tenemos con el Diccionario de la Real Academia de la Lengua es en el colegio y es ahí donde nos enseñan a utilizarlo. Se me hace muy difícil pensar que alguien no haya consultado nunca una palabra en este recurso digital o en papel.

La web del DLE y la misma aplicación para el móvil es sencilla de usar y muy intuitiva. Hay un apartando donde explica cómo se usa el diccionario. Es este. Quizá quedaría más práctico si se hiciera un vídeo.

Eres lingüista computacional. ¿Hasta qué punto se enseña a las máquinas a utilizar y conocer palabras raras? ¿Aplicas tus descubrimientos a tu trabajo o es solo una cuestión lúdica?

Actualmente trabajo desarrollando asistentes virtuales y mi trabajo se centra en hacer que el asistente virtual entienda lo que la gente escribe. Para que la máquina pueda entender lo que los usuarios escriben, primero tengo que enseñar a la máquina las palabras (léxico), y luego cómo estas se combinan (sintaxis). No creo que tenga ningún sentido enseñar a la máquina palabras muy raras que nadie use, puesto que ocurrirá como ocurre ahora: se quedarán perdidas.

Lo que sí aplico de mis descubrimientos es la manera de buscar palabras. Me es muy útil saber buscar redes semánticas y léxicas para nutrir los corpus de los asistentes. Por ejemplo, si tenemos un asistente virtual al que le podamos preguntar el tiempo, me interesa conocer las diferentes maneras que hay para decir llover, parar de llover o lluvia, ya que una persona podrá decir: ¿va a diluviar mañana? o ¿cuándo escampará?

Fuente: Yorokobu

No hay comentarios.:

Publicar un comentario