//
 
  • Guillermo Canchola

IA: Procesamiento de Lenguaje natural VS diversidad cultural del lenguaje

Existe un paradigma en el Procesamiento de Lenguaje Natural (NPL) utilizado en Inteligencia Artificial (IA) entre la lógica mecánica del software y las contradicciones orgánicas del comportamiento humano y su lenguaje. Alguna vez se preguntaron: ¿Qué sucede cuando un usuario utiliza lo comunicativo, efusivo, colorido, diverso, expresivo, vehemente y hasta vulgar del lenguaje coloquial?


En Github existe la “Lista de palabras sucias, obscenas y palabras malas (List-of-Dirty-Naughty-Obscene-and-Otherwise-Bad-Words)” la cual enlista en varios idiomas bajo una licencia pública palabras y frases que pueden ser catalogadas como “malas” (Klingon incluido).

Estos listados, son utilizado por varias plataformas para identificar comportamientos de usuarios y sanitizar el contenido resultante. Estos listados son naturalmente imperfectos en su naturaleza al ser comparados con la morfología y diversidad del lenguaje; por ejemplo: en inglés se listan 403 palabras o frases, mientras que en español solamente 68. Con estas cantidades de palabras; simplemente es imposible filtrar la creatividad de cualquier persona para expresarse y aun más si hay referencias en doble sentido y sin cuantificar el sinnúmero de contextos donde pueden ser utilizadas correctamente.


El lenguaje está lleno de ambigüedades, de palabras con distintas interpretaciones, giros y diversos significados según el contexto; esto hace que el NLP sea una de las tareas más difíciles de dominar en tecnología. En un ambiente empresarial este tipo de lenguaje es inaceptable, pero cuando el ambiente es de negocios interpersonales, de confianza; Latinoamérica brilla y es cuasi obligatorio relajar la formalidad de la conversación.


Desde esta columna consideramos que la singularidad y la superioridad de la inteligencia artificial quedará demostrada cuando una máquina pueda aplicar adecuadamente en contexto e identidad una palabra de esta naturaleza en una conversación fluida.


La prueba de Turing a la mexicana


Con frecuencia hemos escuchado que los Bots (Chatbots) o Agentes virtuales deben de ser entrenados para interpretar cualquier frase o exclamación que un usuario exprese para comunicarse en una conversación fluida, se utilizan ejemplos para señalar las respuestas correctas e incorrectas durante cada interacción.


La prueba de Turing es un examen sobre la capacidad de una máquina para exhibir un comportamiento inteligente similar al de un ser humano o indistinguible de este. El evaluador decidirá si es una máquina o un humano quien responde. La diversidad lingüística se convierte en un verdadero reto.

Si escalamos la conversación a la diversidad lingüística utilizada en Latinoamérica como modismos, regionalismos, extranjerismos la tarea de superar la prueba de Turing es casi imposible para una máquina. En su defecto, si acotamos la prueba a solamente doble sentido podemos utilizar y programar un agente Virtual que lo intente. Citando el “Laberinto de la soledad” de Octavio Paz sigamos las siguientes reglas:


…‘El juego de los "albures" —esto es, el combate verbal hecho de alusiones obscenas y de doble sentido, que tanto se practica en la ciudad de México— transparenta esta ambigua concepción. Cada uno de los interlocutores, a través de trampas verbales y de ingeniosas combinaciones lingüísticas, procura anonadar a su adversario; el vencido es el que no puede contestar, el que se traga las palabras de su enemigo. Y esas palabras están teñidas de alusiones sexualmente agresivas; el perdidoso es poseído, violado, por el otro. Sobre él caen las burlas y escarnios de los espectadores.’…


¿Podríamos jugar contra una máquina este juego? La mayoría de las plataformas de Bots tienen por defecto una intención de “Default Fallback” o “retroceso por defecto” donde el Bot o Agente virtual recurre cuando no puede contestar o no ha entendido lo que expresa su interlocutor. En otras palabras: No se va a quedar callado NUNCA; podríamos lograr que repita 3 veces la misma frase de retroceso por defecto y que termine la interacción y así declarar el juego terminado. La intención de “Fallback” esta ahí desde el principio sin que se haya comenzado a programar.


Y ¿Qué podríamos decir de las personas que harían el entrenamiento del Agente Virtual o Bot para enseñarle tal proeza? … ¡Una cultura envidiable!


En conclusión: La diversidad lingüística llegó para quedarse y no estamos seguros de querer enseñarle a una maquina el poder del doble sentido para diversión; mantendremos la línea de hacer eficientes los procesos de negocio y experiencia del cliente.


51 visualizaciones0 comentarios

Entradas Recientes

Ver todo