Dialogar con las máquinas: la evolución del PLN
Por Claudia Pons*
Hasta hace pocos años, comunicarnos mediante la voz con nuestros artefactos tecnológicos resultaba una tarea frustrante. Afortunadamente, gracias al procesamiento del lenguaje natural, abreviado PLN, hoy podemos disfrutar de una comunicación mucho más satisfactoria con nuestros dispositivos cibernéticos. Actualmente las máquinas son capaces de “entender” nuestro lenguaje cuando le damos una orden (Ej: “llamar a casa”), pero van mucho más allá. También son capaces de generar contenidos en nuestro lenguaje, es decir son capaces de mantener una conversación.
¿Qué es el PLN?
El PLN (o NLP por su nombre en inglés, Natural Language Processing) es un campo dentro de la Inteligencia Artificial (IA) y la lingüística aplicada que estudia las interacciones mediadas por lenguaje natural entre los seres humanos y las máquinas. Se busca que las máquinas consigan entender, interpretar y manipular el lenguaje humano.
¿Por qué el PLN evolucionó exponencialmente en estos últimos años?
Si bien esta disciplina se originó en la década del 50, recién en los últimos años ha logrado avances significativos. Inicialmente los sistemas de PLN se basaban en un complejo conjunto de reglas diseñadas a mano (como la gramática que estudiamos en la escuela: Sujeto, Predicado, Objeto Directo, etc.). Luego, a partir de 2010, se desarrollaron nuevos métodos utilizando aprendizaje automático (o en inglés, machine learning) - en particular una técnica conocida como “representation learning” y el uso de redes neuronales profundas -, que han dejado de lado las reglas gramaticales para permitir que la máquina aprenda a manejar el lenguaje “a su manera” a partir de “ejemplos”.
Este cambio de paradigma, acompañado por los grandes volúmenes de datos disponibles en la web, la gran capacidad de computación actual y los avances en el campo de los algoritmos han propiciado el crecimiento exponencial de esta disciplina.
¿Qué tareas concretas resuelve el PLN?
Básicamente, esta disciplina se ocupa de: Reconocer la voz (o speech recognition), consiste en por ejemplo traducir de audio a texto. Y su contraparte (mucho más sencilla de implementar) de leer texto en voz alta. Entender o interpretar el lenguaje humano. Generar contenidos expresados en lenguaje humano.
¿Y para qué lo usamos?
La aplicación más conocida del PLN son los asistentes virtuales o bots de charla (en inglés, chatbot), que son sistemas informáticos (software) capaces de mantener una conversación. Un chatbot realiza dos tareas principales: entender lo que un usuario dice (o escribe) en una conversación y ser capaz de responder de forma coherente.
Hay dos tipos de bots, los bots poco inteligentes, que solo siguen un “libreto” respondiendo a lo que ya tienen predefinido por el desarrollador y por otra parte los bots pseudo inteligentes que pueden generar sus propias respuestas, es decir pueden crear un nuevo mensaje en lenguaje humano de manera autónoma. Estos últimos tienen que ser entrenados para que funcionen correctamente.
Los asistentes virtuales más usados en nuestro país son Siri de Apple, Alexa de Amazon y el Google Assistant. Y en este contexto es oportuno mencionar a GPT-3, el nuevo modelo de lenguaje de la compañía norteamericana OpenAI que muestra resultados sorprendentes.
El GPT-3 utiliza deep learning y ha sido entrenado con casi todos los libros públicos que se hayan escrito y digitalizado, toda la Wikipedia y millones de páginas web y documentos científicos. Esencialmente ha absorbido todo el conocimiento humano más relevante que hemos publicado en la web. Y con ello es capaz de sostener diálogos complejos y coherentes.
Pero… ¿La máquina está realmente entendiendo nuestro lenguaje? Ante el asombroso comportamiento de estos bots podemos preguntarnos ¿Estas máquinas en realidad piensan? ¿Realmente entienden el lenguaje?
Los bots se acercan cada vez más a la superación del conocido "Test de Turing", que establece la imposibilidad por parte del interlocutor humano de asegurar si mantiene una conversación con un humano o bien un bot. Pero las máquinas carecen de auténtica conciencia de sí mismas y no comprenden realmente el significado de las palabras. Aunque claro, cuando lo que han aprendido son millones de páginas web y enciclopedias enteras, los resultados son al menos sorprendentes.
Esto me recuerda al cuento de Jorge Luis Borges, “Funes, el memorioso” (1942). Allí se puede leer “Funes había aprendido sin esfuerzo el inglés, el francés, el portugués, el latín. Sospecho, sin embargo, que no era muy capaz de pensar. Pensar es olvidar diferencias, es generalizar, abstraer.”
Memorizar grandes volúmenes de información no es realmente “pensar” y ser “consciente” de los que se está diciendo o haciendo.
¿Y entonces?
Los chatbot, aún con su limitada inteligencia, resultan de gran utilidad. Ya sea como asistentes o asesores en distintos dominios (ej. finanzas, salud y seguridad), o como compañía para la gente anciana, aislada u ociosa. Si aún no los conocen, no dejen de mantener una charla con ellos, se van a sorprender. Por momentos dudarán sobre su carencia de consciencia.
* La Dra. Claudia Pons es directora del Centro de Altos Estudios en Tecnología Informática de UAI. También es profesora titular de la cátedra "Inteligencia Artificial" de la Facultad de Informática de la UNLP y fue investigadora del CONICET.