UNIR Revista
El procesamiento del lenguaje natural es un área multidisciplinar que permite la comunicación fluida entre seres humanos y máquinas, por lo que se aplica en asistentes virtuales, chabots o traductores.
Lingüística e Inteligencia Artificial (IA) van de la mano en el procesamiento del lenguaje natural (PLN). Aunque en un principio pueda parecer que ambas disciplinas nada tienen que ver entre sí, lo cierto es que el trabajo conjunto con ambas ha permitido grandes avances tecnológicos como los chatbots, los traductores automáticos o los asistentes de voz. Detrás de todo ello, está el PLN, un campo en constante evolución.
El procesamiento del lenguaje natural es uno de los campos de las ciencias de la computación que aborda la transformación del lenguaje —que el ser humano emplea a diario para comunicarse— en uno que los ordenadores puedan entender y manejar. Esta rama de la inteligencia artificial, la cual se estudia en el Máster en IA online de UNIR, permite que los ordenadores puedan procesar el lenguaje hablado y escrito.
Tiene sus orígenes a mediados del siglo pasado, en un artículo publicado por el precursor de la informática moderna, Alan Turing. El matemático británico proponía el hoy conocido como Test de Turing, una prueba que trata de demostrar el comportamiento inteligente de las máquinas. En ella, una persona habla con otros dos interlocutores, uno es también un humano, el otro, un ordenador. El objetivo es demostrar si la máquina es capaz de engañar a la persona, imitando las respuestas humanas, para lo que debe emplear el mismo lenguaje.
Si en un principio se codificaban manualmente las normas lingüísticas, lo que se tradujo en que los ordenadores pudiesen diferenciar tiempos y conjugaciones verbales, el auténtico avance llegó con la aplicación de la estadística. La utilización de algoritmos facilita el análisis de texto y la búsqueda de patrones.
El procesamiento de lenguaje natural recurre a diferentes tipos de análisis:
Análisis fonológico
Es la capacidad de reconocer los sonidos del lenguaje hablado, cómo se dividen y combinan.
Análisis morfológico
Permite clasificar las palabras de una frase atendiendo a su categoría gramatical (sustantivos, adjetivos, verbos, adverbios…) y sus variaciones en cuanto a género, número y tiempo verbal.
Análisis sintáctico
Determina la estructura de las frases y sus partes (sujeto, verbo y predicado).
Análisis semántico
Además de procesar el significado de cada palabra individualmente, debe hacer lo mismo con el conjunto del mensaje, sea una sola frase o varias.
Análisis pragmático
Quizá sea el paso más complejo, porque debe entender la intención del mensaje analizando su contexto, cuestiones como el estado de ánimo del interlocutor, si emplea la ironía…
Aplicaciones del procesamiento de lenguaje natural y ejemplos
Siri y Alexa son el ejemplo más claro de la aplicación del PLN, pero también la traducción automática, la recuperación de información o cualquier otra función en la que se emplee el reconocimiento de voz. Sus aplicaciones son múltiples:
Asistentes virtuales
Son el mejor ejemplo de la interacción natural entre el ser humano y las máquinas, un tipo de software que puede procesar órdenes y ejecutarlas.
Chatbots
Forman parte de la transformación digital de las empresas de cualquier sector. Hacen las veces de robots virtuales capaces de responder a dudas de los usuarios o clientes, simulando una conversación real.
Autocorrector de texto
Utilizado a diario por millones de personas, facilita la redacción de cualquier documento. Recurre a uno o varios diccionarios integrados para revisar un texto, descubrir errores y corregirlos.
Análisis de textos
El PLN permite el tratamiento de textos digitales o digitalizados para descubrir temas, clasificar documentos o incluso, analizar el tono y el estado de ánimo con el que se escribe una frase.
Google Translator y traductores de voz
Funcionan con más de un centenar de idiomas y se apoyan en los análisis del PLN.
Síntesis y reconocimiento de voz
Es el proceso gracias al cual una máquina puede simular el habla de un ser humano o reconocer voces. La fonética cobra aquí especial importancia.
Filtros de correo electrónico
En un principio el procesamiento del lenguaje natural comenzó a emplearse para establecer filtros con los que detectar correo no deseado o spam, a partir de la identificación de palabras clave. Hoy, esos filtros se han ido perfeccionando y el correo electrónico de Gmail llega a clasificar los mensajes recibidos en varias categorías (redes sociales, notificaciones, foros, promociones). Gracias a esto, el usuario tiene un mayor control de su bandeja de entrada.
Resultados de búsqueda
Los buscadores recurren al PLN para ofrecer resultados que se ajusten al máximo a la búsqueda realizada. No se centran en el significado literal de las palabras introducidas por el usuario, sino que analizan qué es lo que quiere decir, cuál es la intención de la búsqueda. De ahí que cuando se escribe una palabra mal, el buscador lo corrija.
Muchas de las acciones que realizamos a diario se basan en ese procesamiento del lenguaje natural que hoy se ha convertido en una herramienta imprescindible, al aportar grandes beneficios, como manejar un mayor número de información, ahorrar tiempo en determinadas tareas como la clasificación de datos o facilitar la toma de decisiones.