Un instituto de Madrid se encargó de conocer la cantidad de léxico español que maneja la app ChatGPT que ha maravillado al mundo en el último año.
Actualmente, la Inteligencia Artificial ha tocado su techo de popularidad en diversos ámbitos y áreas del internet gracias a la cantidad de contenidos originales que puede crear el ChatGPT a partir de datos existentes.
Un grupo de investigadores de la Universidad Politécnica de Madrid idearon una aplicación conocida como ChatWords, y; a partir de ella, encontraron que, en la actualidad, la inteligencia artificial desconoce el 20% del léxico español que existe en el mundo.
Capaces de crear contenidos originales a partir de datos existentes, las aplicaciones de inteligencia artificial (IA) generativa, han registrado un desarrollo exponencial en los últimos meses. Son millones las personas que las utilizan diariamente para las tareas más diversas. Sin embargo, tenemos un conocimiento muy limitado de estas herramientas. Hasta ahora, por ejemplo, ignorábamos algo tan básico como cuántas palabras de la lengua española puede identificar ChatGPT.
El ChatGPT maneja menos lengua que la RAE
Actualmente, la Real Academia de la Lengua sigue siendo el manual y referencia para hablar el español. El diccionario actualmente tiene un universo de palabras que supera las 90.000 palabras contenidas, sin embargo, el léxico del ChatGPT3.Turbo desconoce el 20% del contenido que allí dice presente.
Adicional a esto, la aplicación ChatWords, creada para evaluar el conocimiento léxico que tiene el sistema de inteligencia artificial de diferentes idiomas, encontró que del 80% conocido por la plataforma, hay un conocimiento y uso “erróneo” del 5% de la app en cuanto al uso de las palabras.
Los problemas que traerá el desconocimiento de la lengua del ChatGPT
Aunque de momento, pudiera parecer que el ChatGPT es todo positivo, desde los investigadores, se debe tomar en cuenta este desconocimiento del léxico, puesto que, cada vez son más las personas que hacen uso del ChatGPT para hacer cualquier tipo de contenidos.
Una persona en particular, suele manejar una media de 30.000 palabras. Aunque es un número inferior al léxico español y el propio ChatGPT, el desconocimiento del 20% de la RAE, significará que se hará menor uso de nuestro idioma conforme a la creación de contenidos que surjan a través de esta app.
ChatWords es una app de código abierto
En caso de que existan personas con interés de hacer uso de la aplicación ChatWords, te decimos que la app es de código abierto y está diseñada para ser fácil de usar y ampliar. El siguiente paso de los investigadores es evaluar otros idiomas y LLM para comprender mejor el conocimiento léxico que tienen las herramientas de inteligencia artificial y cómo evoluciona a medida que aparecen nuevas versiones y herramientas.
Su trabajo se enmarca en el proyecto Redes del Futuro para Centros de Procesados de Datos y Operadores, financiado por la Agencia Estatal de Investigación, y cuenta con el apoyo de OpenAI, laboratorio estadounidense responsable de ChatGPT, a través de su programa de acceso a investigadores.