¿Es un chatbot como ChatGPT ‘inteligente’? Qué es el test de Turing y para qué sirve a día de hoy

3 weeks ago 28

Alan Turing fue un matemático, lógico, informático teórico y filósofo británico (entre otras muchas cosas) y es considerado uno de los padres de la computación que sentó las bases que darían lugar a la informática moderna. Turing nació el 23 de junio de 1912 y, entre todos sus desarrollos y propuestas, creó el test de Turing, una herramienta para evaluar la capacidad de una máquina de replicar un comportamiento indistinguible al de un ser humano

Pero cuando Turing propuso esta prueba no existía ChatGPT. Ahora, hay tecnologías como este y otros chatbots conversacionales programados para emular nuestra forma de hablar y mantener una conversación con nosotros. En ese caso, ¿pasarían el test de Turing? Estudios y expertos dicen que esto ya se ha conseguido con GPT-4, pero que eso no significa que estos modelos de inteligencia artificial sean realmente ‘inteligentes’.

Geek And Poke - Turing Test.

Qué es el test de Turing y para qué sirve

La idea del test de Turing -que el matemático publicó en 1950- es que, a partir de una serie de preguntas, un ser humano puede saber (o no) si quien está respondiendo es una persona o una inteligencia artificial. Para imaginarnos la situación, tenemos que visualizar tres escenarios: en uno hay una máquina (por ejemplo, un programa de IA) y en los otros dos hay dos humanos. Uno de los humanos hace preguntas y el otro humano y la IA contestan. 
“La idea era que las máquinas solo podrían superar la prueba de Turing si presentan conocimiento, razonar, resolver problemas e ir adaptando su comportamiento a nuevas condiciones (las preguntas del interrogador)”, explica José de Gea Fernández, experto en robótica avanzada e inteligencia artificial y maldito que nos ha prestado sus superpoderes. 

En la teoría de Turing, si el interrogador humano no puede establecer con certeza si las respuestas proceden de otro humano o de una máquina, entonces se consideraría que esa máquina es ‘inteligente’. Pero, ¿que una máquina pase el test realmente implica ‘inteligencia’?

Para De Gea, “significa que la máquina es capaz de comunicarse de una forma que hace creer a un humano que al otro lado hay una persona. Decir que esto implica que la máquina es inteligente es ya otro tema más difícil, controvertido y un salto al vacío para quien lo afirme”. El experto también recuerda que la inteligencia abarca muchas más dimensiones y facetas (sensomotoras, emocionales, sociales y cognitivas). Por esta razón, “parece poco probable que el test de Turing pueda proporcionar pruebas de inteligencia”. 

¿Puede pasar ChatGPT el test de Turing? Parece que GPT-4 sí, pero esto no significa que sea ‘inteligente’

Si una de las cosas que puede evaluar el test de Turing es la capacidad de comunicación natural de la una inteligencia artificial, ¿puede superarlo un chatbot como ChatGPT? Tanto este como otros chatbots conversacionales de inteligencia artificial han mejorado muchísimo. Sí, son como loros que repiten, pero imitan muy bien nuestra forma de expresarnos.

“Hacerle un test de Turing a una IA generativa de texto (por ejemplo, ChatGPT) es algo más que asumido ya”, afirma Miguel Azores Picón, ingeniero en robótica de software especializado en ética de la tecnología y maldito que nos ha prestado sus superpoderes. Y ya hay (al menos) un par de experimentos que se han lanzado a comprobarlo.

Un estudio liderado por la Escuela de Humanidades y Ciencias de la Universidad de Stanford y publicado en la revista científica PNAS concluyó, a partir de realizar pruebas de Turing, que GPT-4 [el modelo de lenguaje de OpenAI detrás de ChatGPT] muestra “rasgos de comportamiento y personalidad que son estadísticamente indistinguibles de un humano aleatorio de entre decenas de miles de sujetos humanos de más de 50 países”.

También lo han hecho investigadores de la Universidad de California en San Diego (Estados Unidos) en una publicación, de momento, no revisada por pares, pero que según De Gea “podría anunciarse como que GPT-4 ha pasado el Test de Turing”. En el experimento se evalúan varios sistemas de IA con un test de Turing; después de una conversación de cinco minutos, el 54% de las veces los interlocutores pensaron que GPT-4 era en realidad un ser humano. “En ningún momento los autores declaran que GPT-4 es inteligente, lo que sí mencionan es que el test de Turing evalúa de alguna forma la capacidad de engaño de la máquina”, explica De Gea.

Otro ejemplo de que la tecnología ya puede suplantar al ser humano en ciertos entornos son los test CAPTCHA, que sirven para que los usuarios demuestren que son personas a través de diferentes pruebas y así evitar que programas automatizados accedan a la web, y están en continua mejora. “Continuamente se reinventa la forma de verificar si eres un humano o una máquina dentro de internet para evitar bots y, aún así, se cuelan muchos”, dice Azores.

El test de Turing no se usa actualmente para poner a prueba a los sistemas de IA, pero puede ayudarnos a definir qué es la inteligencia

Ambos expertos creen que, a efectos prácticos dentro de la comunidad científica, el test ya no es muy relevante (y ya hay expertos de IA proponiendo nuevos tests). “Históricamente el test de Turing ha sido un reto de este tipo de tecnología, pero actualmente creo que es una técnica que está en desuso, la tecnología ha avanzado mucho y hay herramientas muy especializadas en cada campo”, valora Azores. El experto cree que ya se ha quedado anticuado lo de poner a prueba a una IA según test generales porque “ya está comprobado que en entornos concretos (como hemos visto en conversaciones o interacción web) la tecnología es capaz de superar el test de Turing”. Ahora los test que se implementan para poner a prueba los sistemas de IA “son concretos y especializados para cada tarea, no ideas tan generales”. 

Por supuesto, “Turing fue un gran visionario de las máquinas inteligentes y padre de la IA, pero creo que la mayoría de la comunidad científica cree que el test de Turing no puede proporcionar pruebas de inteligencia, aunque esto requiera de alguna matización”, considera De Gea. En su experiencia, en más de 20 años trabajando en robótica e IA no ha encontrado nunca a nadie que estuviese programando IA o robots para pasar el test de Turing. “Me ocurre lo mismo que con las leyes de Asimov [las tres leyes de la robótica]: nunca he encontrado a nadie en la comunidad tecnológica programándolas o pensando en ellas”.

De Gea cree que más bien el test de Turing está concebido como experimento mental. “Proporciona un marco interesante para investigar la comprensión que tenemos de lo humano y de la inteligencia en sí misma. La prueba no sólo evalúa máquinas, también proporciona aspectos psicológicos de sus participantes humanos”, analiza De Gea. Por ejemplo, pensando en qué preguntas haríamos a una IA y en base a qué factores la evaluaríamos, cómo aborda en este artículo en The Conversation Agustín Joel Fernandes, investigador predoctoral en Filosofía en la Universidade de Santiago de Compostela.

“El test de Turing más que mejorar nuestro conocimiento sobre las máquinas nos hace entendernos mejor a nosotros mismos y nuestra definición de ser humano o de inteligencia”, concluye. Solo nos queda preguntarle a ChatGPT: ¿eres capaz de pasar el test de Turing

En este artículo han colaborado con sus superpoderes los malditos José de Gea Fernández, experto en robótica avanzada e inteligencia artificial, y Miguel Azores Picón, ingeniero en robótica de software especializado en ética de la tecnología.

Gracias a vuestros superpoderes, conocimientos y experiencia podemos luchar más y mejor contra la mentira. La comunidad de Maldita.es sois imprescindibles para parar la desinformación. Ayúdanos en esta batalla: mándanos los bulos que te lleguen a nuestro servicio de Whatsapp, préstanos tus superpoderes, difunde nuestros desmentidos y hazte Embajador.

Read Entire Article