11 octubre 2016

El dilema del prisionero


El dilema del prisionero es un problema fundamental de la teoría de juegos que muestra que dos personas pueden no cooperar incluso si ello va en contra del interés de ambas.
La policía arresta a dos sospechosos. No hay pruebas suficientes para condenarlos y, tras haberlos separado, los visita a cada uno y les ofrece el mismo trato. Si uno confiesa y su cómplice no, el cómplice será condenado a la pena total, diez años, y el primero será liberado. Si uno calla y el cómplice confiesa, el primero recibirá esa pena y será el cómplice quien salga libre. Si ambos confiesan, ambos serán condenados a seis años. Si ambos lo niegan, todo lo que podrán hacer será encerrarlos durante un año por un cargo menor.

Para tenerlo más claro:
Supongamos que ambos prisioneros son completamente egoístas y su único objetivo es reducir su propia estancia en la cárcel. Como prisioneros tienen dos opciones: cooperar con su cómplice y permanecer callado, o traicionar a su cómplice y confesar. Pero el resultado no depende únicamente de nosotros, depende de la elección del cómplice. Por desgracia, uno no conoce qué ha elegido hacer el otro. Aún si fuera posible que hablaran entre ellos, no podrían estar seguros de confiar mutuamente.

Si uno espera que el cómplice escoja cooperar con él y permanecer en silencio, la opción óptima para el primero sería confesar, lo que significaría que sería liberado inmediatamente, mientras el cómplice tendrá que cumplir una condena de 10 años. Si espera que su cómplice decida confesar, la mejor opción es confesar también, ya que al menos no recibirá la condena completa de 10 años, y sólo tendrá que esperar 6, al igual que el cómplice. Y, sin embargo, si ambos decidiesen cooperar y permanecer en silencio, ambos serían liberados en sólo 1 año.

Por otro lado la opción de confesar es una estrategia dominante para ambos jugadores. Sea cual sea la elección del otro jugador, pueden reducir siempre su sentencia confesando. Pero si ambos confiesan, ambos reciben largas condenas.  Es aquí donde se encuentra el punto clave del dilema.  Si pensamos individualmente el resultado no es óptimo. Pero si ambos usan la estrategia de no confesar dominan a la estrategia de confesar.

Si razonamos desde el interés del grupo (de los dos prisioneros), el resultado correcto sería que ambos cooperasen, ya que esto reduciría el tiempo total de condena del grupo a un total de un año. Cualquier otra decisión sería peor para ambos si se consideran conjuntamente. A pesar de ello, si siguen sus propios intereses egoístas, cada uno de los dos prisioneros recibirá una sentencia dura.

Si consideramos este dilema como una simple "máquina de la verdad". El jugador puede tomar no dos, sino tres opciones: cooperar, no cooperar o, simplemente, no jugar. En este caso, la respuesta lógica es no jugar, ya que se carece de información suficiente para jugar correctamente (no se sabe cuál será la opción de su compañero). Por tanto, al no jugar no hay tal dilema, no es posible el juego. Si se juega, se trata de una apuesta, más que de una solución lógica.

Consideremos otra opción. En el caso de que el prisionero en realidad está "jugando" con su carcelero, y no con el otro prisionero. El carcelero le ofrece una opción. Para él, la mayor ganancia sería condenar al prisionero a la pena mayor, es su trabajo. Si logra los condenar a ambos a la máxima pena, doble ganancia. El prisionero lo sabe, en el fondo. Sólo "jugaría" si supiera con toda certeza que el policía cumpliría su palabra a pesar de su confesión. Pero tampoco lo sabe.

En realidad, prisionero-carcelero y prisionero-prisionero están jugando al mismo juego: encubrir o traicionar.
En este dilema decir la verdad equivale a cooperar, a callarse. Pero sólo optará por la casilla "verdad" si sabe que el otro jugador también opta por la misma solución. 

En cambio, en  la vida real hay que jugar, es decir, arriesgarse. No sabemos lo que hará la otra persona. Todo se basa en la "relación de confianza" existente entre los dos jugadores.  Si por ejemplo los prisioneros (o prisionero y carcelero) son hermanos, con una relación de confianza muy estrecha. Entonces sí sabrían (casi con toda seguridad, aunque nunca completa) cuál sería la opción de su compañero, y siempre jugarían correctamente: cooperarían.

La única solución lógica es, por tanto, cooperar entre si. Y además será la que dará el máximo beneficio común. Este planteamiento nos lleva a la correcta solución del dilema, que es decir la verdad, cooperar. Pero en este caso el error estaba en el planteamiento correcto del dilema, que no es pensar en nuestro beneficio (ser egoísta) sino en el del "otro" (ser generoso). En este caso, jugando a "verdad" siempre conseguiremos que el "otro" gane. Si el objetivo del juego es que siempre gane el rival, hay pues una única solución lógica, y que no depende de la jugada del rival. Dilema resuelto.

Una solución "incorrecta" sería en el caso que el hermano traicione al hermano. En este caso ha cambiado el nombre del juego: ahora lo podríamos llamar "Descubre al mentiroso". Hemos ganado, pues descubrimos a un mentiroso.
Es entonces una auténtica "máquina de la verdad".

En resumen el dilema del prisionero es pues siempre un juego dual; pero siempre tiene una solución lógica. Si los dos juegan lógicamente, es decir, con honestidad, el juego es beneficioso para ambos. Si uno engaña y el otro no, el juego se llama "Descubre al Mentiroso", y ambos vuelven a ganar.

Pero si pensamos de forma egoísta, y no generosa, la jugada "incorrecta" del dilema impide la iteración, luego finaliza el juego. Por esa razón, el jugador "ilógico" siempre tendrá dos objetivos: uno, engañar al honesto; y dos, convencerle a posteriori de que no fue engañado, mediante otro ardid, para poder seguir engañándole. Un mentiroso siempre necesitará otra mentira para cubrir la primera.

Que la estrategia funcione tiene que ver con la "mentira" del tramposo pero también con la "doble ingenuidad" del honesto. Fiarse de un mentiroso no es honestidad, sino estupidez. Pero sabemos que el único resultado correcto es bueno para todos los jugadores, y éste sólo sucede cuando todos dicen la verdad. Si alguien miente, engaña o manipula, la solución siempre será incorrecta. O, dicho de otro modo, si la solución es incorrecta, es que alguien nos engañó o nos mintió.

No hay comentarios:

Publicar un comentario en la entrada

Por favor, antes de comentar lea las normas de uso. Gracias.