23 ene 2013

El dilema del prisionero [Detallado 7]

Estos días estoy leyendo un libro muy interesante, se llama El Gen Egoísta, escrito por Richard Dawkins en 1976, y trata sobre la teoría de la evolución, pero desde el punto de vista genético, donde en lugar de considerar que son los individuos de una especie aquellos que evolucionan, en el fondo son los genes los que realmente sobreviven y evolucionan. El libro es muy interesante y fácil de entender, pues explica todo mediante metáforas del día a día y no es necesario tener ningún conocimiento previo de biología ni de ningún otro campo.
 
Sobre este libro, quiero compartir con vosotros las ideas del capítulo 12, llamado “Los buenos chicos acaban primero”, que trata sobre el Dilema del Prisionero, un problema bastante interesante.
 
El dilema del prisionero plantea la siguiente situación: hay una banca encargada de repartir el dinero y dos jugadores (A y B) a los que se reparten dos cartas a cada uno. Una carta contiene la opción COOPERAR y la otra carta la opción DESERTAR. Al haber dos cartas repartidas por dos jugadores, se pueden producir estos cuatro resultados:
 
  • Jugador A y jugador B deciden ambos elegir sus cartas Cooperar: ambos jugadores reciben una paga de 300 dólares por parte de la banca. Esta opción se llama Recompensa, por haber cooperado ambos jugadores.
  • Jugador A y jugador B deciden ambos  jugar sus cartas Desertar: ambos jugadores reciben una penalización de 50 dólares que deben pagar a la banca cada uno. Esta opción recibe el nombre de Multa por deserción.
  • Jugador A juega Cooperar, pero jugador B decide jugar Desertar: el jugador A se ve penalizado con 100 dólares y el jugador B se ve recompensado con 500 dólares. En este caso el jugador A sería el Incauto y el jugador B sucumbiría a la Tentación de desertar.
  • El último resultado posible es simétrico, jugando A la carta de Desertar y B la carta de Cooperar y siendo análogos al caso anterior las penalizaciones y recompensas a cada uno.
 
Podríamos recoger por tanto estos valores en la siguiente tabla:

Ya tenemos planteadas las reglas, ahora nos queda jugarlo y ver qué carta nos sería más interesante jugar. Supongamos que somos el jugador A y elegimos Cooperar, ahora dependeríamos de qué eligiese B, si este elige también Cooperar, ambos nos llevamos una recompensa de 300 dólares, una cantidad bastante considerable; pero si B es más pícaro y elige Desertar, nosotros nos llevaríamos una penalización de -100, es decir, pagaríamos 100$ a la banca, con lo que perderíamos mucho dinero (y encima B se beneficiaría de nuestra inocencia pues él se llevaría 500$ , aunque realmente podemos olvidarnos de lo que se llevaría B pues el dinero es de la banca y no nuestro). La otra opción es que eligiéramos como estrategia coger la carta Desertar. En tal caso, B podría elegir Cooperar, con lo que nos beneficiaríamos todavía mucho más que antes, ya que la banca nos daría 500$, y en el caso de que B eligiera Desertar, la penalización a la que nos enfrentaríamos sería mucho menor, tan sólo de 10$.
 
Está claro que la estrategia que nos interesa seguir es coger la carta de Desertar, ya que los beneficios y castigos son mucho más benevolentes con nosotros. Sin embargo, el jugador B puede plantearse el mismo razonamiento, e indudablemente llegará a la misma conclusión que nosotros, por lo tanto la estrategia que seguirá será la de elegir la carta de Desertar. Por lo tanto, ambos vamos a elegir la carta de Desertar ya que es la opción “menos dolorosa” para nosotros si aplicamos la razón, siendo finalmente la banca la que gana en esta partida; he ahí la paradoja y el motivo de que este problema sea un dilema
 
Esto sucede siempre que la partida se juegue sin que los jugadores se puedan comunicar y donde no haya repeticiones, es decir, sólo se juegue una vez, pero la cosa se pone interesante cuando hay repeticiones. Imaginemos que ahora una vez acabada la primera partida, se vuelven a repartir las dos cartas a ambos jugadores, ¿elegir la carta Desertar sigue siendo siempre la mejor opción? Quizás  haya mejores estrategias, ahora entra en juego la colaboración y el engaño. Dejo esta pregunta abierta para retomarla más tarde y daros un tiempo para pensar estrategias.
 
Hasta  ahora no ha aparecido en ningún momento la palabra prisionero, así que probablemente os estáis preguntando el porqué del nombre de este dilema. El nombre viene de una situación típica de las películas policiacas. Hay dos ladrones que han sido detenidos, encierran a ambos en salas de interrogatorios distintas y les ofrecen el siguiente trato. Si sólo uno delata al otro, el delator quedará libre y el delatado cargará con una larga condena él solo. Si ninguno de los dos delata al otro, ambos serán condenados a una pena menor ya que no pueden ser inculpados del crimen, pero no colaboran con la justicia. Si los dos tratan de delatar al otro, ambos serán condenados a la pena mayor, pero con una reducción de condena por haber colaborado. Aquí la carta Cooperar sería guardar silencio y desertar sería delatar al otro ladrón. Como vemos, es el mismo problema planteado previamente, y es una situación difícil de resolver por parte de los ladrones, pues si callan se arriesgan a ser delatados y cargar con toda la culpa; por lo tanto ambos terminarán cantando, ya que desde el punto de vista de cada ladrón es la posición más ventajosa. Si el otro me delata, compartimos la condena, si el otro no me delata, quedo libre.
 
Siguiendo con las películas, si has visto El Caballero Oscuro (si no has visto la película te recomiendo que te saltes este párrafo), la segunda película de la última trilogía de Batman reconocerás que se plantea esta situación.  En este caso el Joker hace lo siguiente, hay dos barcos que van a abandonar la ciudad, en uno de ellos se traslada a todos los presos mientras que en el otro van civiles. En cada barco, el Joker decide colocar un explosivo, pero siendo tan macabro como es, decide dar el control remoto al otro barco y les da un ultimátum para que en el caso de que decidan no estallarlos, ambos barcos exploten. Si nos fijamos bien, tenemos el dilema del prisionero planteado: ambos barcos serían los jugadores, la situación de explotar el otro barco sería desertar y la opción de no explotarlo sería cooperar.  En este caso, en la película, la opción vencedora es la de cooperar, no porque ayude a la supervivencia, si no porque entraría en juego la moralidad y el coste de explotar el otro barco lleno de gente es considerado como excesivamente elevado.  Podéis ver este caso estudiado en mayor profundidad.
 
Volvamos al caso del dilema del prisionero con repetición que dejamos en suspense. En este caso, como ya he mencionado antes, las cartas vuelven a repartirse tras cada mano. Con esta nueva variante podemos pensar en distintas estrategias. Una de las planteadas en el libro se llama “Donde las dan las toman”. La idea de esta estrategia es empezar Cooperando y  a partir de ahí, repetir lo que el otro jugador elija. Es decir, si el otro jugador no plantea ninguna deserción, esta estrategia coopera, pero si el otro jugador Deserta, en la siguiente ronda esta estrategia se vengará y jugará Desertar (por imitación), pero en la siguiente ronda ya habrá olvidado sus ganas de vengarse si el otro jugador vuelve a Cooperar. Digamos que en el mejor de los casos, donde nadie deserte, la estrategia siguiendo los costes antes mencionados conseguirá una media de 300$ de beneficios. Esta estrategia es realmente potente.
 
Imaginemos que tenemos una variante que sea “Donde las dan las toman pícara”, la cual funciona como “Donde las dan las toman” pero de vez en cuando, si el otro jugador Cooperó, decide probar suerte a Desertar para obtener una mayor recompensa. Si enfrentáramos a ambas estrategias, en el momento que la versión pícara decidiera desertar, la original decidiría Desertar en el siguiente paso, y en el siguiente lo haría la pícara por imitación, por tanto entrarían en una cadena de reproches, siendo la media de ganancias de 200$ (500$ la vez que Coopera y el otro Deserta, y -100$ en el caso contrario), por lo tanto sigue siendo mejor la estrategia original.
 
De alguna manera es difícil establecer la mejor estrategia, ya que estas estrategias son susceptibles a las otras estrategias que se enfrenten; por ejemplo, una estrategia rival a “Donde las dan las toman” podría ser “Siempre desertar”, que como comienza Desertando, se lleva un pellizco en la primera ocasión donde la otra estrategia comienza Cooperando. Si tuviéramos un entorno donde hubiera muchas “Donde las dan las toman” que se enfrentaran entre ellas, obtendrían de media 300$ mientras que las de “Siempre desertar” obtendrían el pellizco inicial pero en el resto de casos serían castigadas, con lo que la media sería inferior a 300$, pero si la situación fuera al revés, donde abundaran las de “Siempre desertar”, a un “Donde las dan las toman” le costaría obtener beneficios para poder mantenerse como estrategia ganadora. Con lo que podemos ver que para que una estrategia sea la dominante, depende de las estrategias a las que se enfrente. Si queréis más detalles y conocer otras estrategias os recomiendo leer el libro.
 
¿Podemos pensar en un caso real donde se dé esta circunstancia del problema del prisionero con repetición? Se me ocurren muchos casos, pero podemos poner un ejemplo sencillo.
 
Imaginemos una clase donde el profesor, desafortunadamente, no se explica demasiado bien. Los alumnos por tanto necesitan buscar una estrategia que les garantice mejores resultados, por ejemplo: tomar apuntes y compartirlos con los otros compañeros para que, teniendo diferentes  versiones, puedan entender mejor la asignatura; la idea es que yo te los dejo a ti y tú me dejas los tuyos. Pero claro, acudir a clase y tratar de entender al profesor y tomar apuntes tiene un coste, por lo que otra opción estratégica sería no tomar apuntes y tratar de obtenerlos de los compañeros; la idea es que yo no te dejo apuntes y tú me dejas los tuyos. La tercera opción sería no tomar apuntes ni conseguir que alguien nos los prestara, con lo que estaríamos condenados al suspenso.
 
Creo que queda claro como trasladar el problema al dilema del prisionero. Cooperar sería tomar apuntes y compartirlos, Desertar sería no tomarlos y por tanto no compartirlos. Los estudiantes más colaborativos se beneficiarán de los apuntes de otros pero tendrían el coste de tener que ir a clase y tomarlos; habrá alumnos que intenten ahorrarse este coste e intentar aprovecharse de los que sí los toman, los cuales no se beneficiarán de tener otros apuntes y además tendrán que haber hecho el gasto de ir a clase y tomarlos. Por último se dará el caso entre alumnos que no puedan compartirse apuntes porque ninguno de los dos tenga, no beneficiándose del trabajo de otro (es el riesgo a que yo sea “vago” y mis compañeros también).
 
Para saber qué estrategia es la mejor de todas habría que asociar unos costes. Si tomar apuntes y compartirlos es relativamente “barato” y casi garantiza el aprobado a diferencia de no hacerlo, es más probable que la gente tienda a jugar Cooperar, y por tanto, habrá algunos alumnos que se aprovechen de esta opción. Si el intercambio de apuntes es prácticamente obligatorio para aprobar, habrá aún más alumnos que decidan Cooperar y muy pocos se arriesgarían al suspenso. Sin embargo, si el tomar los apuntes es “caro” y no hay tanto riesgo a suspender si no se obtienen otros apuntes, muchos alumnos tratarían la opción de no tomarlos y confiar en obtenerlos de otra persona.
 
Siguiendo con el ejemplo, supongamos que la mala suerte y falta de organización dentro de la escuela hace que a veces algunas asignaturas se solapen entre sí, por lo que a algunos alumnos no les quedará más opción que jugar la carta de Desertar, es decir, no podrán tomar apuntes. Si al resto de estudiantes les pasase lo mismo en otras ocasiones, tendría sentido aplicar una estrategia colaborativa, en el sentido de que, aun a sabiendas de que no voy a sacar beneficio directo de esta persona al dejarle mis apuntes ya que ella no puede dejarme a mí, decido prestárselos, pues en un futuro me pasará a mi lo contrario, esta persona me dejará los suyos y me beneficiaré de ello. Es lo que yo llamaría un “altruismo egoísta”, donde el beneficio queda pendiente  a una incierta situación futura, pero de alguna manera se llega a una colaboración entre el grupo que llevaría a un mayor beneficio común.
 
Como vemos todo dependería de los costes de realizar la cooperación y de los beneficios de ser el único en desertar, de los riesgos que podamos asumir y de la certeza de que en situaciones futuras los otros se comportaran como esperamos.
 
Queda claro que el dilema del prisionero nos rodea aunque hasta ahora no nos hubieramos dado cuenta. ¿Se os ocurren más situaciones a vosotros? ¿Qué estrategias creéis que usaríais?
 
Espero que os haya parecido interesante y haya sabido explicarme claramente. Si queréis saber más sobre el tema, os recomiendo una vez más que os leáis el capítulo 12 del libro.

No hay comentarios:

Publicar un comentario

Related Posts Plugin for WordPress, Blogger...