La lógica del dilema del prisionero.
El monte al que vamos de excursión es el dilema del prisionero. Quienes conozcan este juego pueden pasar a los párrafos siguientes. Para quienes no lo conozcan, aquí va la versión más famosa.
Dos presuntos delincuentes son apresados por perpetrar un crimen. La policía los separa y le dice a cada uno de ellos lo siguiente: No tenemos pruebas de que seáis los autores, pero si tú confiesas y tu compañero no, tú sales libre por colaborar con la justicia y tu compañero se carga con toda la culpa (diez años de cárcel). Si los dos confesáis, os repartís la culpa (siete años a cada uno). Si ninguno confiesa os acusaremos de un delito menor (posesión ilícita de armas) y pasaréis cada uno un año en la cárcel. Una tabla nos ayuda a entender el juego (el primer número son los años de cárcel del prisionero que elige fila y el segundo, del prisionero que elige columna):
Confesar No confesar
Confesar 7, 7 0, 10
No confesar 10, 0 1, 1
Confesar 7, 7 0, 10
No confesar 10, 0 1, 1
Así las cosas, ambos prisioneros debe decidir qué hacer. Si se pudieran poner de acuerdo y tomar la decisión conjuntamente decidirían, casi seguro, no confesar. Pero como deben decidir individualmente, cada uno verá que, haga lo que haga el compañero, lo mejor es confesar: Si mi compañero confiesa, mejor confieso yo también (siete años es mejor que diez), y si mi compañero no confiesa, yo mejor confieso (cero años de cárcel son mejor que uno). Ambos acaban confesando y disfrutando de siete años a la sombra.
Volveremos más adelante sobre la solución anterior. Veamos ahora lo que dice Douglas Hofstadter en su libro Metamagical Themas sobre el dilema del prisionero:
"Si la razón dicta una respuesta, ambos prisioneros llegarán a ella independientemente. Una vez que uno se da cuenta de esto, se sigue que todos los jugadores racionales elegirán Confesar o todos elegirán No confesar. Esta es la clave. Cualquier cantidad de pensadores racionales enfrentados a la misma situación y que sobrelleven agonías de razonamientos similares llegarán a la misma respuesta siempre que la razón sea la única guía de sus conclusiones. Si no, la razón sería subjetiva, y no objetiva como la aritmética. Una conclusión alcanzada por la razón debe ser cuestión de preferencia, no de necesidad. Algunas personas pueden pensar esto otro, pero los pensadores racionales entienden que un argumento válido debe ser universalmente vinculante, si no, no es un argumento válido. Todo lo que cada uno de los prisioneros tienen que preguntarse es lo siguiente: “Como ambos vamos a tomar la misma decisión, ¿cuál es la más lógica? Esto es, ¿cuál es la mejor para el pensador racional individual: una con dos prisioneros confesando o no confesando?” La respuesta es inmediata: “Me caerán siete años si ambos confesamos y sólo un año si no confesamos. Claramente yo prefiero un año a siete. Como soy un pensador típico, no confesar debe ser preferido también por mi compañero. Así que cooperaré.”
Los intentos de Hofstadter por convencernos, vía argumentos lógicos y racionales, de que ambos terminarán cooperando podrían alargarse muchas líneas más y seguirían sin dar con la línea de análisis correcta. Deducir el comportamiento de grupo del comportamiento individual es una falacia lógica.
El argumento individual toma el de los demás como dado durante todo el razonamiento y llega a una conclusión. Al final será la misma que la de los demás, pero sólo al final, no durante el proceso de deducción. Es decir, durante el razonamiento, un prisionero se plantea cuál es su mejor acción dado lo que pueda estar haciendo el otro. En equilibrio, lo que se postula para el otro se corresponde con lo que también sea su mejor acción dada cuál sea mi acción. Esta es la clave del concepto de equilibrio de Nash, la mayor contribución de este premio Nobel de Economía y que ahora es la pieza central de la Teoría de los Juegos. Como vemos en el dilema del prisionero, no es un concepto intuitivo y no es deducible fácilmente a partir de la lógica individual. El propio von Neumann, de quien ya hemos hablado varias veces, no le prestó atención al joven Nash cuando éste se lo propuso.
Si alguien duda del análisis de la Teoría de Juegos, en este vídeo tiene una de las mejores demostraciones. También puede echar un vistazo a la imagen que abre la entrada. La lógica del dilema del prisionero está detrás de todos los problemas ahí señalados.
José Luis Ferreira
José Luis Ferreira
El dilema del prisionero es fenomenal para pensar la racionalidad y la toma de decisiones. Pero no hay que olvidar que es un experimento mental que funciona asumiendo un montón de supuestos y “caeteris paribus” (si ninguno de ellos falla), lo que en la práctica nunca ocurre. La solución de cooperar es la más racional… si los dos son racionales, lo cual no está asegurado en el mundo real. Pasa como con el ajedrez: jugar con alguien que no sabe jugar bien más allá de mover las piezas es desesperante, porque después de emplear mucho tiempo en calcular tu siguiente jugada para meterle en una celada, resulta que te mueve la pieza que menos te imaginas: se escapa de tu celada simplemente porque juega irracionalmente, al azar, mueve por mover; ¡le pones la dama como cebo para que se la coma y darle jaque mate y en vez de eso mueve un peón porque sí! Los modelos económicos, filosóficos, etc., muchas veces pecan de eso mismo: presuponen un sujeto racional (el homo oeconomicus, el animal racional) que dispone de conocimiento total y suficiente y calcula pros y contras perfectamente, pero ese tipo solo existe en la teoría y la imaginación de esos teóricos. El ser humano real no piensa así de hecho ni se comporta así siempre. Kanemahn distingue en ese sentido los “econos” (individuos imaginarios que se comportan como el modelo espera de ellos) de los “humanos” (los seres humanos reales con sus “imperfecciones”) y trata de investigar las desviaciones o errores sistemáticos que los humanos realizan típicamente respecto de ese modelo, y que explicarían ciertas paradojas (como la de Monty Hall). Desviaciones o errores que se explicarían en parte por nuestra historia evolutiva: hemos sobrevivido desarrollando las capacidades que han sido adaptativas en nuestro medio, y eso implica, por ejemplo, saber manejarse bien con ciertas cantidades pequeñas, pero no otras astronómicas o probabilísticas, lo que explica que intuitivamente seamos muy malos tomando decisiones que implican esas probabilidades o números muy grandes con los que nuestra especie no se las ha tenido que ver normalmente para sobrevivir en el pasado.
ResponderEliminarEn cuanto al dilema del prisionero, Peter Singer en “Ética para vivir mejor” analiza el dilema y dice que en experimentos realizados en los que se juega al juego varias veces seguidas, la estrategia que a la larga resulta más beneficiosa es “devolver el golpe”, que significa que la mejor estrategia consiste en cooperar la primera vez pero luego hacer lo mismo que haga el otro la vez anterior. Por ejemplo, si la 1ª vez coopero y el otro también, la 2ª vez vuelvo a cooperar. Pero si la 2ª vez el otro no coopera, la 3ª vez yo tampoco, y así voy siempre haciendo en cada partida lo mismo que haya hecho el otro en la anterior. De esta forma, la solución no estaría en cooperar o no cooperar siempre, sino que remitiría de nuevo a nuestra evolución biológica: la reciprocidad: tú me rascas la espalda y yo rasco la tuya, pero si yo te la rasco y luego tú no, entonces ya no te vuelvo a rascar más. Se trata de reforzar las conductas cooperativas que benefician al grupo (y a cada uno individualmente) y reprobar o castigar las egoístas o de gorrón que benefician a un solo individuo a corto plazo pero perjudican al conjunto (y a todos) a la larga.
El modelo siempre es una idealización, pero esto no le quita utilidad. Lo que hace que sirva para analizar alguna parte de la realidad es si existe esa parte de la realidad para la que el modelo ideal es suficientemente aproximado. En el caso del dilema del prisionero (también en algunos modelos económicos) esto es así, como se aprecia en todos los problemas señalados en la imagen.
EliminarHay, desde luego, situaciones que a primera vista son dilemas del prisionero que no lo son. Por ejemplo, los prisioneros de la historia pueden tener en consideración el bienestar del compañero, o puede que pertenezcan a una banda que castigará al que confiese o la situación puede repetirse en el tiempo.
Los dos primeros casos nos dan lugar a un juego distinto (o en el caso de la empatía por el prójimo, a un juego con jugadores no egoístas). En el caso de la repetición, el juego base es el mismo, pero la repetición cambia el análisis. En estos casos, cuando la repetición es indeterminada (no hay un final claro), las estrategias de cooperar mientras se ha cooperado en el pasado suelen funcionar bien (como dice la teoría, por otra parte). Lo interesante son las repeticiones finitas y determinadas (p.e.: jugamos cinco veces), donde se coopera más de lo que dice la teoría, aunque a medida que los individuos avanzan en el juego o avanzan en el conocimiento del juego, la cooperación se deteriora (como también dice la teoría).
El reforzamiento de las conductas sirve para ir cuanto antes al equilibrio bueno en el juego repetido indefinido y también para salirnos del mal equilibrio en el juego sin repetir o en el repetido de manera determinada. Esto último solo será posible cuando al interiorizar la buena conducta, el alejarse de ella sea más costoso que la ganancia de dejar de cooperar. Esto nos pasa cuando tirar un papel al suelo nos cuesta más que tirarlo a la papelera, aunque esto último requiera mayor esfuerzo físico. Pero eso no nos pasa cuando se trata de limitar las emisiones contaminantes o de efecto invernadero, que necesita algo más que reforzar conductas.
Hay que saber notar también que Hofstadter está describiendo el problema con ironía...
ResponderEliminar