martes, 13 de noviembre de 2012

Boletín nº 18 - Teoría de juegos y negociación





LOS JUEGOS NO SIEMPRE SON BROMAS

Como ha sido convenientemente divulgado, a pesar de que la vorágine diaria de noticias político-económicas ha obligado a destinar un espacio muy pequeño a la noticia, el Banco de Suecia, como cada año desde 1968 en memoria de Alfred Nobel[1], ha concedido el premio Nobel de economía de 2012 a los norteamericanos Alvin Elliot Roth, profesor de la Universidad de Stanford y Lloyd Stowell Shapley, profesor emérito de la Universidad de California Los Ángeles, por su contribución a la “ingeniería económica” al aplicar la teoría de los juegos, en este caso en su vertiente de combinaciones de mercado, a la resolución de problemas cotidianos como el establecimiento de esquemas de mejora de programas de coordinación en la donación de órganos o hallar la respuesta a preguntas tales como qué trabajador obtiene tal puesto de trabajo y por qué o qué estudiante va a qué escuela y por qué.

En efecto, los estudios de los doctores Roth y Shapley (sin desmerecer en absoluto su trabajo, por supuesto) no han hecho sino aplicar a realidades cotidianas con alto componente práctico una forma de enfocar la ley de probabilidades utilizando para ello las matrices propias del estudio de problemas con la teoría de juegos, que, más allá de la errónea banalización que puede provocar su nombre, debe recordarse que es una rama de la economía que estudia las decisiones aplicables a una determinada situación en las que para que un individuo obtenga un resultado positivo tiene que tener en cuenta las decisiones tomadas por el resto de los agentes que intervienen en la situación. La teoría de juegos como estudio matemático no es exclusivo de la economía, sino también, como se puede deducir, precisamente de la concesión del premio Nobel de este año, es válida para la gestión empresarial, diseño de estrategias en prácticamente todos los campos, incluyendo el político, psicología o incluso en biología. Es decir, en ella, el actor “jugador” A no sólo se pregunta qué va a hacer, sino que en esta pregunta deberá tener en cuenta el abanico de posibilidades de actuación que piense que harán los demás intervinientes B, C, .. que, a su vez, diseñarán su actuación según lo que crean que va a hacer A.

Es interesante observar que la aplicación de la teoría de juegos es particularmente útil en la resolución de divergencias  en las relaciones humanas, por lo que no está de más incidir en que su utilidad matemática está relacionada con la voluntad de encontrar resultados positivos para ambas partes analizadas.

Si seguimos el ejemplo que ya, curiosamente, utilizábamos en el boletín anterior[2], de la problemática surgida entre Catalunya y España, y pretendiéramos analizarlo sólo a la luz de la teoría de juegos, lo que es obvio es que, para estudiar un resultado útil de acuerdo con las leyes de la probabilidad, no es válida la imposición, que anula la teoría al prescindir de una de las partes en juego. Haciendo un símil, seguramente simplista, puede compararse con la manifestación de desavenencias serias en una pareja. En primer lugar habría que ir al origen para analizar la previsión de acciones del/de la demandante, si ha habido avisos previos o señales, si es espontánea, las razones que arguye, etc. Una vez todos los datos en poder del analista, si lo que se pretende a la postre es salvar la convivencia, ni se puede argumentar que el divorcio es ilegal, ni se pueden esgrimir amenazas (“mis amigos te harán el vacío”, “no te pasaré la pensión compensatoria”,”te daré de baja del club de golf”…), ni se pueden menospreciar las razones argumentadas ya que en ese caso, el resultado al que se llegue será viciado.
Es por ello que, para llegar a conclusiones razonables en la aplicación de la teoría es imprescindible entender el enunciado del problema; abundando en el mismo ejemplo anterior, por lo que se ve y oye, se está peleando por independencia sí, independencia no, cuando, si se revisa calmadamente los antecedentes, lo que está en cuestión es otra cosa. Si el sentimiento que origina el problema en estudio se constriñe a un capricho pasajero de un representante político o se reduce sólo a la vertiente económica, los resultados saldrán nuevamente sesgados, precisamente por no haber captado la razón última del problema.
Este aspecto se verá más claramente en el desarrollo, más abajo, de los conceptos alrededor de los equilibrios de Nash, (John Forbes Nash, personaje, por cierto, reflejado en la desasosegante película “Una mente maravillosa”).


La teoría de juegos – Un poco de historia

El estudio de cómo se desarrollan los juegos ha conducido a científicos de todas las épocas a exponer teorías y modelos matemáticos para su resolución: sin ir más lejos, la estadística es una rama de las matemáticas que surgió, precisamente, de los cálculos para diseñar estrategias vencedoras en juegos de azar pese a que la actual teoría de los juegos tiene poco que ver con la estadística. Conceptos tales como probabilidad, media ponderada y distribución o desviación estándar, son términos acuñados por la estadística matemática que tienen aplicación en el análisis de juegos de azar o en las frecuentes situaciones sociales y económicas en las que hay que adoptar decisiones y asumir riesgos ante componentes aleatorios.
Todos los juegos, de niños y de adultos, de mesa o deportivos, son modelos de situaciones conflictivas y cooperativas (o no) en las que podemos reconocer situaciones y pautas que se repiten con frecuencia en el mundo real.
El objetivo de la teoría de juegos no es el análisis del azar o de los elementos aleatorios que intervienen en el desarrollo del juego sino el de los comportamientos estratégicos de los jugadores.
En la realidad, tanto en las relaciones económicas como en las políticas o sociales, son muy frecuentes las situaciones en las que, como en los juegos, su resultado depende de la conjunción de decisiones de diferentes agentes o jugadores.

El origen de la teoría cabe buscarlo en los primeros trabajos de Cournot, en 1838, complementados por Bertrand, en 1883, y Edgewoth en 1887, acerca de la oferta y la demanda económicas, tanto en situación de competencia como de monopolio[3].

Posteriormente hay que citar trabajos de Ernst Zermelo (1871-1953) y de Émile Borel (1871-1956) sobre aplicaciones de la probabilidad y estadística, junto con la teoría matemática de conjuntos, a la resolución de problemas. Cabe destacar que en 1913 Borel demostró que juegos como el ajedrez son resolubles.

Sin embargo, no fue sino hasta la aparición en 1944 del libro “The Theory of Games and Economic Behavior”, del matemático húngaro John Von Neumann y del alemán Oskar Morgenstern[4] cuando se comprendió la importancia de la teoría de juegos para estudiar las relaciones humanas.
Von Neumann y Morgenstern desarrollaron la investigación sobre dos planteamientos distintos de su Teoría de Juegos:

- El planteamiento estratégico o no cooperativo. Von Neumann y Morgenstern resolvieron este problema en el caso particular de juegos con dos jugadores cuyos intereses son diametralmente opuestos., que requiere especificar detalladamente qué pueden y qué no pueden hacer los jugadores durante el juego para dar pie a que cada jugador busque una estrategia óptima. A estos juegos se les llama estrictamente competitivos, o de suma cero, porque cualquier ganancia para un jugador siempre se equilibra exactamente por una pérdida correspondiente para el otro jugador. El ajedrez, el backgammon y el póquer son juegos tratados habitualmente como juegos de suma cero.

- El planteamiento coalicional o cooperativo, en el que intentaron describir la conducta óptima en juegos con muchos jugadores. Dado que es éste un problema mucho más difícil, los resultados obtenidos fueron mucho menos precisos que los alcanzados para el caso de suma cero y dos jugadores. En particular, Von Neumann abandonó todo intento de especificar estrategias óptimas para jugadores individuales. En lugar de ello se propuso clasificar los modelos de formación de coaliciones que son consistentes con conductas racionales.

Antes de los años 50 del pasado siglo se produjo un desarrollo importante, en particular sobre los juegos cooperativos, debido al interés del Departamento de Defensa de los Estados Unidos por aplicar los juegos de tipo suma-cero a la estrategia militar, hasta  llegar al hito fundamental expuesto por Nash en 1950 con la definición del equilibrio que lleva su nombre.

Conviene detenerse brevemente en la figura de Nash, fundamental en el desarrollo posterior de la teoría y sus crecientes aplicaciones. John Forbes Nash (nacido en1928) es el nombre más destacado relacionado con la teoría de juegos. A los 21 años expuso por primera vez su solución para juegos estratégicos no cooperativos, lo que desde entonces se llamó "el equilibrio de Nash", que tuvo un inmediato reconocimiento entre todos los especialistas[5].
El punto de equilibrio de Nash es una situación en la que ninguno de los jugadores siente la tentación de cambiar de estrategia ya que cualquier cambio implicaría una disminución en sus pagos[6], aunque ya Von Neumann y Morgenstern habían ofrecido una solución similar pero sólo para los juegos de suma cero.
En los años siguientes publicó nuevos escritos con originales soluciones para algunos problemas matemáticos y de la teoría de juegos, destacando la "solución de regateo de Nash" para juegos bipersonales cooperativos. Propuso también lo que se ha dado en llamar "el programa de Nash" para la reducción de todos los juegos cooperativos a un marco no cooperativo. A los veintinueve años de edad se le diagnosticó una esquizofrenia paranoica que lo marginó prácticamente de la sociedad e inútil para el trabajo científico durante dos décadas hasta que, recuperada su salud mental pudo volver a la docencia y la investigación con nuevas geniales aportaciones, que lo llevaron a conseguir en 1994 el Premio Nobel de Economía compartido con John C. Harsanyi y Reinhart Selten por sus pioneros análisis del equilibrio en la teoría de los juegos no cooperativos.

En los 60 y 70 se extendió por otros estudiosos la teoría de juegos de información incompleta, es decir, aquellos en que los jugadores no conocen todas las características del juego (por ejemplo, no saben lo que obtienen los otros jugadores como recompensa).
Ante la multiplicidad de equilibrios de Nash, muchos de los cuales no eran soluciones razonables a juegos, Selten definió en 1975 el concepto de equilibrio perfecto en el subjuego para juegos de información completa y una generalización para el caso de juegos de información imperfecta.
La última aportación importante a la teoría de juegos es del matemático israelí nacido en Alemania en 1930 Israel Robert John Aumann y del economista estadounidense nacido en 1921 Thomas Crombie Schelling, por la que han obtenido el premio Nobel de Economía en el año 2005. Aumann fue pionero en realizar un amplio análisis formal de los juegos con sucesos repetidos. La teoría de los juegos repetidos es útil para entender los requisitos para una cooperación eficiente y explica por qué es más difícil la cooperación cuando hay muchos participantes y cuándo hay más probabilidad de que se rompa la interacción. La profundización en estos asuntos ayuda a explicar algunos conflictos, como la guerra de precios y las guerras comerciales.
Por su parte, en The Strategy of Conflict, Schelling, aplica la teoría de juegos a las ciencias sociales. Sus estudios explican de qué forma un partido puede sacar provecho del empeoramiento de sus propias opciones de decisión y cómo la capacidad de represalia puede ser más útil que la habilidad para resistir un ataque.

Clases de juegos

Los juegos se pueden clasificar de múltiples maneras en función de características, intervinientes, evolución en el tiempo, etc. pero, en resumen, para el acercamiento a sus aplicaciones que representan estas líneas, se pueden reducir a dos clases, que plantean diferentes problemas y se analizan de forma muy distinta
- En primer lugar tenemos los juegos en los cuales los jugadores pueden comunicarse y negociar entre ellos, conocidos como juegos con transferencia de utilidad (también llamados juegos cooperativos), en los que el problema se encuentra en el momento de elegir las diferentes coaliciones y su estabilidad.
- En segundo lugar tenemos los juegos en los que los jugadores no pueden llegar a acuerdos previos, conocidos como juegos sin transferencia de utilidad, (también llamados juegos no cooperativos). Algunos de estos juegos son: "la guerra de los sexos", el "dilema del prisionero" o el “modelo halcón-paloma". Un segundo tipo de juegos sin transferencia de utilidad suelen ser sólo para dos jugadores. Pueden ser simétricos o asimétricos dependiendo que los resultados sean idénticos desde el punto de vista de cada jugador. Pueden ser también de suma cero, es decir, cuando el aumento en las ganancias de un jugador implica una disminución de la misma cantidad en las del otro, o de suma no nula en caso contrario, o sea, cuando la suma de las ganancias de los jugadores puede aumentar o disminuir en función de sus decisiones.
Por otra parte, cada jugador puede tener opción a dos estrategias si se trata de un juego biestratégico, o a muchas. Las estrategias a su vez pueden ser puras o mixtas; en las mixtas se asigna a cada estrategia pura una probabilidad matemática. Para los juegos con repetición, que son aquellos que se juegan varias veces seguidas por los mismos jugadores, las estrategias pueden ser simples o reactivas, si la decisión depende del comportamiento que haya manifestado el contrincante en jugadas anteriores.
Algunos ejemplos conocidos
1.- El dilema del prisionero
El dilema del prisionero es el ejemplo más típico de teoría de juegos. Supongamos que detienen a dos personas por delitos menores que les costarían a cada una de ellas dos años de cárcel. La policía sabe que, además de esos delitos, han cometido uno más grave, pero para inculparlos necesitan pruebas, supongamos que la declaración de uno de los dos.
Si ambos delatan al otro por el delito mayor, la pena para cada uno seré de seis años de cárcel. Si uno delata y el otro no, el delator irá a prisión solamente un año por colaborar y el otro será castigado con  diez años por el delito. Teniendo en cuenta que los prisioneros no pueden comunicarse entre ellos (están en habitaciones separadas) ¿qué se supone que harán?
Supongamos que somos uno de los dos prisioneros. No sabemos qué hará el otro por lo que pensamos que la mejor solución es delatar al otro, independientemente de lo que haga él, ya que en cualquier supuesto (que también delate él o que no lo haga) minimizamos los años de pena esperados en la cárcel. Si el otro nos delata iremos seis años en vez de diez y si no nos delata iremos uno en vez de dos.
Dado que el otro tiene la misma oportunidad de razonamiento y similares objetivos, lo más probable es que llegue a la misma decisión. Al final lo que acaba pasando, seguramente, es que ambos quedarán confinados seis años entre rejas, mientras que si hubieran cooperado hubieran sido sólo dos. La situación alcanzada es un equilibrio de Nash, porque ambas partes no pueden cambiar sin empeorar. Es decir, no se llega a la mejor situación para las partes.
Para representar gráficamente las opciones y resultados en teoría de juegos se suelen utilizar matrices (también conocidas como forma normal) y árboles de decisión como herramientas para comprender mejor los razonamientos que llevan a un punto u otro. Además los juegos se pueden resolver usando las matemáticas, aunque suelen ser bastante sofisticadas como para entrar en profundidad. En el caso del dilema del prisionero, la representación sería


Prisionero 1


No delatar
Delatar
Prisionero 2
No delatar
(-2, -2)
(-10, -1)
Delatar
(-1, -10)
(-6, -6)
2.- La guerra de sexos
Algunos juegos tienen múltiples equilibrios de Nash, como el juego conocido como la Guerra de los Sexos, cuyo planteamiento es el que se ofrece a continuación.
Cristina y Guillermo cenarán juntos esta noche y se encuentran actualmente llegando al hogar desde sus lugares de trabajo. Se supone que Cristina comprará el vino y Guillermo el plato principal, pero Cristina podría comprar vino tinto o vino blanco, y Guillermo bistec o pollo. Ambos preferirían que la combinación resultante fuera el bistec con vino tinto y la carne de pollo con vino blanco, si bien Guillermo prefiere la primera combinación y Cristina la segunda; es decir, los jugadores prefieren coordinarse pero están en desacuerdo en la forma de hacerlo. El par (Bistec / Vino Tinto) es un equilibrio de Nash, así como también lo es el par (Pollo / Vino Blanco), pero no hay una manera obvia de decidir entre ambos equilibrios. La representación gráfica sería:



Cristina


Tinto
Blanco
Guillermo
Bistec
(2, 1)
(0, 0)
Pollo
(0, 0)
(1, 2)

Hay muchas aplicaciones de este juego, incluyendo a grupos políticos que buscan establecer una normativa, a empresas que tratan de establecer un estándar industrial, etc. El concepto de equilibrio de Nash pierde gran parte de su atractivo en tales casos de multiplicidad. Sin embargo, que en alguno de esos casos surja algún equilibrio de Nash como un acuerdo útil y consensuado puede depender de antecedentes o accidentes históricos.

3.- Modelo halcón-paloma

Usualmente, en términos políticos, entendemos por "halcón" a los partidarios de estrategias más agresivas para la resolución de conflictos mientras que identificamos como "paloma" a los más pacifistas.
El modelo halcón-paloma, dentro de la teoría de juegos, sirve para analizar situaciones problemáticas ocasionadas entre estrategias agresivas y conciliadoras. Este modelo es conocido en la literatura anglosajona como el "hawk-dove" o el "chicken" y en español es conocido también como "gallina".
El planteamiento puede ser el que sigue:

Dos vehículos se dirigen uno contra otro en la misma línea recta y a gran velocidad. El que frene o se desvíe ha perdido. Pero si ninguno de los dos frena o se desvía...
Este sería un claro modelo halcón-paloma

También se ha utilizado este modelo abundantemente para representar una guerra fría entre dos partidos o gobiernos. La estrategia halcón consiste en este caso en proceder a una escalada agresiva y bélica. Si un jugador mantiene la estrategia halcón y el otro elige la estrategia paloma, el halcón gana y la paloma pierde. Pero la peor situación para ambos sed produce, obviamente, cuando los dos jugadores se aferran a la estrategia halcón, en cuyo caso, el resultado puede modelizarse con la siguiente matriz de pagos.



Jugador B


Paloma
Halcón
Jugador A
Paloma
(2º, 2º)
(3º, 1º)
Halcón
(1º, 3º)
(4º, 4º)

Podemos observar las sutiles pero importantes diferencias de este modelo con el Dilema del Prisionero. En principio la matriz es muy parecida, simplemente se han representado la equivalencia en el orden de elección y se han trocado las posiciones de los pagos 3º y 4º, pero la solución y el análisis son ahora muy diferentes.
Aquí hay dos resultados que son equilibrios de Nash: cuando las estrategias elegidas por cada jugador son diferentes; es decir, cuando uno elige halcón y el otro paloma. Por el contrario, en el Dilema del Prisionero el equilibrio de Nash está en el punto en que ambos jugadores se convierten en delatores.
Otra notable diferencia de este juego con otros es la importancia que aquí adquiere el orden en que los jugadores eligen sus estrategias. Como tantas veces en la vida real, el primero que juega, gana. El primero elegirá y manifestará la estrategia halcón con lo que el segundo en elegir se verá obligado a elegir la estrategia paloma, la menos mala.

Conclusiones

No entramos, ni por su complejidad ni por el alcance que se pretende dar a este boletín, a exponer planteamientos complejos de juegos dinámicos, repetitivos, etc., y su resolución matemática.
Con lo visto hasta ahora hay una visión lo suficientemente detallada a la vez que generalizada para recordar la validez de la teoría de juegos en problemas no sólo matemáticos, sino, especialmente, todos aquellos relacionales en los que ha de tenerse presentes varias premisas:

-          la teoría de juegos es, en cierta manera, contrapuesta al análisis de decisión
-          es útil en situaciones de conflicto y/o competencia entre decidores
-          la consecución de objetivos y obtención de resultados no dependen sólo de las decisiones propias y del azar, sino de las decisiones de los competidores
-          es importantisima la selección de estrategias encaminadas bien a la obtención del beneficio propio o del mejor resultado común, según se busque.



[1] No es que tenga relevancia en la noticia, pero cabe recordar que el premio Nobel de Economía (Sveriges Riksbank Prize in Economic Sciences in Memory of Alfred Nobel) no forma parte del grupo original de premios de acuerdo con el testamento de Alfred Nobel de 1895, estableciéndose posteriormente, en 1968.

[2] Boletín management nº 17, “Planes de contingencia”

[3] Antoine Augustin Cournot (1801-1877), matemático y economista francés considerado como el matemático que comenzó la sistematización formal de la economía. Fue el primero en utilizar funciones matemáticas para describir conceptos como demanda, oferta o precio y contribuyó notablemente a la ciencia estadística. Cournot, junto a otros clásicos como Joseph Louis Bertrand (1822-1900) o Francis Isidro Edgeworth (1845-1926), fue uno de los precursores de las Teorías económicas  sobre mercados cuya característica principal es la interdependencia.

[4] Oskar Morgenstern (1902-1977) matemático alemán emigrado a Estados Unidos a raíz de la Segunda Guerra Mundial, es autor de numerosos estudios de matemática y economía, el más conocido de los cuales es el de “The Theory of Games and economic behavior”, escrito conjuntamente con el matemático húngaro John von Neumann (1903-1957) considerado uno de los más eminentes científicos del siglo.

[5] El equilibrio de Nash se alcanza en una situación en la que ninguno de los jugadores de un juego en el que hay dos o más jugadores y todos conocen los equilibrios de los demás, quieren cambiar unilateralmente su decisión porque cambiarla supondría empeorar su condición. Cuando todos los jugadores han tomado una decisión y no pueden cambiarla sin empeorar su bienestar, se considera que se ha alcanzado un equilibrio de Nash. Con el equilibrio de Nash puede haber una situación en la que todos los jugadores incrementen su bienestar sin perjudicar a los demás. No obstante, en ocasiones el equilibrio de Nash es la única alternativa dadas las reglas del juego. El equilibrio de Nash se ha utilizado para regular situaciones de competencia entre empresas y diseñar subastas de adjudicaciones públicas. Una legislación que tenga en cuenta el equilibrio de Nash puede evitar oligopolios, por eso en la legislación antimonopolio se suele buscar formas de evitar que se pacten precios entre las partes implicadas.


[6] Se denominan pagos los resultados o utilidades que obtiene cada jugador en función de la estrategia de todos los jugadores

No hay comentarios:

Publicar un comentario