Dilèma del presonièr

Lo dilèma del presonièr, enonciat en 1950 per Albert W. Tucker a Princeton, caracteriza dins la toeria dels jòcs un situacion ont dos jogaires aurián interès a cooperar, mas ont, en l'abséncia de comunicacion entre eles, cadun causirà traïr l'autre se lo jòc se jòga pas qu’un còp. La rason es que se l'un coopèra e que l'autre traís, lo cooperator es fortament penalizat. Pasmens, se los dos jogaires traïsson, lo resultat lor es mens favorable que se los dos avián causit de cooperar.

Lo dilèma del presonièr es sovent evocat dins de domènis coma l'economia, la biologia, la politica internacionala, las politicas comercialas (avantatge e riscs d'una guèrra dels prètz), la psicologia, lo tractament mediatic de la rumor, e quitament l'emergéncia de règlas moralas dins de comunautats.

d’aquí venon los jòcs d'economia experimentala testant la racionalitat economica dels jogaires e lor capacitat d’identificar l'equilibri de Nash d'un jòc.

Principi

Tucker supausa dos presonièrs (complicis d'un crime) retenguts dins de cèlas separada e que pòdon pas comunicar; l'autoritat penitenciàrias ofrí a cadun dels presonièrs las causidas seguentas:

se un sol dels dos presonièrs denòncia l'autre, es desliurat alara que lo segond obten la pèna maximala (10 ans);
se los dos se denòncia entre eles, ils seràn condamnats a una pèna mai leugièra (5 ans);
se los dos refuzan de denonciar, la pèna serà minimala (6 meses), per manca d’elements.

Aqueste problèma modeliza plan las questions de politica tarifària: lo concurrent que baissa sos prètz ganha de parts de mercat e pòt tanben aumentar sas vendas e far possiblament créisser son benefici, mas se son concurrent màger fa çò mèsme, ambedos pòdon i pèrdre.

Aqueste jòc mèna pas espontanèament a un estat ont se poiriá melhorar lo benèsser d'un jogaire sens damatjar aqueste d'un autre (es a dire un optim de Pareto; veire tanben equilibri de Nash). A l'equilibri, cadun dels prisonièrs causirà benlèu passar alara que ganharián a cooperar: cadun es fortament incitat a trichar, çò qui constituís lo còr del dilèma.

Se lo jòc se repetará, cada jogaire poiriá far de represalhas contra l'autre jogaire per son abséncia de cooperacion, o quitament simplament minimizar sa pèrda maximala en traïssent los còps venents. L'incitacion per trichar ven alara inferiora a la menaça de castig, çò qu’introduch la possibilitat de cooperar: la fin pas mai justifica plus los mejans.

Lo dilèma del prisonièr es utilizat en economia, estudiat en matematicas, util a vegada als psicològs, biologistas dels ecosistèmas e especialistas de sciéncia politica. Lo paradigme correspondent es tanben mencionat en filosofia e dins lo domènis de las sciéncias cognitivas.

Dilèma del presonièr classic

Formulacion

La primièra experiéncia del dilèma del presonièr foguèt realizada en 1950 per Melvin Dresher e Merill Flood, que trabalhan alara per la RAND Corporation. Enseguida, Albert W. Tucker la presenta jos la forma d'una istòria:

« Dos suspèctes son arrestats per la polícia. Mas los agents an pas las pròvas que cal per los inculpar, donc los interrògan de bais separat lor fasent la mèsme ofèrta. « Se denonciariás ton complici e qu'el te denonciariá pas, seràs desliurat e l'autre condemnat de 10 ans de preson. Se lo denonciariás e el tanben, ambedos seretz condemnats a 5 ans de prison. Se pas degun se denonciariá, auretz ambedos 6 meses de preson. »

Se resumís sovent la situacion dins un tablèu

Tablèu recapitulatiu de la situacion
1 \ 2	Lo suspècte n°2 se cala	Lo suspècte n°2 denòncia
Lo suspècte n°1 se cala	Ambedos fan 6 meses de preson	n°1 fa 10 ans de preson; n°2 es desliurat
Lo suspècte n°1 denòncia	n°1 es desliurat; n°2 fa 10 ans de preson	Ambedos fan 5 ans de preson

e las utilitats de cadun dins aqueste tablèu nomenat "Matritz dels Pagaments" :

Matritz dels Pagaments
1 \ 2	Lo suspècte n°2 se cala	Lo suspècte n°2 denòncia
Lo suspècte n°1 se cala	(-1/2 ; -1/2)	(-10 ; 0)
Lo suspècte n°1 denòncia	(0 ; -10)	(-5 ; -5)

Cadun dels presonièrs sosca de son costat en considerant los dos cas possibles de reaccion de son complici.

« Dins le cas qu’el me denonciariá:
- Se me cali, farai 10 ans de preson;
- Mas se lo denoncii ièu, farai pas que 5 ans. »
« Dins lo cas qu’el me denonciariá pas :
- Se me cali, farai 6 meses de preson;
- Mas se lo denoncii ièu, serai desliurat. »

Se cadun dels complicis fa aqueste rasonament, l’un e l’autre benlèu van far un denonciacion mutuala, aquesta causida essent la mai dotada de racionalitat. Segon l’enonciat, seràn alara condemnat a 5 ans de preson cadun. Mas, s'èran ambedos demorats muts, ils aurián estat condemnats a 6 meses cadun. Atal, cadun seguís son interès individual, lo resultat obtengut es pas optimal a sens de Pareto.

Aqueste jòc es de soma non nulla, es a dire que la soma dels ganhs pels participants es pas sempre la mèsma: pausa una question de cooperacion.

Per qu’exita un dilèma, la tentacion $T$ (lo denoncii, se cala) deu pagar mai que la cooperacion $C$ (ambedos se calam), que deu portar mai que lo castig per egoïsme P (lo denoncii, me denoncia), que deu èsser mai valorisanta que la duplicitat $D$ (me cali, me denoncia). Es formalizat per:

Per qu'una collaboracion pòsca naícer dins un dilèma repetitiu (o iteratiu) (veire infra), « 2 còps de cooperacion $C$ » deu èsser mai valorizant que l'alternat « Tentacion / Duplicitat ».

Çò que dona la condicion $2C>T+D$ [aquí: $2^{*}-0,5>0+(-10)$ ].

Dilèma amb mai de dos jogaires

Lo problèma ven sensiblament diferent quand i a mai de dos prisonièrs totes a despart. Lo risc de defeccion d’al mens un d’eles ven alara plan mens grand que quand n’i pas que dos. Pòt dins aqueste cas mai realista de far la mesa sul fach qu'i aurà una defeccion… quitament fasent çò mèsme cadun, totòm recebrà la pena maximala.

Exemples de situacions realas

Lo dilèma del prisonièr dona un encastre general per pensar las situacions ont dos o mai actors an un interès a cooperar, mas un interès encora mai fòrt a lo far pas se l’autre lo fa, e sens pas cap de contrénher l'autre.

Los exemples seguents permeton de comprene melhor la diversitat de las aplicacions possiblas e la granda generalitat de l’encastre del dilèma del presonièr.

Mercat de l'informacion

La situacion concurenciala dels mèdias sembla al dilèma del prisonièr dins la mesura on es privilegiada la rapiditat abans la qualitat de l'informacion, d'ont un fenomèn de mutualizacion de las errors.

Economia

Un exemple canonic es lo cas de doas entreprisas qu’an pas lo drech de s'entendre sus una politica comerciala comuna (leis sus la concurréncia e antitrust) e que se demandan se lor cal procedir o non a una baissa de prètz per conquerir de parts de marcat sus lor concurrent. Se ambedoas baissan lor prètz, mai sovent seràn ambedoas perdentas al respècte de l’statu quo. Se pòt aata evocar per aqueste subjècte lps bens collectius (totòm vòl beneficiar, mas volent los far finançar pelrs autres), lo cas dels quòtas textils destinats a defugir una casuda dels prètz mas que cadun cerca a l’enganar, o las campanhas publicitàrias carestiòsas pel mèsme ben que se neutralizan.

Espòrt

Las corregudas ciclistas de carrièra, coma lo Torn de França, donan d'autres exemples d'interaccions estrategicas de tipe « dilèma del presonièr », per exemple quand dos correires « « escapats » devon decidir se fan l'esfòrç o se fan profièch al maxim de l'aspiracion de lor coescapat: se cadun profiècha de l'aspiracion de l'autre (çò que cadun preferís), l'escapada torna èsser agafada.

Ecologia

La teoria dels jòcs, e lo delèma del prisonièr en particular, son sovent utilizats en ecologia per modelizar l'evolucion dels comportaments entre individús d'une mèsma espècia cap a d’estrategias evolutivament establas. L'aparicion e lo manten dels comportaments de collaboracion per exemple, correspondon a aqueste tipe d'analisi. Richard Dawkins ne faguèt un dels punts central de sa teoria del gèn egoïsta, que l'optimizacion de la subrevida pòt passar per un comportament en aparéncia altruista.

Politica internacionala

Consideram dos païses rivals. Cadun pòt causir de manténer o non una armada. Se los dos an una armada (de fòrça gaireben equivalenta), la guèrra es mens « tententa », que carstissina; foguèt la situacion de la guèrra freja. Las despansas militaras e la corsa als armaments son alara una pèrda neta per ambedos païses. Se un sol a una armada, pòt segur conquerir l'autre sens pena, çò qu’es pièger. Enfin, se pas un a d'armada, la règne la patz e los païses an pas de despensa militara. La situacion de cooperacion permetent a cadun d’aver pas d'armada es segur preferible a la situacion ont ambedos païses n’entretengan una, mas es instabla: cadun dels dos païses a una fòrta incitacion a se dotar unilateralament d'una armada per dominar l'autra.

Lo dilèma repetit

Dins son libre Evolucion of cooperation ( evolucion de la cooperacion, 1984), Robert Axelrod estudia una extension classica d’aqueste dilèma: lo jòc se repetís, e los participants se remembran dels encontres precedents. aquesta version del jòc tanben se nomena dilèma iteratiu del prisonièr. Dona una autra illustracion a partir d'una situacion equivalenta: doas personas escambian de sacs, censats conténer respectivament de l'argent e un ben. Cadun a un interès immediat de passar un sac vuèg, mas es avantatjós per ambedos que se debane la transacion

Quand se repèta aqueste jòc de biais durable dins une populacion, los jogaires que causisson una estrategia interssada i pèrdon al long tèrme, alara que los jogaires en aparéncia mai desinterressats veson lor « altruisme » al final premiat: lo dilèma del presonièr es donc pas pus un quita dilèma. Axelrod i vegèt una explicacion de l'aparicion d'un comportament altruista dins un contèxte d'evolucion darwiniana per seleccion naturala.

La melhora estrategia dins un contèxte determinista es « Tit for Tat » (tengam-tengam) e foguèt concebuda per Anatol Rapoport per un concors informatizat. Son excepcionala simplicitat ganhèt sus las autras proposicions. Consistís a cooperar al primièr còp, puèi a reproduire per cada còp lo comportament de l'adversari al còp precedent. Una varianta, « uèlh per uèlh amb perdon », se revelèt un pauc mai eficaç: en cas de defeccion de l'adversari, se coopèra a vegada (de 1 à 5 %) al còp venent. Aquò permet de demorar pas tancat dins un cicle negatiu. Lo melhor reglatge depend dels autres participants. Subretot, « uèlh per uèlh amb perdon » es mai eficaç se la comunicacion es trebolada, es a dire se ven qu’un autre participant interprète a tòrt un còp.

Pel dilèma del prisonièr, existís pas d’estrategia sempre optimala. Se, per exemple, tota la populacion defauta sistematicament levat un individú que respècte lo « tengam-tengam », aqueste darrièr a un desavantge al primièr còp. Fàcia a una unanimitat de mancas, la melhora estrategia es tanben de traïr sempre. S’i a una partida de traïdors sistematics e de « tengam-tengam », l’estrategia optimala depend de la proporcion e de la durada del jòc. Fasent desaparéisser los individús qu’obtengan pas de bons totals e fasent se duplicar aquestes que mènan, se pòt estudiar de dinamicas interessentas. La reparticion finala depend de la populacion iniciala.

Se lo nombre N d'iteracions es finit e conegut, l'equilibri de Nash es de defautar sistematicament, coma per N=1. Aquò se mòstra simplament per recuréncia :

al darrièr còp, sens sanccion possibla de la part de l'adversari, i a interès a traïr;
çò fasent, a l'abans-darrièr còp, coma es anticipat que l'adversari traïra que que’n siá al còp seguent, tanben es melhor traïr;
contunha lo rasonament fins a refuzar de cooperar a cada còps.

Per que la cooperacion demore interessenta, lo futur deu donc demorar non segur per totes los participants — una solucion possibla es de tirar un N aleatòri.

La situacion es tanben estonantat quand se jòc de biais indefinit al dilèma del prisonièr, lo resultat essent la mejana dels resultats obtenguts (calculada del biais que cal).

Lo dilèma del prisonièr es la basa d’unas teorias de la cooperacion umana e de la fisança. Quand s’assimila las situacions de transaccions que reclaman de fisança per un dilèma del presonièr, un comportament de cooperacion dins una populacion pòt èsser modelizat coma un jòc entre diferents jogaires, repetat - d'ont lo pivelatge de fòrça universitaris dempuèi longtemps: en 1975, Grofman e Pool estimavan ja a mai de 2000 los articles scientifics als subjèctes.

Aquestas òbras donan una basa modelizabla, quantitativa, per l’estudi scientific de las leis moralas.

Axelrod dona dins son obratge Cossí reüssit dins un mond egoïsta un exemple d’estrategia tengam-tengam dins l’encatre del dilèma del presonièr iteratiu: pendent la guèrra de las trencadas, los combatants dels dos camps, e aquò, contra l'avís del comandament, aplicavan lo principi « viure e daissar viure ». Los protagonistas jamai provocan en primièr las ostilitats mas replicavan fortament a tota agression.

Variantas

Existís de variantas del jòc que, en modificant leugièrament los ganhs, menan a de conclusons plan diferentas:

Lo jòc del capon

Lo capon es un autre jòc de soma non nulla, ont la cooperacion es premiada. Aqueste jòc es similar al dilèma del presonièr que ven avantatjós de traïr quand l'autre coopèra. Mas es diferent que ven avantatjós de cooperar se l'autre traís: la defeccion dobla es la pièger de las solucions — qu’es un equilibri instable — alara que dins lo dilèma del presonièr es sempre avantatjós de traïr, çò que fasiá l'equilibri de dobla defeccion establa. La dobla cooperacion es dins los dos jòcs un equilibri instable.

Una matritz dels ganhs sembla a:

se ambedos coopèran, recebon +5 ;
se un coopèra alara que l'autre se defauta, alara lo primièr obten +1 e l'autre +10 ;
se ambedos se defautan tòcan -20.

Matritz dels ganhs
1 \ 2	Coopèra	Traís
Coopèra	(+5;+5)	(+1;+10)
Traís	(+10;+1)	(-20;-20)

Lo nom de « capon » ven del « jòc » automobil:

Doas veituras se ronçan l'una cap a l'autra, al punt de s’entrespotir. Cada jogaire pòt desviar e estalivar la catastròfa (cooperacion) o gardar le cap al risc de la trucada (defeccion).

I a d’avantatges a paréisser coma un « balés » que renonça pas e intimida l'adversari… del moment que se pòt demorar en jòc.

N’i a d’exemples concrèts dins fòrça cituacion de la vida videnta: l'entreten de l’ostal comun a un parelh, per exemple, o l'entreten d'un sistèma d'asagatge entre dos bordièrs. Cadun pòt l'entreténer sol, mas ne profièchan ambedos. Se un d’entre ele assegura pas sa part d'entreten, l'autre a sempre interès a lo far a sa plaça, per contunhar a assagar. Alara, se l'un capita a establir una reputacion de malonèst dominant — es a dire se l'abitud es presa que siá sempre l'autre que s'ocupa de l'entreten — serà susceptible de manténer aquesta situacion.

L’exemple pòt tanben s'aplicar en politica internacionala, dins la situacion ont dos Estats entretenon un desacòrdi qu’es susceptible de menar a une guèrra. Passa per un capon es una garantida d'èsser mai tard confrontat encara a la mèsma situacion (coma la França e la Grand Bretanha lo constatèron abans de 1939), mas manténer una reputacion supausa una depensa (entreten militar) e de riscs (guèrra sempre possibla).

Amic o enemic

« Amic o enemic » (« Friend or Foe? (en) ») es un jòc de la television als EUA (Game Show Network). Es un exemple de dilèma del prisonièr testat sus de particulars dins un encastre artifical. Sul platel, tres parelhs de participants s'afrontan. Quand un parelh es eliminat, sos dos membres se repartisson lors ganhs segon un dilèma del prisonièr. Se ambedos coopèran (« Friend »), partejan equitablament la soma acumulada pendent lo jòc. Se pas cao coopèra (« Foe »), se separan sens pas res. Se un coopèra e que l'autre defauta, lo primièr se’n va amb pas res e l'autre amb tott. La situacion es un pauc diferenta de la matritz canonica mai naut: lo ganh es lo mèsme per que veja sa fisança traïda o que mene l'autre dins sa pèrda. Se un jogaire sap que l'autre lo traïrà, sa responsa li es indiferenta. L'equilibri non cooperatiu es donc neutre aquí, alors qu'es estable dins lo cas del dilèma del prisonièr abitual.

La matritz de considerar es donc:

se ambedos coopèran, cadun obten 50 % ;
se ambedos defautan, ne tiran 0 % ;
se l'un coopèra e que l'autre traís, lo primièr recep 0 % e l'autre 100 %.

Matritz dels ganhs
Jogaire 1 / Jogaire 2	Coopèra	Traís
Coopèra	(50 % ; 50 %)	(0 % ; 100 %)
Traís	(100 % ; 0 %)	(0 % ; 0 %)

L'economista John A. List estudièt lo comportament dels jogaires dins aqueste jòc per testar las prediccions de la teoria dels jòcs dins un contèxte real. Los jogaires collabòran dins 50 % dels cas mas i a de diferéncias de comportament segon las caracteristicas socidemograficas dels jogaires. Per exemple, los òmes coopèran mens sovent que las femnas. Pasmens, mòstra l'estudi que los jogaires adaptan plan pauc lor comportament segon lor partenari.

Referéncias

Vejatz tanben

Bibliografia

Robert Axelrod, Donnant donnant - Une théorie du comportement coopératif (traduit aux éditions Odile Jacob 1992)
(en) Robert Axelrod, The Evolution of Cooperation, 1984 ;
(en) Grofman et Pool, Bayesian Models for Iterated Prisoner's Dilemma Games. General Systems, 1975 ;
(en) John F. Nash, Non-Cooperative Games, in Annals of Mathematics, vol. 54, 1951, p. 289-295 ;
(en) William Poundstone, Prisoner's Dilemma: John von Neumann, Game Theory and the Puzzle of the Bomb, Doubleday, 1992. ISBN: 978-0-385-41567-5.

Modèl:Commentaire biblioUna introduccion larg e tot public coma l’indica lo sostítol

Nicolas Eber, Le dilemme du prisonnier, La Découverte, collection Repères, juin 2006.

Modèl:Commentaire biblio

Serge Aron, Luc Passera, Les sociétés animales, De Boeck, 2000.

Jean-Pierre Dupuy, Logique des phénomènes collectifs (introduction aux sciences sociales), édition Ellipse 1992.
(en) James Miller, Game Theory at work : How to Use Game Theory to Outthink and Outmaneuver your Competition, New York, Mcgraw-Hill, 13 mars 2003, 288 p. (ISBN 978-0071400206), chap. 7 (« Prisonner's dilemma »), p. 118-120

Articles connèxes

Ligams extèrnes

Fonts sul dilèma iterat dels presonièrs sul site del Laboratòri d'Informatica Fondamentala de Lilla.
Jogar al dilèma del presonièr en linha
Comprene los comportaments dins lo dilèma del presonièr
(en) Lo dilèma del presonièr geometric