Dilemme du prisonnier à plus de 2
DIVERS
+ DE 2 ANS
Le 28/09/2015 à 12h56
713 vues
Question d'origine :
Bonjour,
les différentes formulations du dilemme du prisonnier se penchent le plus souvent sur son caractère itératif ou non. En gros, est-ce que la situation est la même quand elle a lieu une seule fois, ou le fait de la répéter avec les mêmes "prisonniers" a-t-il une influence sur le choix de chacun et donc sur l'issue.
On trouve parfois des variantes portant sur la nature ou la hauteur de la récompense/punition de chaque choix pour chacun des deux prisonniers.
Mais je ne trouve pas d'éléments développant le dilemme quand il y a plus de deux prisonniers. Je croyais avoir lu qu'un professeur de lycée américain avait appliqué pendant des années le dilemme à ses classes mais je ne retrouve rien à ce sujet. C'est donc l'objet de ma question.
Comment peut-on appliquer le dilemme a un groupe de plus de deux "prisonniers", par exemple une classe de 25 élèves ? Faut-il simplement prendre les résultats et les diviser en deux par des pourcentages (par exemple : si plus de la moitié de la classe choisit A ou si moins de la moitié de la classe choisit A...) pour retrouver deux éléments ? Ou faut il produire une matrice avec 25 lignes et/ou colonnes et répartir les divers degrés de punition/récompense sur ces 25 lignes/colonnes ? Ou encore autre chose ?
Je vous remercie de votre réponse.
Réponse du Guichet
gds_et
- Département : Équipe du Guichet du Savoir
Le 29/09/2015 à 14h06
Bonjour,
Pour commencer, rappelons brièvement le principe du dilemme du prisonnier :
Le dilemme du prisonnier, énoncé en 1950 par Albert W. Tucker à Princeton, caractérise en théorie des jeux une situation où deux joueurs auraient intérêt à coopérer, mais où, en l’absence de communication entre les deux joueurs, chacun choisira de trahir l'autre si le jeu n'est joué qu'une fois. La raison est que si l’un coopère et que l'autre trahit, le coopérateur est fortement pénalisé. Pourtant, si les deux joueurs trahissent, le résultat leur est moins favorable que si les deux avaient choisi de coopérer.
Lorsque le jeu est joué plusieurs fois de suite, il sert d'illustration au folk theorem (en) voulant que toutes les issues du jeu peuvent être des équilibres d'un jeu répété un assez grand nombre de fois.
Le dilemme du prisonnier est souvent évoqué dans des domaines comme l'économie, la biologie, la politique internationale, la psychologie, le traitement médiatique de la rumeur1, et même l'émergence de règles morales dans des communautés.
Il a donné naissance à des jeux d'économie expérimentale testant la rationalité économique des joueurs et leur capacité à identifier l'équilibre de Nash d'un jeu.
[…]
Tucker suppose deux prisonniers (complices d'un crime) retenus dans des cellules séparées et qui ne peuvent communiquer ; l'autorité pénitentiaire offre à chacun des prisonniers les choix suivants :
• si un des deux prisonniers dénonce l'autre, il est remis en liberté alors que le second obtient la peine maximale (10 ans) ;
• si les deux se dénoncent entre eux, ils seront condamnés à une peine plus légère (5 ans) ;
• si les deux refusent de dénoncer, la peine sera minimale (6 mois), faute d'éléments au dossier.
Ce problème modélise bien les questions de politique tarifaire : le concurrent qui baisse ses prix gagne des parts de marché et peut ainsi augmenter ses ventes et accroître éventuellement son bénéfice, mais si son concurrent principal en fait autant, les deux peuvent y perdre.
Ce jeu ne conduit pas spontanément à un état où on ne pourrait améliorer le bien-être d’un joueur sans détériorer celui d’un autre (c'est-à-dire un optimum de Pareto ; voir aussi équilibre de Nash). À l'équilibre, chacun des prisonniers choisira probablement de faire défaut alors qu'ils gagneraient à coopérer : chacun est fortement incité à tricher, ce qui constitue le cœur du dilemme.
Si le jeu était répété, chaque joueur pourrait user de représailles envers l'autre joueur pour son absence de coopération, ou même simplement minimiser sa perte maximale en trahissant les fois suivantes. L'incitation à tricher devient alors inférieure à la menace de punition, ce qui introduit la possibilité de coopérer : la fin ne justifie plus les moyens.
Le dilemme du prisonnier est utilisé en économie, étudié en mathématiques, utile parfois aux psychologues, biologistes des écosystèmes et spécialistes de science politique. Le paradigme correspondant est également mentionné en philosophie et dans le domaine des sciences cognitives.
Source : Wikipedia
On trouve plusieurs jeux de groupe illustrant le dilemme du prisonnier : soit en divisant les participants en deux groupes, soit en sélectionnant des paires au hasard. Le jeu « rouge ou bleu » se joue avec un groupe A et un groupe B :
Il n’est plus question cette fois de prisonniers et de juge, mais seulement d’enchères et d’annonces, comme dans un jeu de cartes. […]
Pour commencer, le consultant demande des volontaires et forme deux équipes de trois personnes. Chaque équipe désigne un chef. Le consultant explique que les équipes vont jouer l’une en fonction de l’autre, sans jouer nécessairement l’une contre l’autre, le but de chacune étant de faire le maximum de profit. Les équipes peuvent gagner toutes les deux en même temps. Quand la somme des résultats n’est pas nulle, c’est la banque, tenue par le consultant, qui encaisse ou décaisse la différence. Les enchères sont fixées d’un commun accord au début du jeu, par exemple à un dollar le point. On désigne un arbitre qui se déplacera d’une équipe à l’autre. Toutes les annonces passeront par son intermédiaire.
Le jeu se joue en dix coups et trois manches : deux premières manches de quatre coups chacune, puis une troisième manche de deux coups seulement. Chaque coup se déroule de la façon suivante : le chef de la première équipe annonce à l’arbitre la couleur choisie, sans être entendu par l’autre équipe. Le chef de la seconde équipe fait de même. Les deux annonces étant faites, l’arbitre les inscrit au tableau avec les gains correspondants. Les scores de chaque coup placent les deux équipes devant le dilemme : jouer rouge la fois suivante en espérant gagner ensemble, ou jouer bleu en espérant gagner seul. Après chacune des deux premières manches, l’arbitre annonce une pause de dix minutes. Il propose aux équipes de mettre ce temps à profit pour négocier, et peut-être conclure un accord.
Un calcul très simple montre que chaque équipe peut gagner au maximum 24 points en jouant toujours bleu tandis que l’autre jouerait toujours rouge, ou bien perdre la même somme dans la situation inverse. Ce sont des jeux à somme nulle. Mais les deux équipes peuvent aussi gagner chacune 12 points en jouant toujours rouge ou perdre chacune 12 points en jouant toujours bleu. Ce sont des jeux à somme positive ou négative.
[…]
Score après chaque coup :
Rouge / Rouge : +1 / +1
Rouge / Bleu : -2 / +2
Bleu / Rouge : +2 / -2
Bleu / Bleu : -1 / -1
Source : La libre concurrence en procès, Jean-Marie Gogue
Vous pouvez consulter d’autres sources évoquant ce jeu ou une variante :
- Psychologie du manager, Patrick Amar
- Méthodes pour enseigner et apprendre en groupe, Luc Peeters
- Prisoner’s Dilemma – A Game Theory Simulation, Peter Pappas (en anglais)
Charles A. Holt et Monica Capra présentent un autre jeu adapté à une salle de classe, avec des cartes à jouer (une carte rouge et une carte noire pour chaque participant), où une paire de joueurs est constituée arbitrairement après que ceux-ci ont fait leur choix : Classroom games : a prisoner’s dilemma
Enfin, un professeur d’université propose chaque année à une classe la possibilité de gagner des points supplémentaires à son examen, selon le principe du dilemme du prisonnier :
En leur proposant d’obtenir des points supplémentaires à leur examen, un professeur de psychologie fait réfléchir ses élèves sur différents concepts de psychologie sociale. Sans succès, puisqu’une seule classe depuis 2008 a réussi à passer l’épreuve avec succès.
Intérêt personnel contre intérêt général. C’est la morale que sous-tend la question piège posée depuis plusieurs années par Dylan Selterman, professeur de psychologie à l’université du Maryland, à ses étudiants. Le dilemme qui repose sur de vrais concepts met les internautes en émoi depuis sa publication par un étudiant interloqué. Cette question casse-tête promet, selon la réponse, d’obtenir ou non des points supplémentaires à son examen. Depuis 2008, seule une classe a réussi à obtenir les fameux points bonus.
La question est simple, mais cruelle: «Ici, vous avez l’opportunité de gagner des points supplémentaires pour ce dernier partiel. Sélectionner si vous souhaitez obtenir 2 points ou 6 points en plus sur votre note. «Mais il y a un petit truc», prévient avec espièglerie le professeur. «Si plus de 10% de la classe sélectionne les 6 points supplémentaires, personne n’obtiendra de points en plus». Que faire alors? Prendre le risque de n’avoir aucun point supplémentaire en tentant d’en obtenir 6, ou jouer la sécurité en cochant la case 2, et tenter d’assurer une récompense à l’ensemble de la classe?
«Quel genre de professeur fait ça»!?
Un élève de Dylan Selterman a pris la question en photo et l’a partagée sur le réseau social Twitter avec en légende, une interrogation en lettres majuscules: «Quel genre de professeur fait ça»!?
Un tweet très largement partagé sur le réseau social, jusqu’à arriver sur l’écran du professeur en question, qui s’est fendu d’une réponse laconique non dénuée d’humour: «Je suis ce professeur».
Dans une interview au site BuzzFeed (en anglais), le professeur de psychologie a indiqué que cette question piège lui permet de faire réfléchir ses élèves sur la dynamique de groupe et certains concepts de la psychologie sociale et de phénomènes économiques bien connus, comme la «tragédie des biens communs» ou «le dilemme du prisonnier». Soit une bonne manière de démontrer aux élèves ce qui arrive lorsque les individus agissent en faveur de leur propre intérêt au dépend de ce qui est le mieux pour le groupe. «Certains étudiants déplorent le degré d’égoïsme parmi leurs pairs , tandis que d’autres étudiants (bravement, à mon avis) admettent ouvertement de faire le choix des six points» explique Dylan Selterman à BuzzFeed. Mettant ainsi en péril l’opportunité pour tous les autres d’obtenir des points également.
Source : La question piège d’un professeur torture les internautes, Le Figaro
(voir aussi la présentation de cette « leçon » par Michael A. McPherson et Michael L. Nieswiadomy (en anglais) : Teaching the prisoner’s dilemma more effectively : engaging the students)
Pour terminer, citons aussi l’exemple de la classe de Peter Fröhlich. Cet enseignant a une méthode de notation particulière : l’élève le plus fort obtient un A, et les autres élèves sont notés en fonction de ses résultats. Prenant ce professeur à son propre jeu, ses élèves ont décidé tout simplement de boycotter son contrôle !
Beau joueur, et impressionné par la solidarité dont ses élèves ont fait preuve, l’enseignant a choisi de les récompenser : ayant tous obtenu la note 0, ils ont donc tous eu un A…
(source : Students get class-wide As by boycotting test, solving Prisoner's Dilemma, boingboing.net)
Bonne journée.
Pour commencer, rappelons brièvement le principe du dilemme du prisonnier :
Le dilemme du prisonnier, énoncé en 1950 par Albert W. Tucker à Princeton, caractérise en théorie des jeux une situation où deux joueurs auraient intérêt à coopérer, mais où, en l’absence de communication entre les deux joueurs, chacun choisira de trahir l'autre si le jeu n'est joué qu'une fois. La raison est que si l’un coopère et que l'autre trahit, le coopérateur est fortement pénalisé. Pourtant, si les deux joueurs trahissent, le résultat leur est moins favorable que si les deux avaient choisi de coopérer.
Lorsque le jeu est joué plusieurs fois de suite, il sert d'illustration au folk theorem (en) voulant que toutes les issues du jeu peuvent être des équilibres d'un jeu répété un assez grand nombre de fois.
Le dilemme du prisonnier est souvent évoqué dans des domaines comme l'économie, la biologie, la politique internationale, la psychologie, le traitement médiatique de la rumeur1, et même l'émergence de règles morales dans des communautés.
Il a donné naissance à des jeux d'économie expérimentale testant la rationalité économique des joueurs et leur capacité à identifier l'équilibre de Nash d'un jeu.
[…]
Tucker suppose deux prisonniers (complices d'un crime) retenus dans des cellules séparées et qui ne peuvent communiquer ; l'autorité pénitentiaire offre à chacun des prisonniers les choix suivants :
• si un des deux prisonniers dénonce l'autre, il est remis en liberté alors que le second obtient la peine maximale (10 ans) ;
• si les deux se dénoncent entre eux, ils seront condamnés à une peine plus légère (5 ans) ;
• si les deux refusent de dénoncer, la peine sera minimale (6 mois), faute d'éléments au dossier.
Ce problème modélise bien les questions de politique tarifaire : le concurrent qui baisse ses prix gagne des parts de marché et peut ainsi augmenter ses ventes et accroître éventuellement son bénéfice, mais si son concurrent principal en fait autant, les deux peuvent y perdre.
Ce jeu ne conduit pas spontanément à un état où on ne pourrait améliorer le bien-être d’un joueur sans détériorer celui d’un autre (c'est-à-dire un optimum de Pareto ; voir aussi équilibre de Nash). À l'équilibre, chacun des prisonniers choisira probablement de faire défaut alors qu'ils gagneraient à coopérer : chacun est fortement incité à tricher, ce qui constitue le cœur du dilemme.
Si le jeu était répété, chaque joueur pourrait user de représailles envers l'autre joueur pour son absence de coopération, ou même simplement minimiser sa perte maximale en trahissant les fois suivantes. L'incitation à tricher devient alors inférieure à la menace de punition, ce qui introduit la possibilité de coopérer : la fin ne justifie plus les moyens.
Le dilemme du prisonnier est utilisé en économie, étudié en mathématiques, utile parfois aux psychologues, biologistes des écosystèmes et spécialistes de science politique. Le paradigme correspondant est également mentionné en philosophie et dans le domaine des sciences cognitives.
Source : Wikipedia
On trouve plusieurs jeux de groupe illustrant le dilemme du prisonnier : soit en divisant les participants en deux groupes, soit en sélectionnant des paires au hasard. Le jeu « rouge ou bleu » se joue avec un groupe A et un groupe B :
Il n’est plus question cette fois de prisonniers et de juge, mais seulement d’enchères et d’annonces, comme dans un jeu de cartes. […]
Pour commencer, le consultant demande des volontaires et forme deux équipes de trois personnes. Chaque équipe désigne un chef. Le consultant explique que les équipes vont jouer l’une en fonction de l’autre, sans jouer nécessairement l’une contre l’autre, le but de chacune étant de faire le maximum de profit. Les équipes peuvent gagner toutes les deux en même temps. Quand la somme des résultats n’est pas nulle, c’est la banque, tenue par le consultant, qui encaisse ou décaisse la différence. Les enchères sont fixées d’un commun accord au début du jeu, par exemple à un dollar le point. On désigne un arbitre qui se déplacera d’une équipe à l’autre. Toutes les annonces passeront par son intermédiaire.
Le jeu se joue en dix coups et trois manches : deux premières manches de quatre coups chacune, puis une troisième manche de deux coups seulement. Chaque coup se déroule de la façon suivante : le chef de la première équipe annonce à l’arbitre la couleur choisie, sans être entendu par l’autre équipe. Le chef de la seconde équipe fait de même. Les deux annonces étant faites, l’arbitre les inscrit au tableau avec les gains correspondants. Les scores de chaque coup placent les deux équipes devant le dilemme : jouer rouge la fois suivante en espérant gagner ensemble, ou jouer bleu en espérant gagner seul. Après chacune des deux premières manches, l’arbitre annonce une pause de dix minutes. Il propose aux équipes de mettre ce temps à profit pour négocier, et peut-être conclure un accord.
Un calcul très simple montre que chaque équipe peut gagner au maximum 24 points en jouant toujours bleu tandis que l’autre jouerait toujours rouge, ou bien perdre la même somme dans la situation inverse. Ce sont des jeux à somme nulle. Mais les deux équipes peuvent aussi gagner chacune 12 points en jouant toujours rouge ou perdre chacune 12 points en jouant toujours bleu. Ce sont des jeux à somme positive ou négative.
[…]
Score après chaque coup :
Rouge / Rouge : +1 / +1
Rouge / Bleu : -2 / +2
Bleu / Rouge : +2 / -2
Bleu / Bleu : -1 / -1
Source : La libre concurrence en procès, Jean-Marie Gogue
Vous pouvez consulter d’autres sources évoquant ce jeu ou une variante :
- Psychologie du manager, Patrick Amar
- Méthodes pour enseigner et apprendre en groupe, Luc Peeters
- Prisoner’s Dilemma – A Game Theory Simulation, Peter Pappas (en anglais)
Charles A. Holt et Monica Capra présentent un autre jeu adapté à une salle de classe, avec des cartes à jouer (une carte rouge et une carte noire pour chaque participant), où une paire de joueurs est constituée arbitrairement après que ceux-ci ont fait leur choix : Classroom games : a prisoner’s dilemma
Enfin, un professeur d’université propose chaque année à une classe la possibilité de gagner des points supplémentaires à son examen, selon le principe du dilemme du prisonnier :
En leur proposant d’obtenir des points supplémentaires à leur examen, un professeur de psychologie fait réfléchir ses élèves sur différents concepts de psychologie sociale. Sans succès, puisqu’une seule classe depuis 2008 a réussi à passer l’épreuve avec succès.
Intérêt personnel contre intérêt général. C’est la morale que sous-tend la question piège posée depuis plusieurs années par Dylan Selterman, professeur de psychologie à l’université du Maryland, à ses étudiants. Le dilemme qui repose sur de vrais concepts met les internautes en émoi depuis sa publication par un étudiant interloqué. Cette question casse-tête promet, selon la réponse, d’obtenir ou non des points supplémentaires à son examen. Depuis 2008, seule une classe a réussi à obtenir les fameux points bonus.
La question est simple, mais cruelle: «Ici, vous avez l’opportunité de gagner des points supplémentaires pour ce dernier partiel. Sélectionner si vous souhaitez obtenir 2 points ou 6 points en plus sur votre note. «Mais il y a un petit truc», prévient avec espièglerie le professeur. «Si plus de 10% de la classe sélectionne les 6 points supplémentaires, personne n’obtiendra de points en plus». Que faire alors? Prendre le risque de n’avoir aucun point supplémentaire en tentant d’en obtenir 6, ou jouer la sécurité en cochant la case 2, et tenter d’assurer une récompense à l’ensemble de la classe?
Un élève de Dylan Selterman a pris la question en photo et l’a partagée sur le réseau social Twitter avec en légende, une interrogation en lettres majuscules: «Quel genre de professeur fait ça»!?
Un tweet très largement partagé sur le réseau social, jusqu’à arriver sur l’écran du professeur en question, qui s’est fendu d’une réponse laconique non dénuée d’humour: «Je suis ce professeur».
Dans une interview au site BuzzFeed (en anglais), le professeur de psychologie a indiqué que cette question piège lui permet de faire réfléchir ses élèves sur la dynamique de groupe et certains concepts de la psychologie sociale et de phénomènes économiques bien connus, comme la «tragédie des biens communs» ou «le dilemme du prisonnier». Soit une bonne manière de démontrer aux élèves ce qui arrive lorsque les individus agissent en faveur de leur propre intérêt au dépend de ce qui est le mieux pour le groupe. «Certains étudiants déplorent le degré d’égoïsme parmi leurs pairs , tandis que d’autres étudiants (bravement, à mon avis) admettent ouvertement de faire le choix des six points» explique Dylan Selterman à BuzzFeed. Mettant ainsi en péril l’opportunité pour tous les autres d’obtenir des points également.
Source : La question piège d’un professeur torture les internautes, Le Figaro
(voir aussi la présentation de cette « leçon » par Michael A. McPherson et Michael L. Nieswiadomy (en anglais) : Teaching the prisoner’s dilemma more effectively : engaging the students)
Pour terminer, citons aussi l’exemple de la classe de Peter Fröhlich. Cet enseignant a une méthode de notation particulière : l’élève le plus fort obtient un A, et les autres élèves sont notés en fonction de ses résultats. Prenant ce professeur à son propre jeu, ses élèves ont décidé tout simplement de boycotter son contrôle !
Beau joueur, et impressionné par la solidarité dont ses élèves ont fait preuve, l’enseignant a choisi de les récompenser : ayant tous obtenu la note 0, ils ont donc tous eu un A…
(source : Students get class-wide As by boycotting test, solving Prisoner's Dilemma, boingboing.net)
Bonne journée.
DANS NOS COLLECTIONS :
Ça pourrait vous intéresser :
Commentaires 0
Connectez-vous pour pouvoir commenter.
Se connecter