
Introduction à la Théorie des jeux
0
3
0
Si vous aviez une connexion internet ou un ami dans les années 2010, vous avez peut-être entendu parler d'une petite série télévisée appelée « Game of Thrones », qui était célèbre non seulement pour sa capacité à désensibiliser les téléspectateurs aux morts sanglantes et aux scènes épicées caractérisées par des niveaux de consentement parfois douteux, mais aussi pour les intrigues compliquées de ses personnages. Des milliers de téléspectateurs ont été captivés par le jeu de chaises auquel se livraient les personnages et étaient curieux de savoir qui allait gagner et qui allait mourir, conformément aux règles générales définies par Cersei au cours de la première saison. Les étudiants en théorie des jeux ne peuvent que rêver de susciter des discussions aussi passionnantes et d'établir des parallèles intéressants avec le monde réel, comme l'a fait la série de HBO. Mais l'un d'entre eux a élaboré une théorie si intéressante qu'il s'est vu décerner le prix Nobel de mathématiques. Découvrons ensemble qui ont été les premiers intellos à passer leurs après-midi à débattre de la meilleure stratégie pour gagner une partie, et à quels jeux ils s'intéressaient avant l'arrivée de Game of Thrones.

Le théorème de Bayes est utilisé pour déterminer la probabilité d'un événement.
Les premiers théoriciens des jeux
La théorie des jeux semble très amusante jusqu'à ce que l'on se rende compte qu'elle a été développée par les mathématiques, et elle perd alors immédiatement de son attrait. Pourtant, il s'agit d'un domaine d'étude dynamique, plein de rebondissements, avec de nombreuses applications dans la vie quotidienne : c'est la science de la stratégie.
La théorie des jeux n'était pas considérée comme un véritable domaine d'étude jusqu'à ce qu'un homme publie un article, ce qui s'est produit en 1928 avec « On the Theory of Games of Strategy » (Sur la théorie des jeux de stratégie) de Von Neumann. Dans son essai, il est parvenu à prouver qu'il existe une manière parfaitement logique et rationnelle de résoudre un jeu à somme nulle à deux personnes en utilisant un théorème mathématique. En 1944, il a publié un livre avec Oskar Morgenstern intitulé « Theory of Games and Economic Behavior » (Théorie des jeux et du comportement économique). Avant que Von Neumann et Morgenstern ne commencent à faire intervenir les mathématiques, des historiens, des hommes politiques, des barons du crime organisé et des stratèges militaires avaient déjà commencé à réfléchir à certains problèmes sous l'angle de la « théorie des jeux ». À la base, la théorie des jeux s'intéresse à la recherche de la meilleure stratégie pour gagner une partie. Le problème, c'est qu'ils ne déterminaient pas mathématiquement quelle stratégie était la plus rationnelle, quelle était celle qui offrait les meilleurs résultats et quelle était celle qui avait le plus de chances de se produire. C'est ce que la théorie des jeux permet de faire.
Qu'est-ce qu'un jeu ?
Dans la théorie des jeux, un jeu n'est pas nécessairement une activité que l'on pratique pour le plaisir, tout comme Game of Thrones n'est pas amusant pour les personnes qui y jouent. Les résultats d'un jeu dépendent de l'interaction entre deux ou plusieurs joueurs. L'une des principales hypothèses de la théorie des jeux est que les joueurs sont des individus rationnels et qu'ils adopteront la stratégie la plus susceptible de les aider à atteindre le résultat souhaité tout en essayant d'anticiper les mouvements de l'adversaire. Les mathématiciens créent des schémas et utilisent des équations pour résoudre les jeux, mais il n'est pas nécessaire de connaître les mathématiques avancées pour comprendre le concept de base qui sous-tend la théorie des jeux.

Supposons que vous soyez un noble ambitieux dans l'univers de Game of Thrones et que vous souhaitiez, vous aussi, vous asseoir sur le fauteuil le plus convoité du continent et devenir roi. Pour ce faire, vous devez surveiller les autres concurrents, comprendre ce qu'ils vont faire et anticiper leurs mouvements. Vous pouvez même dessiner un graphique pour suivre les différentes issues et probabilités.
Supposons que l'un de vos adversaires soit une personne droite et noble. Il peut y avoir des limites à ce qu'il est prêt à faire, par exemple tuer des innocents, mentir ou corrompre. Trois choix s'offrent à eux : obtenir le trône immédiatement en tuant une femme enceinte et innocente, obtenir le trône dans quelques mois en gagnant le trône de manière équitable au cours d'une campagne militaire où ils risquent de mourir ou de perdre, ou obtenir le trône dans quelques années lorsque le roi actuel sera mort, avec la possibilité que quelqu'un d'autre y parvienne en premier. Même si la première option est celle qui leur permettrait d'accéder au trône plus rapidement, puisqu'ils accordent de l'importance à l'intégrité morale, cette option est celle qu'ils sont le moins susceptibles de choisir, même si c'est celle qui leur permettrait d'atteindre leur objectif plus efficacement. Imaginons maintenant qu'un autre noble prenne toutes ses décisions en fonction du résultat du lancer d'une paire de dés. Il attribue des valeurs aux différentes options et décide, par exemple, que si le résultat du lancer de dés est un nombre compris entre 1 et 2, il choisira la première option, si le résultat est compris entre 3 et 6, il choisira la deuxième option et si le résultat est compris entre 6 et 12, il choisira la troisième option. Si vous voulez prédire quelle option ils choisiront, vous devez connaître les probabilités de chaque lancer et savoir à quels nombres ils ont associé chaque choix possible [1].
Stratégies : pures et mixtes
Dans le livre « Moral Calculations », l'auteur László Mérő explique qu'une stratégie pure est une stratégie dans laquelle les actions d'un joueur sont dictées par un principe unique qui aboutira toujours au même résultat dans des situations identiques. Batman utilise une stratégie pure dans sa lutte contre le crime car, quelles que soient les circonstances, il ne tue jamais. Une stratégie mixte est une stratégie dans laquelle le joueur attribue différentes probabilités à chaque option et choisit ensuite [2]. Le noble qui prend une décision en lançant des dés adopte une stratégie mixte : il attribue un ensemble de chiffres à chaque option, puis le lancer détermine celle qui sera choisie. Dans la plupart des jeux, les stratégies mixtes tendent à être plus « efficaces » que les stratégies pures, tout comme dans l'évolution, les sociétés qui sont plus diversifiées génétiquement ont plus de chances de survivre parce qu'elles sont plus susceptibles de s'adapter à l'environnement, etc.
Il n'y a pas que des stratégies pures et mixtes dans ce monde. Dans son livre, Mero donne l'exemple d'une personne qui dit qu'elle va consulter l'horoscope une fois par an et prendre des décisions en conséquence : ce n'est ni une stratégie pure ni une stratégie mixte, et pourtant beaucoup de gens utilisent ce genre de stratégies pour prendre des décisions. Elles sont toujours importantes, mais elles ne sont pas étudiées par la théorie des jeux. La théorie des jeux ne peut être utilisée que pour comprendre et analyser des décisions rationnelles, et c'est l'un de ses principaux problèmes, qui est souvent négligé.
La théorie des jeux telle que l'a développée Neumann présente certaines caractéristiques : le jeu doit comporter un nombre limité d'options pour chaque mouvement, être un jeu à somme nulle (un joueur gagne exactement ce que l'autre perd) et être caractérisé par une information complète. Cette dernière condition est extrêmement importante. Elle implique que chaque joueur connaît non seulement les options qui s'offrent à lui et à ses adversaires, mais aussi chaque issue possible du jeu, son échelle de valeur et celle de ses adversaires. Comme il s'agit d'un jeu à somme nulle et que les joueurs sont supposés être rationnels, chaque partie essaie de minimiser son profit, sachant que l'adversaire essaiera de faire de même.
Si cela semble trop beau pour être vrai, c'est parce que c'est le cas.
La théorie des jeux a été appliquée à presque tout : biologie, psychologie, informatique, sciences politiques, économie, etc. Il existe des jeux qui expliquent la stratégie de dissuasion nucléaire pendant la guerre froide, des jeux qui expliquent le fonctionnement du mécanisme de sélection de l'évolution et qui expliquent l'augmentation des prix dans l'économie. Ces jeux sont toutefois « théorisés » et « construits » par des personnes qui tentent d'expliquer des phénomènes complexes. La théorie des jeux a peut-être commencé par être mathématique, et elle l'est toujours à certains égards, mais lorsque nous essayons d'expliquer les interactions sociales ou les phénomènes économiques à l'aide de la théorie des jeux, et en particulier de certains de ces jeux, nous oublions souvent une chose : ces jeux ont été créés par des personnes, avec l'aide d'un groupe de personnes.
Ces jeux ont été créés par des personnes ayant des antécédents, une éducation et des préjugés spécifiques. Dans la vie réelle, l'information parfaite n'existe tout simplement pas, et la rationalité est un concept beaucoup plus fragile que nous ne le pensons. Vous voulez un exemple ? Prenons le jeu le plus tristement célèbre de la théorie des jeux : le dilemme du prisonnier.
Le dilemme du prisonnier

Steve et Barry sont arrêtés par la police et accusés d'avoir commis un crime grave. Aucune preuve ne permet de les incriminer pour ce crime, mais la police a suffisamment de preuves pour les accuser d'un autre crime mineur. La police les place dans des cellules séparées et dit à Steve :
"Si vous avouez et dénoncez votre partenaire, nous vous laisserons partir et fermerons les yeux sur ce petit crime que vous avez commis, tandis que votre partenaire purgera une peine de dix ans. Cette offre n'est valable que si votre partenaire ne dit rien non plus : si Barry avoue lui aussi, vous prendrez tous les deux cinq ans. Si aucun de vous n'avoue, vous ferez tous les deux un an car nous n'avons pas de preuves pour vous incriminer. D'ailleurs, nous venons de proposer la même chose à votre ami. Faites votre choix !"
Emiliano Ponzi, “You Guilty!”
Les spécialistes affirment que les mathématiques et la logique montrent qu'il existe un « meilleur choix », à savoir que les deux avouent. Pourquoi disent-ils cela ? Les spécialistes pensent que Steve raisonnera de la manière suivante :
"Si Barry avoue et que je n'avoue pas, ils s'en sortent sans aucune peine de prison et je purge dix ans. Barry sera évidemment tenté par cette proposition, et je devrais donc probablement avouer pour éviter de purger dix ans. Dans ce cas, nous purgerons tous deux une peine de cinq ans. Mais que se passe-t-il si Barry ne dit rien pendant que j'avoue ? Je bénéficie d'une carte « sortie de prison » et je ne purge aucune peine ! Et si je n'avoue pas et que, pour une raison ou une autre, mon partenaire fait de même, nous purgerons tous les deux une peine d'un an. Donc, puisque Barry fait probablement le même raisonnement que moi, la meilleure chose à faire est d'avouer, indépendamment de ce qu'il fera. Dans le meilleur des cas, je sors demain, dans le pire des cas, nous faisons cinq ans"
Ce raisonnement m'a toujours profondément dérangé car cela signifierait que la logique exclut la coopération. Coopérer dans ce jeu reviendrait à faire un choix irrationnel. Mais n'y a-t-il qu'un seul type de rationalité dans ce monde ?
Prenons ce jeu au sérieux
L'une des hypothèses de base de la théorie des jeux est que tous les joueurs sont des individus rationnels, ce qui signifie qu'ils essaieront de maximiser leurs gains - parfois même aux dépens des autres joueurs. Cela signifie qu'ils suivront probablement le même raisonnement, car il n'y a qu'une seule façon « rationnelle » de penser.
La solution donnée au dilemme des prisonniers semble assez simple : Steve n'a aucune idée de ce que Barry va faire, mais la théorie des jeux nous dit que « ce à quoi je pense, il y pense probablement aussi, parce que nous sommes des gens rationnels ». Donc, s'il suit cette logique, Steve réalise que la chose la plus avantageuse pour lui est d'avouer et il le fait, en espérant que Barry ne le fera pas. En effet, si Barry n'avoue pas, Steve n'ira peut-être pas en prison, mais si Barry le dénonce alors qu'il a décidé d'être loyal, il passera plus de temps en prison. Les joueurs établissent une sorte de liste des avantages et des inconvénients, et attribuent un certain nombre de points à chaque choix. Considérons le jeu de manière plus réaliste.
Première option : de nombreuses personnes considèrent le dilemme du prisonnier comme un jeu non coopératif, mais ce que nous avons vu pourrait être considéré comme un jeu de coopération. La non-coopération entre les joueurs (Steve et Barry) se traduit par une coopération avec l'autorité qui « organise » le jeu (la police). Si nos deux cobayes voient le jeu de cette manière, le choix ne sera pas entre « non-coopération » et « coopération » mais entre « coopérer avec le complice » et « coopérer avec la police ». Si Steve et Barry ont, pour une raison ou une autre, une aversion pour la police et le système judiciaire, ils pourraient être opposés à l'idée de coopérer avec la police et ils garderont ces sentiments personnels à l'esprit lorsqu'ils feront leur choix et établiront leur liste de préférences, et vice versa. Dans cet exemple, la chose la plus rationnelle à faire est influencée par les sentiments du joueur à l'égard de la police/de son partenaire.
Deuxième option : un autre problème de la théorie des jeux (et de ce jeu en particulier) est qu'elle vous demande de prendre une décision sur la base de ce que la police vous dit, mais les joueurs ne sont pas obligés de se baser uniquement sur ces informations. Ils peuvent ajouter d'autres éléments à cette liste d'avantages et d'inconvénients, des informations qu'ils possèdent et que la police ne possède pas. Imaginons que Steve et Barry fassent partie d'un gang ou de la mafia. Dans ce cas, dénoncer leur partenaire (non-coopération) les condamnerait à leur sortie de prison - voire en prison également, si d'autres membres du gang ou de l'organisation criminelle s'y trouvent. La non-coopération pourrait au pire leur coûter la vie, au mieux quelques doigts, les laisser dans une situation économique plus difficile et avec une réputation détruite - ce qui est fondamental dans les environnements sociaux caractérisés par des niveaux élevés de criminalité organisée. Si Steve et Barry décident de voir le problème sous cet angle, le scénario change : s'ils ne coopèrent pas l'un avec l'autre, leur sécurité personnelle est menacée, alors que s'ils coopèrent, ils risquent un peu de prison, mais ils conservent leur réputation et leur vie. Si Steve coopère (refuse d'avouer) alors que Barry le trahit (avoue), Steve ira en prison mais sa réputation et sa sécurité ne seront pas menacées, ce qui n'est pas le cas de Barry. Dans cet exemple, dire que la chose la plus rationnelle à faire est de ne pas coopérer semble insensé, même si cela semblait parfaitement logique auparavant.
La troisième option : avouer (non-coopération) peut sembler une idée très rationnelle aujourd'hui, depuis la salle d'interrogatoire. Mais tout comme personne n'aimait le gamin qui disait au professeur que la classe n'avait pas fait ses devoirs, personne n'aime les personnes qui avouent juste pour se sauver aux dépens de leurs partenaires. Cela pourrait être particulièrement vrai en prison. Si Steve et Barry avouent et se trahissent l'un l'autre, en choisissant « l'option la plus rationnelle », cela pourrait rendre leur vie en prison très, très dangereuse, car ils acquerraient une mauvaise réputation. S'ils choisissent d'avouer, ils passeront moins de temps en prison que si un seul d'entre eux avait avoué, mais s'ils passent ces cinq années à être brutalisés par d'autres détenus, ils pourraient se rendre compte trop tard qu'ils ont en fait choisi l'option la moins « rationnelle ». Il y avait un coût caché qu'ils ignoraient. Dans cet exemple, avouer semble rationnel jusqu'à ce que les joueurs en apprennent davantage sur les implications de leur choix. C'est souvent le cas. L'utilisation de l'amiante dans la construction semblait être une bonne idée... jusqu'à ce qu'elle ne le soit plus, parce que les gens attrapaient le cancer. Brûler des combustibles fossiles semblait être une bonne idée dans les années 1800, jusqu'à ce que nous apprenions que ce n'était pas le cas. Jeter des emballages en plastique hors des navettes spatiales ou laisser des satellites morts en orbite semblait inoffensif, jusqu'à ce que nous apprenions que ce n'était pas le cas.
Quatrième option : Steve et Barry refusent de jouer le jeu. Ils écoutent le discours du policier et se concentrent sur la petite, mais très importante, partie de leur discours qui dit que la police n'a pas assez de preuves pour leur faire purger une peine de plus d'un an. Il existe un « meilleur scénario » dans lequel Steve et Barry s'en sortent en purgeant chacun une peine d'un an, mais comme les universitaires estiment que la rationalité consiste à poursuivre son propre intérêt en ignorant les autres, ils pensent que cette option existe, mais qu'elle est négligée dans la recherche de la maximisation des gains individuels - et c'est une tragédie. Mais la rationalité ne signifie pas nécessairement cela et, en tout état de cause, le problème réside dans la perception du jeu par les joueurs. Le dilemme du prisonnier est une façon de cadrer la situation, une astuce utilisée par la police pour augmenter ses chances de faire avouer les criminels. S'ils n'avaient jamais posé la question, les criminels auraient été condamnés à un an de prison chacun. Et ils le peuvent encore, il suffit qu'ils refusent de voir la situation telle que la police la leur présente - ils peuvent refuser de jouer le jeu. Dans le dilemme du prisonnier, nous pensons que les joueurs sont uniquement les criminels, mais la personne qui encadre le problème, en l'occurrence la police, joue également.
L'un des grands problèmes de la stratégie et de la théorie des jeux repose sur l'hypothèse que l'adversaire voit la situation exactement comme nous. Si les joueurs perçoivent un problème comme un « scénario de dilemme du prisonnier », ils percevront la situation comme un jeu de non-coopération où la chose la plus rationnelle à faire est de poursuivre leur meilleur intérêt tout en ignorant complètement celui de l'autre. Mais que se passerait-il si le joueur numéro deux percevait plutôt la situation comme un jeu de coopération, ou pire, si le joueur numéro deux ne jouait pas du tout ?
Le dilemme du prisonnier : édition multijoueurs
Si vous êtes familier des discours sur le changement climatique et la tendance à exploiter les biens communs, vous avez entendu parler du problème des « pâturages communs », qui débouche généralement sur le thème de la « tragédie des biens communs » [3]. Pour voir le résultat de ce jeu, il suffit de regarder autour de soi dans le monde réel, mais nous allons le résumer ici.

Nous avons un village avec un pâturage commun où les gens peuvent laisser paître leurs vaches. Il y a dix fermiers qui possèdent chacun une vache, et ils laissent tous leurs vaches paître dans le même pâturage. Bientôt, un ou deux de ces fermiers peuvent se permettre d'acheter une autre vache, puis d'autres fermiers commencent à pouvoir acheter d'autres vaches. À ce stade, toutes les vaches commencent à maigrir et à souffrir de la faim parce qu'il n'y a pas assez d'herbe pour tout le monde. Lorsque le dixième fermier achète une vache, toutes les autres sont mortes de faim. Selon la théorie des jeux, tous les agriculteurs se comportent de manière rationnelle, parce que c'est plus avantageux pour eux d'un point de vue économique. Les spécialistes définissent ce phénomène comme la « tragédie des biens communs ».
Mais peut-être que, comme dans le cas de nos amis Steve et Barry, le « meilleur scénario » aurait pu être facilement atteint si seulement les agriculteurs avaient envisagé la question d'une manière différente. Il est clair que si tous les agriculteurs suivent leurs intérêts égoïstes en ignorant la réalité de la situation (les ressources sont limitées), tout le monde finira par mourir et mourir de faim, tout comme nos criminels finiront tous deux en prison. Mais acheter une autre vache ne semble être la chose la plus rationnelle que si l'on grandit et est socialisé dans une société capitaliste et hautement individualiste : pour la plupart des populations indigènes, au contraire, cela semble être une chose très stupide à faire.
Pour certaines sociétés, même l'hypothèse principale de ce jeu semble irrationnelle. Pourquoi acheter une autre vache, alors qu'une seule suffit à subvenir à vos besoins ? Nous avons tendance à oublier que la surproduction est l'une des caractéristiques des sociétés sédentaires et des économies capitalistes, mais ces règles ne s'appliquent pas aux tribus nomades ou à d'autres modèles économiques.
Quel est le meilleur raisonnement ?
L'un des principaux problèmes de la théorie des jeux en général et du dilemme du prisonnier en particulier, est que les personnes qui l'ont théorisé supposent que les joueurs, étant des individus « rationnels », feront le même type de raisonnement et parviendront donc à la même conclusion. Ce qu'ils n'ont pas pris en compte, c'est que les deux joueurs peuvent être des personnes tout à fait saines d'esprit, disposant d'un contrôle total de leurs capacités mentales, et qu'ils peuvent néanmoins suivre un raisonnement différent qui les conduira à deux choix différents. Ils n'ont pas tenu compte du fait que, tout comme il y a différentes personnes dans le monde, il y a différents types de rationalité.
Le meilleur résultat de chaque jeu, qu'il s'agisse du dilemme du prisonnier, du jeu de la poule, de la colombe et du faucon ou du problème des pâturages communs, dépend des priorités du joueur, de ses valeurs et d'autres facteurs trop nombreux pour figurer dans un graphique, tels que la classe socio-économique, la profession, l'éducation, la religion, l'instruction, etc. Il peut également dépendre des conséquences que son choix aura pour la communauté dans son ensemble. Choisir de maximiser son intérêt au détriment des autres et, potentiellement, de la communauté, n'est pas le seul choix rationnel à faire, mais l'un des nombreux. Le meilleur résultat pour un joueur dépend de son type de rationalité.
C'est pourquoi il est impératif de changer de perspective. Lorsque nous examinons la théorie des jeux, en particulier les jeux non coopératifs tels que le dilemme du prisonnier et le problème du pâturage commun, nous devons nous poser la question suivante : « Sommes-nous condamnés à des jeux non coopératifs, comme le dilemme du prisonnier et le problème du pâturage commun ? Sommes-nous condamnés à la non-coopération, parce qu'il s'agit d'une chose intrinsèquement « irrationnelle » puisqu'elle va à l'encontre de nos intérêts immédiats, ou avons-nous tout le temps regardé le problème de travers ?
Rebecca Franzin
[1] A similar example can be found in László Mérő, “Moral Calculations”
[2] László Mérő, “Moral Calculations”
[3] “The tragedy of the commons”, Garret Hardin, 1968