Science et affaires

Au-delà du donnant-donnant : les moteurs cachés de la coopération humaine

Gábor Bíró 25 octobre 2025
7 min de lecture

Quelle est la force invisible qui unit les sociétés complexes ? Pourquoi aidons-nous un inconnu, faisons-nous confiance aux avis d'un vendeur en ligne ou respectons-nous les règles même lorsque personne ne nous regarde ? Pendant longtemps, le simple principe de réciprocité « œil pour œil » a semblé être la réponse logique. Mais ce modèle est fragile : dans le monde réel, une seule incompréhension suffit à briser la confiance. Cependant, les avancées scientifiques des dernières décennies ont creusé bien plus loin, révélant les mécanismes cachés de la coopération.

Au-delà du donnant-donnant : les moteurs cachés de la coopération humaine

Cet article explore les stratégies sophistiquées capables de gérer les erreurs, la manière dont la réputation devient notre plus précieuse monnaie sociale, et pourquoi nous sommes prêts à défendre les normes communautaires, même si cela nous coûte personnellement. Il est temps de dépasser les théories classiques pour découvrir les mécanismes surprenants et fascinants de la coopération humaine.

Le tournoi d'Axelrod et la stratégie donnant-donnant

Peu d'expériences de pensée dans l'histoire des sciences sociales ont eu un impact aussi profond que le dilemme du prisonnier. Et ce sont les célèbres tournois informatiques de Robert Axelrod au début des années 1980 qui ont définitivement ancré la théorie des jeux dans la conscience collective. Le but de ces tournois était de trouver la meilleure stratégie dans un dilemme du prisonnier itéré, où les participants devaient choisir entre la coopération et la défection à de multiples reprises.

Le vainqueur fut un code de deux lignes d'une simplicité surprenante : « Donnant-donnant » (Tit-for-Tat). Soumise par Anatol Rapoport, la stratégie suivait deux règles simples :

  1. Commencer par coopérer.
  2. Ensuite, faire ce que l'adversaire a fait au tour précédent.

Son succès reposait sur ses caractéristiques fondamentales : elle était gentille (ne faisant jamais défection en premier), vengeresse (punissant immédiatement la défection), indulgente (revenant à la coopération si l'adversaire le faisait aussi) et claire (sa stratégie était facile à comprendre pour les autres).

Les travaux d'Axelrod ont fondamentalement changé notre vision de l'évolution de la coopération à partir de principes égoïstes. Mais la stratégie donnant-donnant est-elle vraiment le fin mot de l'histoire ? Une seule règle simple peut-elle expliquer toutes les formes complexes de coopération que nous observons dans la nature et les sociétés humaines ? La science, par sa nature même, ne cesse jamais de poser des questions. La stratégie donnant-donnant n'était pas la réponse finale ; c'était un point de départ fascinant qui a déclenché une nouvelle vague de recherches.

Dans cet article, j'explorerai où ce voyage nous a menés depuis la découverte de la stratégie donnant-donnant et quels nouveaux mécanismes, plus sophistiqués, les chercheurs ont mis au jour dans le monde complexe de la coopération.

Les failles de l'armure : pourquoi la stratégie parfaite n'est pas parfaite

Dans la simulation informatique idéalisée et sans erreur d'Axelrod, la stratégie donnant-donnant s'est avérée imbattable. Mais la réalité est rarement aussi nette. La communication est toujours sujette au « bruit » : une intention mal comprise, un problème technique, un signal mal interprété. Que se passe-t-il lorsqu'une telle erreur s'immisce dans une interaction entre deux joueurs suivant une stratégie donnant-donnant ?

Imaginez qu'Anna et Bob jouent tous les deux selon la stratégie donnant-donnant et coopèrent pacifiquement. Cependant, lors d'un tour, Anna fait accidentellement défection (peut-être a-t-elle appuyé sur le mauvais bouton, ou le pigeon voyageur a livré le mauvais message). Au tour suivant, Bob, suivant les règles, riposte et fait défection. En réponse, Anna fait également défection, car c'est ce que Bob a fait au tour précédent. Bob fait alors à nouveau défection, et ainsi de suite. Une seule erreur mineure les a enfermés dans un cycle sans fin de représailles mutuelles — une « spirale de la mort » dont il n'y a pas d'échappatoire.

Cette vulnérabilité au bruit est la plus grande faiblesse de la stratégie donnant-donnant. Dans un monde où les malentendus sont courants, une stratégie aussi implacablement vengeresse pourrait ne pas être optimale à long terme.

Un nouveau concurrent entre en scène : Win-Stay, Lose-Shift

La communauté scientifique a dû attendre plus d'une décennie pour une alternative sérieuse. En 1993, Martin Nowak et Karl Sigmund ont publié un article dans Nature présentant une nouvelle stratégie : « Win-Stay, Lose-Shift » (WSLS), également connue sous le nom de stratégie Pavlov.

La logique de WSLS est remarquablement simple et psychologiquement intuitive :

  • Si mon dernier coup a été un succès (j'ai reçu un gain élevé), je le répète. (Win-Stay / Gagner-Rester)
  • Si mon dernier coup a été un échec (j'ai reçu un gain faible), je change de stratégie. (Lose-Shift / Perdre-Changer)

Revenons à notre exemple : Anna et Bob jouent maintenant avec la stratégie WSLS. Ils coopèrent, recevant tous deux un gain élevé (une « victoire »), donc ils continuent tous deux à coopérer. Puis, Anna fait accidentellement défection. Dans ce tour, Anna obtient le gain le plus élevé possible (le gain de la « tentation »), tandis que Bob obtient le pire (le gain du « dupe »).

Que se passe-t-il ensuite ?

  1. Tour suivant : Anna, ayant « gagné », répète son coup : elle fait défection. Bob, ayant « perdu », change de stratégie : il passe de la coopération à la défection. Maintenant, les deux joueurs font défection.
  2. Tour d'après : Comme ils ont tous les deux fait défection, ils reçoivent tous deux un faible gain (la « punition »). C'est une « défaite » pour tous les deux. Par conséquent, ils changent tous deux de stratégie : ils passent de la défection à la coopération.

Et voilà, l'erreur est corrigée ! En seulement deux tours, le système est revenu à l'état stable de coopération mutuelle. Cette capacité à corriger les erreurs est la plus grande force de la stratégie WSLS par rapport à la stratégie donnant-donnant.

De plus, WSLS est meilleure sur un autre aspect clé : elle exploite efficacement les stratégies « naïves » et inconditionnellement coopératives. Si elle rencontre un joueur qui coopère toujours, WSLS fera défection après le premier tour, recevra un gain élevé et continuera à faire défection, exploitant ainsi le partenaire trop généreux. Cela peut sembler cruel, mais d'un point de vue évolutif, c'est crucial. Cela empêche la population d'être envahie par des « dupes », ce qui ouvrirait la voie à la prospérité de stratégies purement exploiteuses.

Bien sûr, WSLS n'est pas invulnérable. Dans certaines conditions, par exemple lorsque deux joueurs WSLS commencent désynchronisés, ils peuvent se retrouver bloqués dans un étrange cycle d'exploitation alternée. Le point essentiel à retenir, cependant, est qu'il n'existe pas de stratégie unique optimale pour toutes les situations. L'environnement — comme la probabilité d'erreurs ou le comportement des autres dans la population — est le facteur décisif pour déterminer quelle stratégie s'avère la plus fructueuse.

Mécanismes plus profonds de la coopération : au-delà de la réciprocité directe

Le monde d'Axelrod était construit sur la réciprocité directe : « Je vous rends service si vous m'en rendez un. » Mais les sociétés humaines sont bien plus complexes. Nous aidons souvent des personnes que nous ne reverrons jamais et faisons confiance à des systèmes où les interactions individuelles sont presque invisibles. Martin Nowak, un chercheur de premier plan en dynamique évolutive, a identifié cinq mécanismes fondamentaux qui animent l'évolution de la coopération. Explorons-en trois qui ont révolutionné notre façon de penser sur le sujet.

Le principe : « Je vous aide, et quelqu'un d'autre m'aidera. »

Ce mécanisme est construit autour de la réputation. Nos interactions ne sont pas isolées ; les membres d'une communauté observent en permanence. Nous aidons ceux qui ont une bonne réputation (c'est-à-dire que nous savons qu'ils sont eux-mêmes serviables) et nous évitons ceux qui se sont montrés égoïstes. De cette manière, la réputation devient une forme de monnaie sociale.

La réciprocité indirecte explique comment la coopération peut perdurer dans de grands groupes anonymes où les chances de réciprocité directe sont faibles. Pensez aux systèmes de notation en ligne (la fiabilité d'un vendeur sur un site de commerce électronique) ou simplement aux commérages. Notre réputation nous précède, nous motivant à être coopératifs même en l'absence de bénéfice direct et immédiat. Ce mécanisme est essentiel pour comprendre la moralité humaine et la formation de sociétés à grande échelle.

Le principe : Les coopérateurs peuvent se protéger en formant des groupes (clusters).

Dans le modèle original d'Axelrod, tout le monde interagissait avec tout le monde avec une probabilité égale. En réalité, nos relations sont structurées : nous avons de la famille, des amis et des collègues. Nous ne vivons pas dans une soupe homogène mais dans des réseaux sociaux.

Dans une étude révolutionnaire, Martin Nowak et Robert May ont montré que cette structure change radicalement les règles du jeu. Si les individus n'interagissent qu'avec leurs voisins immédiats, les coopérateurs peuvent former des « clusters » stables. À l'intérieur d'un tel groupe, les coopérateurs profitent des avantages de la coopération mutuelle. Bien qu'ils soient vulnérables aux défectionnaires en bordure du groupe, ces derniers se retrouvent rapidement entourés d'autres défectionnaires, et leur tricherie mutuelle mène à de piètres résultats. Ainsi, des îlots de coopération peuvent survivre et même s'étendre dans un océan de défection. La leçon : vos relations comptent.

Le principe : La coopération est maintenue lorsque nous punissons ceux qui enfreignent les règles, même si cela nous coûte.

Dans tout grand groupe, il y a toujours le « problème du passager clandestin » : la tentation pour quelqu'un de profiter des avantages d'un effort collectif sans y contribuer. Comment empêcher cela ? Les économistes Ernst Fehr et Simon Gächter ont démontré le pouvoir de la punition altruiste à travers une série d'expériences.

Dans leurs études, les gens avaient la possibilité de dépenser leur propre argent pour punir ceux qui ne contribuaient pas à un bien public. Étonnamment, les participants étaient prêts à subir une perte personnelle pour donner une leçon aux passagers clandestins, même lorsqu'ils n'en tiraient aucun bénéfice direct. Cette volonté de punir est une force puissante pour maintenir la coopération au niveau du groupe. Ce mécanisme sous-tend nos normes sociales, nos systèmes juridiques et notre sens de la justice : nous sommes prêts à sacrifier nos propres ressources pour maintenir l'ordre.

Conclusion : Le riche tableau de la coopération

Robert Axelrod et la stratégie donnant-donnant ont fourni une réponse simple et élégante à une question profonde : comment la coopération peut-elle émerger parmi des individus égoïstes ? Cependant, des décennies de recherche depuis lors ont révélé une image beaucoup plus riche et complexe.

Nous avons vu que la stratégie donnant-donnant n'est pas infaillible et que dans notre monde sujet aux erreurs, une stratégie comme Win-Stay, Lose-Shift peut être bien plus résiliente. Mais plus important encore, nous avons appris que la coopération ne repose pas uniquement sur des échanges directs entre deux individus. Elle est soutenue par le pouvoir de la réputation (réciprocité indirecte), supportée par la structure de nos liens sociaux (réciprocité de réseau) et renforcée par notre attachement aux normes et à la punition.

Ces modèles ne sont pas que des jeux mathématiques abstraits. Ils nous donnent les outils pour comprendre l'un de nos traits humains les plus profonds : notre extraordinaire capacité à coopérer. Ils nous aident à comprendre pourquoi les marchés fonctionnent, comment les systèmes moraux émergent et ce qui fait de nous, les humains, l'espèce sociale la plus performante de la planète. Le voyage d'Axelrod à nos jours montre que la résolution du mystère de la coopération est une aventure scientifique passionnante et en constante expansion.