A váratlan bajnok

Gábor Bíró 2025. október 16.
9 perc olvasási idő

A tudomány világában a legmélyebb felismerések néha a legegyszerűbb kísérletekből származnak. Az 1980-as évek elején, a személyi számítógépek korszakának hajnalán egy Robert Axelrod nevű politológus létrehozott egy digitális arénát, hogy számítógépes programokat – mindegyiket saját „személyiséggel” – eresszen egymásnak egy klasszikus stratégiai játékban. Az eredmények nem csupán meglepőek, hanem úttörőek is voltak, és egy erőteljes új lencsét kínáltak, amelyen keresztül magának az együttműködés evolúciójának a vizsgálata is lehetővé vált.

A váratlan bajnok

A kísérlet a játékelmélet egyik leghíresebb rejtvényére, a fogolydilemmára épült.

Történelmileg ezeket a versenyeket Robert Axelrod szervezte és elemezte, aki koordinálta a beadványokat és szintetizálta az eredményeket nagy hatású munkájában. A Szemet szemért néven ismert stratégiát – amelyet gyakran Anatol Rapoporthoz kötnek korai javaslattevőként – Axelrod elemzései tették híressé. A kísérlet és annak következményeinek kanonikus bemutatásáért lásd Axelrod munkáját (Axelrod & Hamilton, 1981; Axelrod, 1984). Későbbi elméleti és empirikus tanulmányok (pl. Nowak & Sigmund, 1993) elmélyítették a tudásunkat, megmutatva, hogy mikor és miért teljesíthetnek jobban más kölcsönösségi szabályok (mint a Nyersz-maradsz, veszítesz-váltasz vagy a nagylelkűbb változatok) az egyszerű Szemet szemért stratégiánál különböző körülmények között.

A színpad előkészítése: A bizalom dilemmája

Valószínűleg ismerős a klasszikus felállás: két bűntársat letartóztatnak, és külön cellákban tartanak fogva, ahol nem tudnak kommunikálni. Az ügyész mindkettőjüknek külön-külön üzletet ajánl.

  • Ha elárulod a társadat (dezertálsz), és ő hallgat (együttműködik), te szabadulsz, ő pedig hosszú büntetést kap (pl. 10 évet).
  • Ha mindketten hallgattok (együttműködtök), mindketten rövid büntetést kaptok (pl. 1 évet).
  • Ha mindketten eláruljátok egymást (dezertáltok), mindketten közepes büntetést kaptok (pl. 5 évet).

Tisztán individualista, racionális szempontból mindig az árulás a legjobb lépés. Ha a társad együttműködik, te kapod a legjobb eredményt (szabadság). Ha a társad elárul, te elkerülöd a legrosszabb kimenetelt (a balek szerepét). A paradoxon az, hogy amikor mindkét játékos ezt a „racionális” logikát követi, mindketten rosszabbul járnak, mintha bíztak volna egymásban.

Axelrodot az érdekelte, mi történik, ha ez nem egy egyszeri találkozás. Az Iterált Fogolydilemmára (IFD) összpontosított, ahol ugyanaz a két játékos újra és újra szembekerül egymással. Hirtelen a hírnév és az emlékezet is számítani kezd. A „jövő árnyéka” mindent megváltoztat. Van esélye az együttműködésnek?

Az algoritmusok nagy versenye

A válasz megtalálásához Axelrod különböző területekről – közgazdaságtan, pszichológia, matematika és informatika – hívott meg akadémikusokat, hogy nyújtsanak be egy programot, amely az IFD-t játssza. Minden program egy stratégia volt, egy szabályrendszer, amely eldöntötte, hogy az adott körben együttműködjön vagy áruljon.

A beadványok a briliánsan összetettektől az alattomosan egyszerűekig terjedtek. Némelyik könyörtelenül agresszív volt, mindig árult. Mások tisztán altruisták voltak, mindig együttműködtek. Sokan rendkívül kifinomultak voltak, statisztikai elemzéseket használva próbálták megjósolni ellenfelük következő lépését. Ezeket a digitális „személyiségeket” egy körmérkőzéses versenybe nevezték. Minden program játszott minden más programmal (és saját maga egy másolatával, valamint egy véletlenszerű lépéseket tevő programmal) 200 körön keresztül. A cél nem az egyes meccsek „megnyerése” volt, hanem a legmagasabb összesített pontszám elérése a teljes versenyen.

A színpad készen állt a digitális titánok összecsapására. A várakozás az volt, hogy egy összetett, ravasz stratégia fog győzni.

Ami ezután történt, az figyelemre méltó volt.

A győztes: Mesterlecke az egyszerűségből

Amikor a digitális por leülepedett, a győztes az egyik legegyszerűbb benyújtott stratégia lett. A neve Szemet szemért volt, és Anatol Rapoport, egy matematikai pszichológus írta.

A Szemet szemért logikája szinte nevetségesen egyszerű volt:

  1. Az első lépésben működj együtt.
  2. Minden további lépésben tedd azt, amit az ellenfeled tett az előző lépésben.

Ennyi. Ha az ellenfél együttműködött, a Szemet szemért is együttműködött. Ha elárulta, a Szemet szemért azonnal visszaárulta. Egyszerű visszhang volt, egy digitális tükör. Nem táplált haragot a közvetlen utolsó lépésen túl, és soha nem próbálta túljárni az ellenfele eszén.

Hogyan győzhetett egy ilyen alapvető algoritmus a komplex prediktív modellekkel és machiavellista logikával tervezett programok felett? Axelrod eredményeinek elemzése feltárta a sikeres együttműködés kulcsfontosságú összetevőit, amelyeket a Szemet szemért tökéletesen megtestesített. Négy tulajdonságot azonosított, amelyekkel a magas pontszámot elérő stratégiák rendelkeztek:

  • Jóindulatú volt: Egy „jóindulatú” program soha nem az első, amelyik árul. Az együttműködéssel kezdve a Szemet szemért azonnal jelezte a közös munkára való hajlandóságot, megnyitva az utat a kölcsönösen előnyös kimenetelek előtt és elkerülve a felesleges konfliktusokat.
  • Megtorló (vagy provokálható) volt: A Szemet szemért nem volt egy papucs. Ha egy ellenfél elárulta, a következő lépésben azonnal visszavágott. Ez a gyors büntetés egyértelművé tette, hogy a kizsákmányolást nem tűri, elrettentve az agresszív stratégiákat attól, hogy kihasználják.
  • Megbocsátó volt: Ez vitathatatlanul a legfontosabb tulajdonsága. Miután egy árulást megtorolt, ha az ellenfél visszatért az együttműködéshez, a Szemet szemért azonnal „megbocsátott” neki, és a következő körben együttműködött. Nem tartott haragot. Ez a képesség a kölcsönös vádaskodás ciklusainak megtörésére létfontosságú volt a bizalom helyreállításához és a magas pontszámot hozó együttműködési ritmushoz való visszatéréshez.
  • Világos volt: Stratégiája egyszerű és átlátható volt. Az ellenfelek gyorsan megtanulták a szabályait. Megértették, hogy az együttműködést jutalmazni, az árulást pedig büntetni fogják. Ez a világosság és kiszámíthatóság tette megbízható partnerré az együttműködésben.

Egy fontos figyelmeztetés a zaj: a valós interakciókban történnek hibák – egy együttműködő lépést tévesen árulásként regisztrálhatnak, vagy egy szándékolt cselekvés meghiúsulhat. Ilyen zajos környezetben a tiszta Szemet szemért csapdába eshet hosszú megtorlási ciklusokban. A későbbi munkák és versenyek ezért a robusztusságra tervezett változatokat vizsgálták, mint például a Szemet két szemért (amely csak az ellenfél két egymást követő árulása után árul), a Nagyvonalú Szemet szemért (amely időnként megbocsát egy árulást), és a Nyersz-maradsz, veszítesz-váltasz (Pavlov), amelyek mindegyike felülmúlhatja a sima Szemet szemért stratégiát különböző hibaarányok és populációdinamikák mellett. Ennek az árnyalatnak az említése megmagyarázza, miért térnek el néha az együttműködés dinamikái a laboratóriumban és a való világban.

Formálisan az együttműködés fenntartása az ismételt fogolydilemma helyzetekben két összetevőn múlik: a kifizetések sorrendjén és a jövőbeli interakció értékén. A kifizetéseknek meg kell felelniük a K > J > B > B' (Kísértés > Jutalmazás > Büntetés > Balek) feltételnek, és a játékosoknak kellően értékelniük kell a jövőbeli kifizetéseket (magas folytatási valószínűség vagy alacsony diszkontálás). Amikor ezek a feltételek teljesülnek, és az interakciók ésszerű bizonyossággal ismétlődnek, a kölcsönös stratégiák önfenntartóvá válhatnak – ez egy híd Axelrod empirikus versenyei és az ismételt játékelmélet elméleti eredményei között.

Kontextus – A digitális kódtól az I. világháború lövészárkaiig

Talán a legmegdöbbentőbb és legmegindítóbb valós párhuzamot Axelrod eredményeivel egy olyan helyen találhatjuk, ahol a legkevésbé számítanánk az együttműködésre: az I. világháború lövészárkaiban. A nyugati fronton a hosszú patthelyzetek idején az egymással szemben álló brit és német csapatok között spontán informális fegyverszüneti rendszer alakult ki. Ez a jelenség az „Élni és élni hagyni” rendszerként vált ismertté.

Pontosan úgy működött, mint egy organikus Szemet szemért játszma:

  • Légy jóindulatú (Ne lőj elsőként): Egy egység kiszámítható, nem halálos rutinokkal jelezte békés szándékait. Például minden nap ugyanabban az időben hajtottak végre tüzérségi támadást, a lövészárok egy üres részére célozva. Ez egy „együttműködő” lépés volt.
  • Torold meg: Ha az egyik oldal hirtelen egy halálos, provokálatlan rajtaütést indított (egy „árulást”), a másik oldal azonnal egy heves ellentámadással vágott vissza, hogy megmutassa, az agressziót nem tűrik.
  • Légy megbocsátó: Kulcsfontosságú, hogy a megtorlás után a megtámadott oldal gyakran visszatért az előző „együttműködő” rutinhoz, jelezve a fegyverszünet helyreállítására való hajlandóságot. Nem tartottak örökké haragot.

Ez a kimondatlan együttműködési rendszer a főparancsnokság parancsai nélkül alakult ki (sőt, a tábornokok aktívan próbálták felszámolni). Mindkét oldalon a katonák saját érdekeiből fakadt, akik felismerték, hogy egy ismétlődő játszmában vesznek részt. Tudták, hogy holnap és holnapután is ugyanazokkal az ellenfelekkel fognak szembenézni. A „jövő árnyéka” hosszú volt, és rájöttek, hogy a kölcsönös visszafogottság sokkal jobb a túlélésük szempontjából, mint az állandó, féktelen agresszió.

Ez az erőteljes történelmi példa megmutatja, hogy az Axelrod számítógépes versenyén felfedezett elvek nem csupán elvont elméletek. Az emberi túlélési és együttműködési stratégia alapvető részei, még a legellenségesebb elképzelhető környezetben is.

A stratégiák névsora – Pillantás a kulcsszereplőkre

Hogy a versenyt konkrétabbá tegyük, érdemes megismerkedni néhány digitális „személyiséggel”, amelyek versenyeztek. Bár több tucat stratégiát nyújtottak be, gyakran különböző archetípusokba sorolhatók. Íme egy áttekintés a legjelentősebb versenyzőkről és teljesítményükről.

(Megjegyzés: A „Helyezés” általánosítás. A valóságban a teljesítmény a versenyben részt vevő többi stratégia konkrét összetételétől függött, de ez tükrözi az általános eredményeket.)

Helyezés Stratégia neve Rövid leírás Kulcsjellemző(k)
1 Szemet szemért Az első lépésben együttműködik, majd lemásolja az ellenfél előző lépését. Jóindulatú, Megtorló, Megbocsátó, Világos
Élvonal Tesztelő Az első lépésben árul, hogy „felmérje a terepet”. Ha az ellenfél visszavág, bocsánatot kér, és Szemet szemértet játszik. Ha nem, akkor tovább árul. Puhatolózó, de végső soron együttműködő a nem naiv játékosokkal.
Élvonal Friedman (Végleges Megtorlás) Addig működik együtt, amíg az ellenfél egyszer is el nem árulja, ami után örökre árulni fog. Jóindulatú, Szigorúan Megtorló, Nem Megbocsátó
Élvonal Szemet két szemért Egy megbocsátóbb változat. Csak akkor árul, ha az ellenfél kétszer egymás után árult. Nagyon Jóindulatú, Megbocsátó, Ellenáll a visszhang-hatásoknak
Középmezőny Joss A Szemet szemért egy „alattomos” változata. Többnyire utánozza az ellenfelet, de 10% eséllyel árul az együttműködés helyett. Többnyire Jóindulatú, Megtorló, de „Áruló”
Középmezőny Downing Azzal kezdi, hogy megpróbálja modellezni az ellenfelét. Ha az ellenfél fogékonynak tűnik és van „lelkiismerete”, együttműködik. Ha az ellenfél véletlenszerűnek vagy érzéketlennek tűnik, árul, hogy megvédje magát. Alkalmazkodó, Számító, nem eredendően „Jóindulatú”
Alsóbb kategória Mindig Árul (ALL D) Mindig az árulást választja, bármi történjék is. Rosszindulatú, Agresszív
Alsóbb kategória Véletlenszerű 50/50 eséllyel működik együtt vagy árul. Kiszámíthatatlan, Megbízhatatlan
Legalsó kategória Mindig Együttműködik (ALL C) Mindig az együttműködést választja, függetlenül attól, hányszor árulják el. Jóindulatú, de Naiv és Kizsákmányolható
Legalsó kategória Nydegger Egy bonyolultabb, szabályalapú stratégia, amely a Szemet szemért egy megbocsátóbb változata próbált lenni, de logikája hibás volt és kihasználható, ami gyenge teljesítményhez vezetett. Jószándékú, de Zavaros és Kizsákmányolható

Ez a táblázat egyértelműen mutatja, hogy a legsikeresebb stratégiák „jóindulatúak” voltak (soha nem ők árultak először), de nem voltak papucsok. A tisztán agresszív (ALL D) és a tisztán naiv (ALL C) stratégiák nagyon rosszul teljesítettek, mivel hosszú távon egymást zsákmányolták ki, kölcsönös kárukra.

A második forduló és a maradandó örökség

Gondolván, hogy az eredmények talán csak a véletlen művei, Axelrod egy második, még nagyobb versenyt rendezett. Ezúttal a résztvevők ismerték az első forduló eredményét. Tisztában voltak a Szemet szemért sikerével, és kifejezetten ellene tervezhettek stratégiákat. Hatvankét nevezés érkezett a világ minden tájáról.

És a Szemet szemért ismét győzött.

Robusztussága beigazolódott. A kezdeti kedvesség, a gyors, de arányos megtorlás, az azonnali megbocsátás és a világosság egyszerű elvei nem csupán egy nyerő formulát jelentettek; úgy tűnt, hogy az együttműködés evolúciójának alapvető receptjei.

Axelrod munkája, amely 1984-es, Az együttműködés evolúciója című alapművében jelent meg, messze a játékelméleten túl is mély hatást gyakorolt. Biológusok használták az állatpopulációkban megfigyelhető reciprok altruizmus modellezésére. Közgazdászok alkalmazták az üzleti kapcsolatokban rejlő bizalom megértésére. Politológusok látták visszatükröződését a nemzetközi diplomáciában és a hidegháború alatti fegyverzetkorlátozási egyezményekben.

Ma ezek az egyszerű kölcsönösségi elvek a társadalomtudományokon túli munkát is inspirálják: a többágenses rendszerek, a decentralizált protokollok és a blokklánc ösztönző mechanizmusainak tervezői, valamint az interakcióban lévő mesterséges intelligenciák csapatai mind ugyanazokkal a kompromisszumokkal szembesülnek a kizsákmányolás és az együttműködés között. A robusztus kölcsönösségi szabályok – amelyek tolerálják a zajt és a populációk közötti skálázódást – továbbra is központi szerepet játszanak az együttműködő viselkedés megtervezésében mind az emberi, mind a mesterséges rendszerekben.

A verseny egy erőteljes leckét tanított nekünk: az együttműködéshez nincs szükség központi hatalomra vagy önzetlen altruizmusra. Spontán módon is kialakulhat önérdekű egyének között, ha tudják, hogy a jövőben újra találkozni fognak. Egy olyan világban, amely gyakran összetettnek és cinikusnak tűnik, a Szemet szemért diadala reményteli és maradandó emlékeztető arra, hogy a legjobb stratégia gyakran az, ha kedvesek vagyunk, de nem naivak; ha megbocsátóak vagyunk, de nem feledékenyek; és mindenekelőtt, ha világosak és következetesek vagyunk a tetteinkben.

Gábor Bíró 2025. október 16.