DeepMind AI modellek ezüstöt nyertek a matematika olimpián
A Google DeepMind AI rendszerei jelentős mérföldkövet értek el, amikor ezüstérem szintű teljesítményt nyújtottak a 2024-es Nemzetközi Matematikai Olimpián (IMO). A vállalat specializált modelljei, az AlphaProof és az AlphaGeometry 2, sikeresen megoldottak négyet a hat problémából a rangos versenyen, ezzel bemutatva az AI növekvő képességeit a komplex matematikai feladatok megoldásában.
AlphaProof és AlphaGeometry 2
Két specializált AI rendszert fejlesztett a Google DeepMind a komplex matematikai problémák megoldására. Az AlphaProof egy előre betanított nyelvi modellt kombinál az AlphaZero megerősítéses tanulási algoritmussal, így képes algebrai és számelméleti problémák megoldására és bizonyítására. Az AlphaGeometry 2, elődjének továbbfejlesztett változata, a geometriai problémákra összpontosít, és egy 100 millió szintetikus példából álló hatalmas adathalmazon lett betanítva. Ez az innovatív adatgenerálási megközelítés segített leküzdeni az ember által írt tanulási adatok hiányát, ami gyakori akadály az AI fejlesztésében a matematikai érvelési feladatok terén.
Az AlphaProof és az AlphaGeometry 2 képzési módszertanai
Az AlphaProof és az AlphaGeometry 2 innovatív képzési módszereket alkalmaznak, hogy elérjék lenyűgöző matematikai érvelési képességeiket. Az AlphaProof önálló tanulási megközelítést alkalmaz, több millió problémát megoldva különböző nehézségi szinteken és matematikai témákban több héten keresztül. Megoldási jelölteket generál és keres bizonyítási lépéseket a Lean formális nyelvben, minden igazolt bizonyítással megerősítve nyelvi modelljét. Az AlphaGeometry 2 tovább épít erre, integrálva egy Gemini nyelvi modellt, amelyet egy nagyobb, 100 millió szintetikus példát tartalmazó adathalmazon képeztek ki. A természetes és formális nyelvek közötti szakadék áthidalása érdekében a kutatók egy Gemini modellt finomhangoltak arra, hogy a természetes nyelvű problémakijelentéseket formális matematikai nyelvre fordítsák, létrehozva egy hatalmas formális problémák könyvtárát. Ez a megközelítés lehetővé tette a rendszerek számára, hogy széles körű matematikai kihívásokkal nézzenek szembe.
Teljesítmény a 2024-es IMO-n
A 2024-es Nemzetközi Matematikai Olimpián az AlphaProof sikeresen megoldott két algebrai és egy számelméleti problémát, míg az AlphaGeometry 2 egy geometriai problémát oldott meg. A kombinált megoldások összesen 28 pontot értek el a lehetséges 42-ből, ami egyenértékű egy ezüstéremmel, és csak egy ponttal maradtak el az aranyérem küszöbétől. Különösen figyelemre méltó, hogy az AlphaGeometry 2 mindössze 19 másodperc alatt oldotta meg a saját problémáját, ezzel bemutatva lenyűgöző hatékonyságát. A problémákat manuálisan fordították formális matematikai nyelvre az AI rendszerek számára, a megoldások pedig néhány perctől három napig terjedtek.
Az eredmény jelentősége
Ez a mérföldkő jelentős előrelépést képvisel az AI azon képességében, hogy komplex matematikai érvelési feladatokat kezeljen, amelyek korábban kihívást jelentettek a gépek számára. Az AlphaProof és az AlphaGeometry 2 sikere megmutatja, hogy az AI képes most már magas szintű logikai érvelésre, absztrakcióra és hierarchikus tervezésre, amelyek szükségesek az IMO problémák megoldásához. Különösen figyelemre méltó, hogy az AI rendszerek ember által olvasható bizonyításokat készítettek, és klasszikus geometriai szabályokat használtak, hasonlóan az emberi versenyzőkhöz. Ezt az eredményt szakértő matematikusok, köztük Fields-érmes Tim Gowers is elismerte, aki meglepetését fejezte ki az AI azon képessége miatt, hogy megtalálja a "varázskulcsokat", amelyek összetett problémákat oldanak meg. A rendszerek teljesítménye megközelíti az emberi aranyérmesekét, az AlphaGeometry 2 pedig az elmúlt 25 év összes történelmi IMO geometriai problémájának 83%-át oldotta meg, jelentős javulást mutatva elődjének 53%-os sikerességi rátájához képest.
Az AI jövőbeli lehetőségei
Az AlphaProof és az AlphaGeometry 2 sikeres szereplése az IMO-n új lehetőségeket nyit az AI-támogatott matematikai kutatás és problémamegoldás terén. Ezek a rendszerek segíthetik a matematikusokat új betekintések felfedezésében, nyitott problémák megoldásában és a tudományos felfedezések felgyorsításában. Ugyanakkor a DeepMind kutatói elismerik, hogy az AI még mindig nélkülözi az emberi matematikusok kreativitását és problémamegoldó képességeit, ami arra utal, hogy további fejlesztések szükségesek ahhoz, hogy az AI teljes mértékben megfeleljen az emberi képességeknek a matematikában. Ahogy ezek a rendszerek tovább fejlődnek, hatékony számítási eszközökké válhatnak, hasonlóan a számológépekhez, segítve az embereket matematikai bizonyítások megfogalmazásában és összetett hipotézisek feltárásában.