Mesterséges intelligencia

Az AGI-álmoktól a gyakorlati valóságig

Gábor Bíró 2025. augusztus 25. 10 perc olvasási idő

Mélyreható szemléletváltás zajlik a technológiai iparban, amely egy lázas, spekulatív korszak végét jelzi. Ez a korszak a mesterséges általános intelligencia (AGI) küszöbön álló eljövetelére fókuszált. A 2025 elejét meghatározó lélegzetelállító versenyfutás helyét egy sokkal mértéktartóbb, szkeptikusabb és végső soron pragmatikusabb szemlélet vette át.

GPT-5 megérkezett: PhD-szintű szakértők a zsebedben

Gábor Bíró 2025. augusztus 7. 4 perc olvasási idő

Az OpenAI csütörtökön hivatalosan is leleplezte a GPT-5 modellt, amely a vállalat eddigi legfejlettebb mesterséges intelligencia rendszere. A bejelentés szerint az új modell minden ChatGPT felhasználó számára, beleértve az ingyenes hozzáféréssel rendelkezőket is, az alapértelmezetté válik. Sam Altman vezérigazgató szavai szerint a GPT-5 olyan, mintha "PhD-szintű szakértők lennének a zsebünkben", ami egy új, egységes és adaptív rendszer bevezetését jelenti.

A hátborzongató völgy: Amikor a robotok túl emberivé válnak

Gábor Bíró 2025. március 11. 8 perc olvasási idő

Láttál már olyan robotot, animációs figurát, vagy éppen videojáték-karaktert, ami annyira élethű volt, hogy már szinte zavaróan hatott? Nem tudtad eldönteni, hogy emberi-e vagy sem, és ez a bizonytalanság furcsa, nyugtalanító érzést keltett benned? Ha igen, akkor nagy valószínűséggel megtapasztaltad az "uncanny valley", azaz a "hátborzongató völgy" jelenségét. De mi is ez pontosan, és miért vált ki belőlünk ilyen erős reakciót?

o3 mini vs DeepSeek R1 vs Google Gemini 2 Think

Gábor Bíró 2025. február 9. 7 perc olvasási idő

A mesterséges intelligencia fejlődése egyre inkább lehetővé teszi, hogy az LLM modellek bonyolult matematikai problémákat is megoldjanak. De vajon mennyire képesek egy általános iskolai versenyfeladat logikai kihívásainak megfelelni? Egy korábbi tesztben már megvizsgáltam a különböző modellek teljesítményét, most pedig az OpenAI új O3 modellje kapcsán végeztem el egy friss összehasonlítást.

o3 mini

Gábor Bíró 2025. február 9. 3 perc olvasási idő

Az OpenAI nemrégiben bemutatta az o3-mini modellt, amely az érvelési képességekre optimalizált mesterséges intelligencia rendszerek sorában egy újabb lépést jelent. Az új modell különösen azoknak lehet hasznos, akik technikai vagy tudományos problémák megoldására keresnek AI-alapú támogatást.

Miért dominál az NVIDIA az MI-hez használt GPU-k területén?

Gábor Bíró 2025. február 3. 6 perc olvasási idő

A gépi tanulás és a nagy nyelvi modellek (LLM-ek) előretörése egy olyan számítástechnikai kihívást teremtett, amelynek megoldása sokkal több, mint egy egyszerű hardverfejlesztési kérdés. Az elmúlt évek mesterséges intelligencia robbanása olyan speciális számítási igényeket támasztott, amelyekre jelenleg szinte kizárólag az NVIDIA talált megoldást.

Melyik MI modell teljesít a legjobban egy 5. osztályos matematika feladatban?

Gábor Bíró 2025. január 13. 30 perc olvasási idő

Az MI modellek fejlődése az elmúlt években lenyűgöző ütemben haladt előre, de vajon hogyan teljesítenek ezek a rendszerek egy 5. osztályos matematika versenyfeladat megoldásában? Ebben a tesztben nemcsak a modellek problémamegoldó képességét vizsgálom, hanem betekintést nyújtok abba is, hogy mennyire hatékonyan tudnak optimalizációs problémákat kezelni.

Deepseek V3 majdnem state of the art minőség saját szerveren

Gábor Bíró 2025. január 9. 4 perc olvasási idő

Az MI világában eddig a zárt rendszerű modellek, mint a GPT-4 vagy a Claude Sonnet, uralták a csúcskategóriás megoldások piacát, azonban ezekhez hozzáférni gyakran költséges és korlátozott lehetőségekkel jár. A DeepSeek-V3 megjelenése azonban új korszakot nyitott: ez az open-source nyelvi modell nemcsak hogy versenyképes teljesítményt nyújt a legismertebb zárt modellekkel szemben, de lehetőséget kínál arra is, hogy saját infrastruktúrán belül futtassuk.

Mixture of Experts architektúra

Gábor Bíró 2025. január 2. 3 perc olvasási idő

A Mixture-of-Experts (MoE) egy gépi tanulási architektúra, amely a "felosztás és uralkodás" elvét követi. Az alapötlet az, hogy egy nagy modellt több kisebb, specializált almodellre – úgynevezett "szakértőkre" – bontanak, amelyek mindegyike egy adott feladatra vagy adathalmaz-részletre specializálódik.

Jobb válaszokat kapunk ha angolul kérdezzük a modelleket?

Gábor Bíró 2024. december 30. 7 perc olvasási idő

A nagy nyelvi modellek (LLM-ek) használata során (pl. GPT 4o, Claude Sonnet) gyakran felmerülő kérdés, hogy milyen nyelven érdemes kommunikálni velük a leghatékonyabb eredmény elérése érdekében. A modellek többnyelvű képességei lehetővé teszik a hatékony kommunikációt számos nyelven, bár az angol nyelvű bemenetekkel és válaszokkal összevetve azonban más nyelveken látszólag csökken a modellek teljesítménye.

Agyunk 86 milliárd neuronja: Felülmúlhatják az LLM-ek?

Gábor Bíró 2024. december 22. 11 perc olvasási idő

Az emberi agy, ez a komplex biológiai rendszer, évmilliók evolúciója során tökéletesedett, míg a nagyméretű nyelvi modellek (LLM-ek) a mesterséges intelligencia legújabb vívmányai. Bár az LLM-ek lenyűgöző képességeket mutatnak a nyelvfeldolgozás terén, vajon felülmúlhatják-e valaha az emberi agy komplexitását és képességeit?

Az LLM-ek tesztelési módszerei és tesztjei

Gábor Bíró 2024. december 8. 10 perc olvasási idő

A mesterséges intelligencia egyik legdinamikusabban fejlődő területe a nagy nyelvi modellek (LLM-ek) fejlesztése, amelyek napjainkban a legnépszerűbbek közé tartoznak. Egyre több szolgáltató jelentkezik saját modellekkel, legyenek azok zárt vagy nyílt forráskódúak. Ezek a modellek különböző témákban, különböző minőségben, pontosságban tudnak válaszolni. Az innováció gyors üteme miatt szinte heti szinten változik, hogy melyik modell nyújt jobb teljesítményt. De vajon hogyan állapítható meg, hogy egy adott modell valóban jobban teljesít a többinél? Milyen módszerekkel és tesztekkel hasonlíthatók össze ezek az eszközök?

Egy MI által teremtett valóságban élünk?

Gábor Bíró 2024. október 7. 5 perc olvasási idő

Képzeld el, hogy minden, amit látsz, hallsz és érzel - a kedvenc foteled, a szomszéd fűnyírója, sőt még a legkedvesebb emlékeid is - egy zseniális szimuláció részei. Mi lenne, ha kiderülne, hogy nem egy fizikai univerzumban élünk, hanem egy mesterséges intelligencia (AI) által létrehozott virtuális valóságban?

Hopfield és Hinton Nobel-díjat nyert az AI területén végzett munkájukért

Gábor Bíró 2024. október 4. 3 perc olvasási idő

A 2024-es fizikai Nobel-díjat John Hopfield és Geoffrey Hinton kapták meg mesterséges intelligenciával kapcsolatos úttörő munkájukért. Az elismerés a mesterséges neurális hálózatok terén elért alapvető felfedezéseiket honorálja, amelyek lehetővé tették a modern gépi tanulás fejlődését. Az 1980-as években végzett kutatásaik megalapozták a mai AI technológiákat, beleértve a képfelismerést és a nyelvi feldolgozást is. Ez a forradalmi munka jelentősen hozzájárult a tudományos és technológiai világ előrehaladásához.

AI a chipgyártásban

Gábor Bíró 2024. szeptember 23. 4 perc olvasási idő

A Google DeepMind nemrégiben bejelentette az AlphaChip nevű nyílt forráskódú mesterséges intelligencia rendszerét, amely forradalmasítja a számítógépes chipek tervezését. Az AlphaChip képes órák alatt optimalizált chip elrendezéseket generálni, szemben a hagyományos módszerekkel, amelyek hónapokig tarthatnak.

OpenAI o1 modell

Gábor Bíró 2024. szeptember 13. 3 perc olvasási idő

Az OpenAI legújabb mesterséges intelligencia modellje, az o1, amely korábban „Strawberry” kódnéven futott, mostantól elérhető. Az o1 modellt kifejezetten a mesterséges intelligencia érvelési képességeinek fejlesztésére tervezték. Több forrás is arról számolt be, hogy ez az új modellcsalád célja a tudomány, a programozás és a matematika terén felmerülő összetett problémák megoldása, azáltal, hogy több időt tölt a „gondolkodással” a válaszadás előtt.

A Mistral multimodális modellje: Bemutatkozik a Pixtral 12B

Gábor Bíró 2024. szeptember 9. 3 perc olvasási idő

A gyorsan feltörekvő francia MI startup, a Mistral AI belépett a multimodális mesterséges intelligencia világába a Pixtral 12B kiadásával. A multimodális MI olyan rendszereket jelent, amelyek képesek egyszerre több adattípusból, például szövegből és képekből származó információk feldolgozására és megértésére. Ez az új, 12 milliárd paraméteres modell a Mistralt, amely nyílt forráskódú megoldásaira összpontosít, és az amerikai technológiai óriásokkal versenyez, pozicionálja, hogy versenyezzen az olyan nagy szereplők hasonló ajánlataival, mint az OpenAI és az Anthropic.

A ChatGPT memória funkciója

Gábor Bíró 2024. szeptember 5. 6 perc olvasási idő

A mesterséges intelligencia technológiák fejlődése folyamatosan javítja a felhasználói élményt új funkciókkal, de kevés innováció gyakorol olyan mélyreható hatást, mint a ChatGPT memória funkciója. Bár mélyebb, személyre szabottabb és hatékonyabb interakciókat ígér, utat nyitva az ember-gép kapcsolatok új fajtájának, elengedhetetlen megérteni képességeit és jelentős korlátozásait.

SWARM Intelligencia: A természet inspirálta megoldások

Gábor Bíró 2024. szeptember 1. 4 perc olvasási idő

A mesterséges intelligencia és a robotika világában az egyik legizgalmasabb és egyre szélesebb körben kutatott terület a SWARM intelligencia. Ez a megközelítés a természetben megfigyelhető kollektív viselkedési mintákra épít, mint amilyeneket a hangyák, méhek vagy madárrajok mutatnak. A cél, hogy ezekből a rendszerekből tanulva fejlesszenek ki olyan mesterséges rendszereket, amelyek képesek összetett feladatok hatékony elvégzésére decentralizált, önszerveződő módon.