Sg.hu - Úgy néz ki, elérte a maximumot az MI-modellek mérete

2025. május 16. 13:32, péntek

SG.hu

Úgy néz ki, elérte a maximumot az MI-modellek mérete

A Meta késlelteti kiemelt MI modelljének bevezetését, ami megmutatja, hogy milyen problémákkal küzdenek jelenleg a modellek képességeit javítani próbáló vezető MI-cégek.

Egyre több az aggodalom a több milliárd dolláros MI befektetések irányával kapcsolatban. A Meta mérnökei küzdenek a „Behemót” nevű nagy nyelvi modelljük képességeinek jelentős javításával, ami a munkatársaknál kérdéseket vet fel azzal kapcsolatban, hogy a korábbi verziókhoz képest elért javulás elég jelentős-e ahhoz, hogy indokolttá tegye a nyilvános kiadást. A Behemoth a belső tervek szerint áprilisban jelent volna meg, a Meta első, fejlesztőknek szóló mesterséges intelligencia konferenciájával egy időben. A Meta a Llama AI modellcsalád két kisebb modelljét még az esemény előtt kiadta, de később a nagyobb Behemoth megjelenésének belső célját júniusra tolta ki. Most őszre vagy későbbre halasztották.

A Meta már korábban is dicséretet kapott azért a gyorsaságért, amellyel felzárkózott a riválisokhoz a globális mesterséges intelligencia versenyben. A cég dollármilliárdokat költött a WhatsApp, az Instagram és a Facebook chatbotjait működtető technológia kifejlesztésére. A Meta idén akár 72 milliárd dollárt is tervez beruházásokra költeni, amelynek nagy részét Mark Zuckerberg vezérigazgató mesterséges intelligenciával kapcsolatos nagyszabású céljainak megvalósítására fordítja.

Zuckerberg és más Meta-vezetők nyilvánosan nem kötelezték el magukat a Behemoth időzítése mellett. A vállalat végül úgy dönthet, hogy a Behemothotot a vártnál hamarabb is kiadja, akár egy korlátozottabb verzió bevezetésével. A Meta mérnökei és kutatói azonban aggódnak, hogy a teljesítménye nem felel meg a képességeiről szóló nyilvános nyilatkozatoknak. A vállalat felsővezetői csalódottak a Llama 4 modelleket építő csapat teljesítménye miatt, és a véleményüket ismerő személyek szerint őket okolják a Behemoth sikertelenségéért. A Meta ennek következtében jelentős vezetői változtatásokat fontolgat a mesterséges intelligencia termékcsoportjában.

A Facebook-anyavállalat nyilvánosan dicsérte a Behemoth képességeit, mondván, hogy egyes teszteken már most is felülmúlja az OpenAI, a Google és az Anthropic hasonló technológiáját, azonban a teljesítményét képzési kihívások hátráltatták. Ezek tükrözik más vezető MI-vállalatok botladozásait vagy késéseit a következő nagy, korszerű modelljeik kiadása során. Egyes kutatók úgy látják, hogy ez a minta azt bizonyítja, hogy a jövőben az MI-modellek fejlődése sokkal lassabb ütemben zajlik majd, mint a múltban, és óriási költségekkel járhat. "Jelenleg az összes laboratóriumban, az összes modellben elég kicsi a fejlődés” - mondta Ravid Shwartz-Ziv, a New York-i Egyetem adattudományi központjának adjunktusa.

A GPT-5, az OpenAI egyik következő nagy technológiai ugrása eredetileg 2024 közepe körülre volt várható. Februárban az OpenAI vezetője, Sam Altman azt mondta, hogy a modell GPT-4.5 néven fog megjelenni, és hogy a GPT-5 - a modell, amely reményeik szerint nagyobb technológiai áttörést hoz majd - még hónapokig várat magára. A ChatGPT jelenleg a GPT-4o változatán fut. Az Anthropic tavaly azt mondta, hogy egy új modellen dolgozik, a Claude 3.5 Opuson, amely a tavaly kiadott és folyamatosan frissített MI-modellek nagyobb változata. Ezt a nagyobb méretű változatot még mindig nem adták ki. Egy szóvivő szerint az Opus hamarosan megjelenik.

A Meta Llama első verzióját a Meta Fundamental AI Research Team készítette, amely nagyrészt egyetemi oktatókból és doktori fokozattal rendelkező kutatókból áll. A csapat 2023 elején tette közzé a modelleket és az azokat magyarázó kutatási dokumentumot a nyilvánosság számára. Azóta az eredeti dokumentumban szereplő 14 kutató közül 11 elhagyta a vállalatot. A Llama-modelleket már egy másik csapat fejlesztette ki. Az áprilisban megjelent két modell kezdetben jól szerepelt egy MI-chatbot ranglistán, később azonban kiderült, hogy a ranglistára beküldött modell nem ugyanaz volt, amelyet a nyilvánosság számára is kiadtak. A ranglista összeállítói szerint a Metának egyértelműbbé kellett volna tennie, hogy egy testreszabott modellt nyújtott be, amelynek célja az volt, hogy jól teljesítsen a benchmark-teszten. Zuckerberg elismerte, hogy a Meta az MI-modelljének egy olyan változatát küldte be a ranglistára, amelyet úgy optimalizáltak, hogy jól teljesítsen a külső teljesítményteszteken.

Informatika és tudomány

Úgy néz ki, elérte a maximumot az MI-modellek mérete

Hozzászólások

Bejelentkezés