Az egész MI iparág fejlődését leblokkolhatja a "desztilláció"

A technológiai óriások dollármilliárdokat költöttek arra a feltevésre, hogy a mesterséges intelligencia területén a nagyobb a jobb. A DeepSeek áttörése azt mutatja, hogy a kisebb is lehet ugyanolyan jó.

A kínai vállalatnak a mesterséges intelligenciát fejlesztő cégek élvonalába való berobbanása heves vitákat váltott ki a Szilícium-völgyben a DeepSeek által alkalmazott úgynevezett desztillációról, amelynek során egy új rendszer több százezer kérdés feltevésével és a válaszok elemzésével egy meglévő rendszerből tanul. "Olyan ez, mintha kapnál pár órát Einsteinnel, és úgy sétálnál ki, hogy majdnem olyan tudással rendelkezel, mint ő a fizikában” - mondta Ali Ghodsi, a Databricks adatkezelő cég vezérigazgatója.

Az olyan cégek, mint az OpenAI és az Anthropic vezető mesterséges intelligenciái lényegében az alapoktól tanítják magukat hatalmas mennyiségű nyers adatból. Ez a folyamat jellemzően sok hónapot és több tízmillió dollárt vagy annál is többet vesz igénybe. Az ilyen munka eredményeire támaszkodva a desztilláció hetek vagy akár napok alatt, lényegesen kevesebb pénzért létrehozhat egy majdnem ugyanolyan jó modellt. Az OpenAI közölte, hogy a DeepSeek a ChatGPT-t működtető modellekből desztillált anyagokat használt a rendszere felépítéséhez. Az OpenAI szolgáltatási feltételei tiltják, hogy az MI-t rivális termékek fejlesztésére használják fel.

A desztilláció nem új ötlet, de a DeepSeek sikere új kétségeket ébreszt a technológiai óriások és startupok üzleti modelljével kapcsolatban, amelyek milliárdokat költenek a legfejlettebb mesterséges intelligencia kifejlesztésére, beleértve a Google-t, az OpenAI-t, az Anthropicot és Elon Musk xAI-ját. Az OpenAI éppen a múlt héten jelentette be, hogy a SoftBankkal és másokkal partnerséget kötött, hogy a következő öt évben 500 milliárd dollárt fektessenek be az MI-infrastruktúrába. Ha ezek a beruházások nem nyújtanak a vállalatoknak verhetetlen előnyt, hanem inkább az olcsóbb riválisok számára szolgálnak ugródeszkaként, akkor nehéz lesz igazolni őket. A DeepSeek nyomán a Szilícium-völgy vezetői és befektetői felülvizsgálják üzleti modelljeiket, és megkérdőjelezik, hogy még mindig megéri-e iparági vezetőnek lenni. "Vajon gazdaságilag gyümölcsöző-e az élvonalban lenni, ha ez nyolcszor annyiba kerül, mint egy követőnek?” - mondta Mike Volpi, veterán technológiai vezető és kockázati tőkebefektető, a Hanabi Capital általános partnere.

Az OpenAI vezérigazgatója, Sam Altman az X-en a DeepSeek legújabb kiadását „lenyűgöző modellnek nevezte” és hozzátette: "izgatottan várjuk a kutatási ütemtervünk további végrehajtását”. Az Anthropic vezérigazgatója, Dario Amodei a blogján azt írta, hogy a DeepSeek zászlóshajó modellje "nem olyan egyedülálló áttörés, ami alapvetően megváltoztatja a fejlett MI-rendszerek gazdaságosságát”, hanem inkább „egy várható esemény a folyamatos költségcsökkentési görbén”. A technológiai vezetők arra számítanak, hogy hamarosan több magas színvonalú MI-alkalmazás készül majd desztillációval. A Hugging Face nevű MI-vállalat kutatói a múlt héten kezdtek el próbálkozni egy a DeepSeekéhez hasonló modell megalkotásával. „A legkönnyebben a desztillációs folyamatot lehet lemásolni” - mondta Lewis Tunstall vezető kutató.

Az OpenAI és a Google MI-modellei továbbra is megelőzik a DeepSeek-et a Szilícium-völgyben leggyakrabban használt ranglistán. A technológiai óriások valószínűleg azért tartják meg előnyüket a legfejlettebb rendszereknél, mert ők végzik a legtöbb eredeti kutatást. Sok fogyasztó és vállalkozás azonban szívesen használ olyan technológiát, amely egy kicsit rosszabb, de sokkal kevesebbe kerül. Trump elnök mesterséges intelligencia cárja, David Sacks a Fox News műsorában azt mondta, hogy elvárja az amerikai vállalatoktól, hogy nehezebbé tegyék a modelljeik desztillálását.

A DeepSeek elmondta, hogy korábban a Meta Platforms és az Alibaba által kiadott nyílt forráskódú mesterséges intelligenciákon használt desztillációt, valamint az egyik modelljéből egy másikat épített. A nyílt forráskódú mesterséges intelligencia fejlesztői általában engedélyezik a másolást, ha elismerést kapnak. A DeepSeek saját modelljei nyílt forráskódúak. A NovaSky, a Berkeley-i Kaliforniai Egyetem kutatólaboratóriuma ebben a hónapban tett közzé egy olyan modellt, amelyről azt állítják, hogy egyenrangú az OpenAI által nemrég kiadott modellel. A NovaSky tudósai 450 dollárért építették meg a kínai Alibaba cég nyílt forráskódú modelljének desztillálásával.

A Berkeley kutatói a modellt nyílt forráskódú szoftverként adták ki, és máris használják egy még olcsóbb mesterséges intelligencia-technológia kifejlesztéséhez. Az egyik startup, a Bespoke Labs arra használta, hogy a DeepSeek technológiáját egy új modellé desztillálja, amely szerinte jól teljesített a kódolási és matematikai feladatokban. "A desztilláció mint technika nagyon hatékony abban, hogy új képességeket adjunk hozzá egy meglévő modellhez” - mondta Ion Stoica, a Berkeley Egyetem informatika professzora.

A mesterséges intelligencia iparágában már most is éles a verseny, és a legtöbb vállalat veszteséges, miközben a piaci részesedésért harcol. A DeepSeek és más desztillációt alkalmazó cégek belépése tovább nyomhatja lefelé az árakat, és olyan visszacsatolási hurkot hozhat létre, amelyben egyre nehezebb lesz igazolni, hogy hatalmas összegeket költsenek a fejlett kutatásra. Az OpenAI és mások MI-modelljeihez hozzáférő szoftverfejlesztők árai az elmúlt évben drasztikusan csökkentek. A nyílt forráskódú mesterséges intelligencia, mint például a DeepSeeké, a technológiai vezetők szerint csak további költségcsökkentést ígér. "Nehezebb lesz igazolni a nagyon magas árréseket” - mondta Vipul Ved Prakash, a Together AI vezérigazgatója, amely számítási szolgáltatásokat értékesít az MI-alkalmazások fejlesztői számára.

Szerintem abból hogy milyen elven generálja a választ, nem következik az hogy az AI ne tudna problémát megoldani.

Pl: nekem volt egy problémám (?) hogy egy scriptem futatása után, ami kiválaszt 100 véletlenszerű MP3-at a vinyómon lévő ~60.000-ból és egy könyvtárba másolja, valamilyen oknál fogva rendszeresen 100-nál kevesebb mp3-at találtam a célkönyvtárban...

Leirtam a jelenséget igya mint most neked, és egyből köpte a választ. (kiváncsi lennék mire tippelsz, NEM az volt hogy a kód hibázott volna és nem 100 MP3-at választott ki, hanem vmi egészen más). Nem is kapta meg a kódot, csak ezt a leírást...

Számomra ez problémamegoldás.

Lehet a definícionk tér el arról hogy mi a probléma.
Utoljára szerkesztette: lammaer, 2025.02.06. 14:23:54

Az egész MI iparág fejlődését leblokkolhatja a "desztilláció"

Kapcsolódó cikkek és linkek

Hozzászólások