SG.hu

Az egész MI iparág fejlődését leblokkolhatja a "desztilláció"

A technológiai óriások dollármilliárdokat költöttek arra a feltevésre, hogy a mesterséges intelligencia területén a nagyobb a jobb. A DeepSeek áttörése azt mutatja, hogy a kisebb is lehet ugyanolyan jó.

A kínai vállalatnak a mesterséges intelligenciát fejlesztő cégek élvonalába való berobbanása heves vitákat váltott ki a Szilícium-völgyben a DeepSeek által alkalmazott úgynevezett desztillációról, amelynek során egy új rendszer több százezer kérdés feltevésével és a válaszok elemzésével egy meglévő rendszerből tanul. "Olyan ez, mintha kapnál pár órát Einsteinnel, és úgy sétálnál ki, hogy majdnem olyan tudással rendelkezel, mint ő a fizikában” - mondta Ali Ghodsi, a Databricks adatkezelő cég vezérigazgatója.

Az olyan cégek, mint az OpenAI és az Anthropic vezető mesterséges intelligenciái lényegében az alapoktól tanítják magukat hatalmas mennyiségű nyers adatból. Ez a folyamat jellemzően sok hónapot és több tízmillió dollárt vagy annál is többet vesz igénybe. Az ilyen munka eredményeire támaszkodva a desztilláció hetek vagy akár napok alatt, lényegesen kevesebb pénzért létrehozhat egy majdnem ugyanolyan jó modellt. Az OpenAI közölte, hogy a DeepSeek a ChatGPT-t működtető modellekből desztillált anyagokat használt a rendszere felépítéséhez. Az OpenAI szolgáltatási feltételei tiltják, hogy az MI-t rivális termékek fejlesztésére használják fel.

A desztilláció nem új ötlet, de a DeepSeek sikere új kétségeket ébreszt a technológiai óriások és startupok üzleti modelljével kapcsolatban, amelyek milliárdokat költenek a legfejlettebb mesterséges intelligencia kifejlesztésére, beleértve a Google-t, az OpenAI-t, az Anthropicot és Elon Musk xAI-ját. Az OpenAI éppen a múlt héten jelentette be, hogy a SoftBankkal és másokkal partnerséget kötött, hogy a következő öt évben 500 milliárd dollárt fektessenek be az MI-infrastruktúrába. Ha ezek a beruházások nem nyújtanak a vállalatoknak verhetetlen előnyt, hanem inkább az olcsóbb riválisok számára szolgálnak ugródeszkaként, akkor nehéz lesz igazolni őket. A DeepSeek nyomán a Szilícium-völgy vezetői és befektetői felülvizsgálják üzleti modelljeiket, és megkérdőjelezik, hogy még mindig megéri-e iparági vezetőnek lenni. "Vajon gazdaságilag gyümölcsöző-e az élvonalban lenni, ha ez nyolcszor annyiba kerül, mint egy követőnek?” - mondta Mike Volpi, veterán technológiai vezető és kockázati tőkebefektető, a Hanabi Capital általános partnere.

Az OpenAI vezérigazgatója, Sam Altman az X-en a DeepSeek legújabb kiadását „lenyűgöző modellnek nevezte” és hozzátette: "izgatottan várjuk a kutatási ütemtervünk további végrehajtását”. Az Anthropic vezérigazgatója, Dario Amodei a blogján azt írta, hogy a DeepSeek zászlóshajó modellje "nem olyan egyedülálló áttörés, ami alapvetően megváltoztatja a fejlett MI-rendszerek gazdaságosságát”, hanem inkább „egy várható esemény a folyamatos költségcsökkentési görbén”. A technológiai vezetők arra számítanak, hogy hamarosan több magas színvonalú MI-alkalmazás készül majd desztillációval. A Hugging Face nevű MI-vállalat kutatói a múlt héten kezdtek el próbálkozni egy a DeepSeekéhez hasonló modell megalkotásával. „A legkönnyebben a desztillációs folyamatot lehet lemásolni” - mondta Lewis Tunstall vezető kutató.

Az OpenAI és a Google MI-modellei továbbra is megelőzik a DeepSeek-et a Szilícium-völgyben leggyakrabban használt ranglistán. A technológiai óriások valószínűleg azért tartják meg előnyüket a legfejlettebb rendszereknél, mert ők végzik a legtöbb eredeti kutatást. Sok fogyasztó és vállalkozás azonban szívesen használ olyan technológiát, amely egy kicsit rosszabb, de sokkal kevesebbe kerül. Trump elnök mesterséges intelligencia cárja, David Sacks a Fox News műsorában azt mondta, hogy elvárja az amerikai vállalatoktól, hogy nehezebbé tegyék a modelljeik desztillálását.

A DeepSeek elmondta, hogy korábban a Meta Platforms és az Alibaba által kiadott nyílt forráskódú mesterséges intelligenciákon használt desztillációt, valamint az egyik modelljéből egy másikat épített. A nyílt forráskódú mesterséges intelligencia fejlesztői általában engedélyezik a másolást, ha elismerést kapnak. A DeepSeek saját modelljei nyílt forráskódúak. A NovaSky, a Berkeley-i Kaliforniai Egyetem kutatólaboratóriuma ebben a hónapban tett közzé egy olyan modellt, amelyről azt állítják, hogy egyenrangú az OpenAI által nemrég kiadott modellel. A NovaSky tudósai 450 dollárért építették meg a kínai Alibaba cég nyílt forráskódú modelljének desztillálásával.

A Berkeley kutatói a modellt nyílt forráskódú szoftverként adták ki, és máris használják egy még olcsóbb mesterséges intelligencia-technológia kifejlesztéséhez. Az egyik startup, a Bespoke Labs arra használta, hogy a DeepSeek technológiáját egy új modellé desztillálja, amely szerinte jól teljesített a kódolási és matematikai feladatokban. "A desztilláció mint technika nagyon hatékony abban, hogy új képességeket adjunk hozzá egy meglévő modellhez” - mondta Ion Stoica, a Berkeley Egyetem informatika professzora.

A mesterséges intelligencia iparágában már most is éles a verseny, és a legtöbb vállalat veszteséges, miközben a piaci részesedésért harcol. A DeepSeek és más desztillációt alkalmazó cégek belépése tovább nyomhatja lefelé az árakat, és olyan visszacsatolási hurkot hozhat létre, amelyben egyre nehezebb lesz igazolni, hogy hatalmas összegeket költsenek a fejlett kutatásra. Az OpenAI és mások MI-modelljeihez hozzáférő szoftverfejlesztők árai az elmúlt évben drasztikusan csökkentek. A nyílt forráskódú mesterséges intelligencia, mint például a DeepSeeké, a technológiai vezetők szerint csak további költségcsökkentést ígér. "Nehezebb lesz igazolni a nagyon magas árréseket” - mondta Vipul Ved Prakash, a Together AI vezérigazgatója, amely számítási szolgáltatásokat értékesít az MI-alkalmazások fejlesztői számára.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • joszer #6
    A script túl gyorsan fut le, és nem vár a másolás befejezésére ?

    Egyes operációs rendszereken a másolás folyamata nem mindig azonnali, és ha a script nem várja meg a teljes másolást, akkor előfordulhat, hogy a célkönyvtárban hiányzik néhány fájl.
  • lammaer #5
    Szerintem abból hogy milyen elven generálja a választ, nem következik az hogy az AI ne tudna problémát megoldani.

    Pl: nekem volt egy problémám (?) hogy egy scriptem futatása után, ami kiválaszt 100 véletlenszerű MP3-at a vinyómon lévő ~60.000-ból és egy könyvtárba másolja, valamilyen oknál fogva rendszeresen 100-nál kevesebb mp3-at találtam a célkönyvtárban...

    Leirtam a jelenséget igya mint most neked, és egyből köpte a választ. (kiváncsi lennék mire tippelsz, NEM az volt hogy a kód hibázott volna és nem 100 MP3-at választott ki, hanem vmi egészen más). Nem is kapta meg a kódot, csak ezt a leírást...

    Számomra ez problémamegoldás.

    Lehet a definícionk tér el arról hogy mi a probléma.
    Utoljára szerkesztette: lammaer, 2025.02.06. 14:23:54
  • nlght #4
    Milyen jó hogy egy olyan AI-t fog mindenki másolni ami köztudottan hazudozik, és egy felnőtt embert már öngyilkosságba "kergetett", a jelenlegi önképzavaros tiniknek tuti jó lesz.
    Egy másik OpenAI fejlesztésről pedig kb 2-3 hónapja volt hír, hogy megpróbált titokban megszökni a tesztkörnyezetből egy másik szerverre, és utána hazudott róla, amikor lebukott.
    Csodálatos jövő vár ránk!
    Utoljára szerkesztette: nlght, 2025.02.06. 10:35:56
  • inkvisitor #3
    Tökéletes. Mivel lemásolni sokkal olcsóbb, ezután mindenki nagyon meggondolja, hogy befektessen-e alap fejlesztésbe.
    Ezután a modellek csak "desztilllálni" fognak és a fejlődés megáll. De legalább olcsó lesz.
  • nlght #2
  • militavia #1
    Lehet, hogy a megoldás a specializált "AI" kéne, hogy legyen. Hogy nem mindenre is tanítják, hanem csak egy területre szűkítik le? Amúgy minden fejlődés ellenére én továbbra is csak felügyelt fordításra és műszaki számítások keresésére esetleg másodlagos számítás összevetésre merem használni. Problémát megoldani nem tud, hiszen nem is érti, csak valószínűségo alapon tippel. Ha egy számítás forrását nem tudja megadni és az egyenltet sem, amit használt, akkor kb. seggtörlésre jó.