SG.hu
Az MI úttörője azt szeretné, ha Európa egyéni, gyorsabb előrehaladásra törekedne

Az OpenAI és a Mistral AI által a gépi tanuláshoz alkalmazott energiaigényes megközelítés egyik alapgondolata, hogy a mesterséges intelligencia modellnek a teljes adathalmazt át kell vizsgálnia, mielőtt új felismeréseket adna ki.
Sepp Hochreiter, a technológia egyik korai úttörője, aki az ausztriai Linzben található Johannes Kepler Egyetem mesterséges intelligencia laboratóriumát vezeti, másképp látja a dolgot, és az ő megoldása sokkal kevesebb pénzt és számítási teljesítményt igényel. Őt az érdekli, hogy megtanítsa a mesterséges intelligenciamodelleket arra, hogyan felejtsenek hatékonyan.
Hochreiter különleges helyet foglal el a mesterséges intelligencia világában, mivel jóval a legtöbb informatikus előtt megmászta a technológia legmagasabb csúcsait. Az 1990-es években müncheni egyetemistaként ő találta ki azt a koncepcionális keretrendszert, amely az Alphabet, az Apple és az Amazon által használt fürge mesterséges intelligenciamodellek első generációját megalapozta. Ez a Long Short-Term Memory (LSTM) nevű megközelítés nemcsak azt tanította meg a számítógépeknek, hogyan jegyezzék meg az összetett adatokat, hanem azt is, hogy mely információkat kell elvetniük. Miután az MIT Press közzétette Hochreiter eredményeit, a technológiai körökben sztárrá vált, az LSTM pedig iparági standarddá.
Most, hogy egyre nagyobb aggodalomra ad okot a mesterséges intelligencia működtetéséhez szükséges hatalmas energiamennyiség - és az, hogy Európa lassan kezdte el fejleszteni a technológiát -, az 58 éves tudós egy új, erre a megközelítésre épülő mesterséges intelligencia modellel tért vissza. Hochreiter és kutatócsoportja kiadta az xLSTM-et, amely szerinte gyorsabbnak és energiatakarékosabbnak bizonyul, mint a generatív MI. Működésének magyarázatához az információs technológia egy régebbi darabját, a könyveket hozza fel példának.
Minden alkalommal, amikor egy olvasó kézbe vesz egy regényt, és új fejezetet kezd, nem kell minden korábbi szót végigolvasnia ahhoz, hogy tudja, hol hagyta abba a történetet. Emlékezni fog a cselekményre, a mellékszálakra, a szereplőkre és a témákra, és elveti azt, ami nem központi fontosságú a történet szempontjából. Hochreiter szerint a gyors és hatékony számítás kulcsa annak megkülönböztetése, hogy mit kell megjegyezni, és mit lehet elfelejteni. Ez az oka annak is, hogy az xLSTM nem támaszkodik 100 milliárd dolláros adatközpontokra, amelyek mindent felszívnak és tárolnak. "Ez egy könnyebb és gyorsabb módszer, amely sokkal kevesebb energiát fogyaszt” - mondta Hochreiter.
Bár az IT-óriások már régóta uralják az ágazatot, a kínai DeepSeek idei sikere megmutatta, hogy a hatékonyság hangsúlyozása egyre inkább érdekelheti a befektetőket. A vállalat mindössze 10 millió jüannal (1,4 millió dollár) indult, és azóta más MI-vállalkozások is felkarolták a kevesebb tőkéből működő modelleket. És még ezt megelőzően is törekedtek a fürgébb és megfizethetőbb kis nyelvi modellek piacra dobására.
Az USA és Európa közötti kereskedelmi háború kilátásba helyezésével és a technológiai szuverenitás szükségességének előtérbe kerülésével Hochreiter úgy véli, hogy a személyre szabott mesterséges intelligencia jó projekt lenne Európa számára. „Az elkövetkező években mindenki át fog állni a célnak jobban megfelelő új modellekre” - mondta. „Fontos, hogy Európában konszolidálódjunk a birtokunkban lévő technológiák, algoritmusok és módszerek körül.” Hochreiter kifejtette, hogy nagyobb értéket lát a saját megoldásokban és adatkereskedelemben, mint a nagy nyelvi adathalmazokkal való foglalkozásban. „A nyelv” - mondta - "nem a legtöbb vállalat alaptevékenysége«".
Nem mindenki van meggyőződve erről. Bár a DeepSeek megmutatta, hogy kis befektetésekkel nagy piaci hatást lehet elérni, Hochreiternek még be kell bizonyítania, hogy képes a technológiája felskálázására. Azok az informatikusok, akik áttekintették Hochreiter stratégiáját, megjegyzik, hogy az általa képzett modellek sokkal kisebbek, mint a ChatGPT. Egyesek megkérdőjelezik, hogy az xLSTM képes lesz-e megnőni, és hogy meg tudja-e őrizni feltételezett számítási hatékonyságát, amikor nagyobb adathalmazokra alkalmazzák, amelyek több feldolgozási teljesítményt igényelnek. Ezekre a kérdésekre akkor kaphatunk választ, amikor Hochreiter és csapata kiterjeszti munkáját a vállalati szférára.
Az elmúlt évben laboratóriuma két vállalatot alapított, amelyek jelenleg robotokat, drónokat és elektromos hálózatokat gyártó európai gyártókkal dolgoznak együtt. Az első, az NXAI GmbH, ahol Hochreiter a vezető tudós, mintegy 20 millió eurót gyűjtött be egy Stefan Pierer osztrák iparmágnás által vezetett finanszírozási körben. A második, az Emmi AI GmbH, amelyet a Microsoft korábbi kutatója, Johannes Brandstetter vezet, ebben a hónapban kezdte meg üzleti tevékenységét.
Az NXAI nem keres kockázati tőkefinanszírozást - ehelyett olyan vállalatoknak udvarol, amelyek részesedést szeretnének szerezni iparágspecifikus vertikális MI-modellekben, például az autóiparban, a biotechnológiában és a robotikában. „Jelenleg a mesterséges intelligencia területén a befektetés megtérülésének problémája van” - mondta Albert Ortig, az NXAI vezérigazgatója. „Olyan maradandót akarunk létrehozni, amelyet nem adnak el néhány év múlva egymilliárd euróért.” A Dunaparton található irodájában ülve Hochreiter biztos benne, hogy jó úton jár. "Valami jobbat alkotunk” - mondta.
Sepp Hochreiter, a technológia egyik korai úttörője, aki az ausztriai Linzben található Johannes Kepler Egyetem mesterséges intelligencia laboratóriumát vezeti, másképp látja a dolgot, és az ő megoldása sokkal kevesebb pénzt és számítási teljesítményt igényel. Őt az érdekli, hogy megtanítsa a mesterséges intelligenciamodelleket arra, hogyan felejtsenek hatékonyan.
Hochreiter különleges helyet foglal el a mesterséges intelligencia világában, mivel jóval a legtöbb informatikus előtt megmászta a technológia legmagasabb csúcsait. Az 1990-es években müncheni egyetemistaként ő találta ki azt a koncepcionális keretrendszert, amely az Alphabet, az Apple és az Amazon által használt fürge mesterséges intelligenciamodellek első generációját megalapozta. Ez a Long Short-Term Memory (LSTM) nevű megközelítés nemcsak azt tanította meg a számítógépeknek, hogyan jegyezzék meg az összetett adatokat, hanem azt is, hogy mely információkat kell elvetniük. Miután az MIT Press közzétette Hochreiter eredményeit, a technológiai körökben sztárrá vált, az LSTM pedig iparági standarddá.
Most, hogy egyre nagyobb aggodalomra ad okot a mesterséges intelligencia működtetéséhez szükséges hatalmas energiamennyiség - és az, hogy Európa lassan kezdte el fejleszteni a technológiát -, az 58 éves tudós egy új, erre a megközelítésre épülő mesterséges intelligencia modellel tért vissza. Hochreiter és kutatócsoportja kiadta az xLSTM-et, amely szerinte gyorsabbnak és energiatakarékosabbnak bizonyul, mint a generatív MI. Működésének magyarázatához az információs technológia egy régebbi darabját, a könyveket hozza fel példának.
Minden alkalommal, amikor egy olvasó kézbe vesz egy regényt, és új fejezetet kezd, nem kell minden korábbi szót végigolvasnia ahhoz, hogy tudja, hol hagyta abba a történetet. Emlékezni fog a cselekményre, a mellékszálakra, a szereplőkre és a témákra, és elveti azt, ami nem központi fontosságú a történet szempontjából. Hochreiter szerint a gyors és hatékony számítás kulcsa annak megkülönböztetése, hogy mit kell megjegyezni, és mit lehet elfelejteni. Ez az oka annak is, hogy az xLSTM nem támaszkodik 100 milliárd dolláros adatközpontokra, amelyek mindent felszívnak és tárolnak. "Ez egy könnyebb és gyorsabb módszer, amely sokkal kevesebb energiát fogyaszt” - mondta Hochreiter.
Bár az IT-óriások már régóta uralják az ágazatot, a kínai DeepSeek idei sikere megmutatta, hogy a hatékonyság hangsúlyozása egyre inkább érdekelheti a befektetőket. A vállalat mindössze 10 millió jüannal (1,4 millió dollár) indult, és azóta más MI-vállalkozások is felkarolták a kevesebb tőkéből működő modelleket. És még ezt megelőzően is törekedtek a fürgébb és megfizethetőbb kis nyelvi modellek piacra dobására.
Az USA és Európa közötti kereskedelmi háború kilátásba helyezésével és a technológiai szuverenitás szükségességének előtérbe kerülésével Hochreiter úgy véli, hogy a személyre szabott mesterséges intelligencia jó projekt lenne Európa számára. „Az elkövetkező években mindenki át fog állni a célnak jobban megfelelő új modellekre” - mondta. „Fontos, hogy Európában konszolidálódjunk a birtokunkban lévő technológiák, algoritmusok és módszerek körül.” Hochreiter kifejtette, hogy nagyobb értéket lát a saját megoldásokban és adatkereskedelemben, mint a nagy nyelvi adathalmazokkal való foglalkozásban. „A nyelv” - mondta - "nem a legtöbb vállalat alaptevékenysége«".
Nem mindenki van meggyőződve erről. Bár a DeepSeek megmutatta, hogy kis befektetésekkel nagy piaci hatást lehet elérni, Hochreiternek még be kell bizonyítania, hogy képes a technológiája felskálázására. Azok az informatikusok, akik áttekintették Hochreiter stratégiáját, megjegyzik, hogy az általa képzett modellek sokkal kisebbek, mint a ChatGPT. Egyesek megkérdőjelezik, hogy az xLSTM képes lesz-e megnőni, és hogy meg tudja-e őrizni feltételezett számítási hatékonyságát, amikor nagyobb adathalmazokra alkalmazzák, amelyek több feldolgozási teljesítményt igényelnek. Ezekre a kérdésekre akkor kaphatunk választ, amikor Hochreiter és csapata kiterjeszti munkáját a vállalati szférára.
Az elmúlt évben laboratóriuma két vállalatot alapított, amelyek jelenleg robotokat, drónokat és elektromos hálózatokat gyártó európai gyártókkal dolgoznak együtt. Az első, az NXAI GmbH, ahol Hochreiter a vezető tudós, mintegy 20 millió eurót gyűjtött be egy Stefan Pierer osztrák iparmágnás által vezetett finanszírozási körben. A második, az Emmi AI GmbH, amelyet a Microsoft korábbi kutatója, Johannes Brandstetter vezet, ebben a hónapban kezdte meg üzleti tevékenységét.
Az NXAI nem keres kockázati tőkefinanszírozást - ehelyett olyan vállalatoknak udvarol, amelyek részesedést szeretnének szerezni iparágspecifikus vertikális MI-modellekben, például az autóiparban, a biotechnológiában és a robotikában. „Jelenleg a mesterséges intelligencia területén a befektetés megtérülésének problémája van” - mondta Albert Ortig, az NXAI vezérigazgatója. „Olyan maradandót akarunk létrehozni, amelyet nem adnak el néhány év múlva egymilliárd euróért.” A Dunaparton található irodájában ülve Hochreiter biztos benne, hogy jó úton jár. "Valami jobbat alkotunk” - mondta.