SG.hu
Kifejezetten programozóknak készített MI-t a Mistral
A Microsoft által támogatott és 6 milliárd dollárra értékelt francia MI startup kiadta első kódolásra készült generatív MI modelljét, a Codestral-t.
Más kódgeneráló modellekhez hasonlóan a Codestral is arra szolgál, hogy segítse a fejlesztőket a kódok írásában és a kóddal való interakcióban. Több mint 80 programozási nyelven, köztük Python, Java, C++ és JavaScript nyelven képezték ki - magyarázza a Mistral blogbejegyzése. A Codestral képes funkciókat kitölteni, teszteket írni és részleges kódot kiegészíteni, valamint angolul válaszolni a kódbázissal kapcsolatos kérdésekre.
A Mistral a modellt „nyitottnak” írja le, de ez vitatható. A startup licence tiltja a Codestral és kimenetei bármilyen kereskedelmi tevékenységre való felhasználását. Van egy kivétel a „fejlesztésre”, de még ennek is vannak fenntartásai: a licenc kifejezetten tiltja „a vállalat üzleti tevékenységével összefüggésben az alkalmazottak általi belső felhasználást”. Ennek oka az lehet, hogy a Codestral részben szerzői jogvédelem alatt álló tartalmakon képződött. A Mistral ezt nem erősítette meg, de nem is cáfolta a blogbejegyzésben, de nem lenne meglepő; bizonyíték van arra, hogy a startup korábbi képzési adathalmazai szerzői jogvédett adatokat tartalmaztak.
A Codestral használata nem biztos, hogy megéri a fáradságot. A 22 milliárd paraméteres modell futtatásához erős számítógépre van szükség. (A paraméterek lényegében azt határozzák meg, hogy egy mesterséges intelligenciamodell mennyire képes megoldani egy adott problémát, például elemezni és generálni a szöveget). És bár néhány benchmark szerint legyőzi a versenytársakat, ez aligha számít kiütéses eredménynek. Bár a legtöbb fejlesztő számára nem praktikus, és a teljesítményjavulás tekintetében aprócska, a Codestral biztosan fel fogja élesíteni a vitát arról, hogy vajon bölcs dolog-e kódgeneráló modellekre támaszkodni programozási asszisztensként.
A fejlesztők generatív mesterséges intelligencia-eszközöket használnak legalább néhány kódolási feladathoz. A Stack Overflow tavalyi felmérésében a fejlesztők 44%-a mondta azt, hogy már most is használ MI-eszközöket a fejlesztési folyamatában, míg 26%-uk tervezi, hogy hamarosan használni fogja. Ezeknek az eszközöknek azonban nyilvánvaló hibái vannak. A GitClear több mint 150 millió sornyi, az elmúlt évek során a projektek tárolóiba beküldött kód elemzéséből kiderült, hogy a generatív MI fejlesztőeszközök sok hibás kódot küldenek be a kódbázisokba. Biztonsági kutatók pedig arra figyelmeztettek, hogy az ilyen eszközök felerősíthetik a szoftverprojektekben meglévő hibákat és biztonsági problémákat; a Purdue egyetem tanulmánya szerint az OpenAI ChatGPT programozási kérdésekre adott válaszainak több mint fele téves.
Ez nem fogja megakadályozni az olyan cégeket, mint a Mistral és mások, hogy megpróbáljanak pénzt keresni a modelljeikkel. A Mistral elindította a Codestral hosztolt változatát a Le Chat társalgási MI platformján, valamint a fizetős API-ját. A Mistral azon is dolgozik, hogy a Codestral-t beépítse az olyan alkalmazás-keretrendszerekbe és fejlesztési környezetekbe, mint a LlamaIndex, a LangChain, a Continue.dev és a Tabnine.
Más kódgeneráló modellekhez hasonlóan a Codestral is arra szolgál, hogy segítse a fejlesztőket a kódok írásában és a kóddal való interakcióban. Több mint 80 programozási nyelven, köztük Python, Java, C++ és JavaScript nyelven képezték ki - magyarázza a Mistral blogbejegyzése. A Codestral képes funkciókat kitölteni, teszteket írni és részleges kódot kiegészíteni, valamint angolul válaszolni a kódbázissal kapcsolatos kérdésekre.
A Mistral a modellt „nyitottnak” írja le, de ez vitatható. A startup licence tiltja a Codestral és kimenetei bármilyen kereskedelmi tevékenységre való felhasználását. Van egy kivétel a „fejlesztésre”, de még ennek is vannak fenntartásai: a licenc kifejezetten tiltja „a vállalat üzleti tevékenységével összefüggésben az alkalmazottak általi belső felhasználást”. Ennek oka az lehet, hogy a Codestral részben szerzői jogvédelem alatt álló tartalmakon képződött. A Mistral ezt nem erősítette meg, de nem is cáfolta a blogbejegyzésben, de nem lenne meglepő; bizonyíték van arra, hogy a startup korábbi képzési adathalmazai szerzői jogvédett adatokat tartalmaztak.
A Codestral használata nem biztos, hogy megéri a fáradságot. A 22 milliárd paraméteres modell futtatásához erős számítógépre van szükség. (A paraméterek lényegében azt határozzák meg, hogy egy mesterséges intelligenciamodell mennyire képes megoldani egy adott problémát, például elemezni és generálni a szöveget). És bár néhány benchmark szerint legyőzi a versenytársakat, ez aligha számít kiütéses eredménynek. Bár a legtöbb fejlesztő számára nem praktikus, és a teljesítményjavulás tekintetében aprócska, a Codestral biztosan fel fogja élesíteni a vitát arról, hogy vajon bölcs dolog-e kódgeneráló modellekre támaszkodni programozási asszisztensként.
A fejlesztők generatív mesterséges intelligencia-eszközöket használnak legalább néhány kódolási feladathoz. A Stack Overflow tavalyi felmérésében a fejlesztők 44%-a mondta azt, hogy már most is használ MI-eszközöket a fejlesztési folyamatában, míg 26%-uk tervezi, hogy hamarosan használni fogja. Ezeknek az eszközöknek azonban nyilvánvaló hibái vannak. A GitClear több mint 150 millió sornyi, az elmúlt évek során a projektek tárolóiba beküldött kód elemzéséből kiderült, hogy a generatív MI fejlesztőeszközök sok hibás kódot küldenek be a kódbázisokba. Biztonsági kutatók pedig arra figyelmeztettek, hogy az ilyen eszközök felerősíthetik a szoftverprojektekben meglévő hibákat és biztonsági problémákat; a Purdue egyetem tanulmánya szerint az OpenAI ChatGPT programozási kérdésekre adott válaszainak több mint fele téves.
Ez nem fogja megakadályozni az olyan cégeket, mint a Mistral és mások, hogy megpróbáljanak pénzt keresni a modelljeikkel. A Mistral elindította a Codestral hosztolt változatát a Le Chat társalgási MI platformján, valamint a fizetős API-ját. A Mistral azon is dolgozik, hogy a Codestral-t beépítse az olyan alkalmazás-keretrendszerekbe és fejlesztési környezetekbe, mint a LlamaIndex, a LangChain, a Continue.dev és a Tabnine.