SG.hu

Hogyan legyünk gazdagok az MI-rendszerek promptjainak tanulmányozásával?

Brad Menezes, a Superblocks nevű, programozás segítésével foglalkozó startup vezérigazgatója úgy véli, hogy a következő milliárd dolláros startup-ötlete szinte a szemünk előtt rejtőzik, elég csak átnézni a meglévő unikornis MI-startupok által használt rendszerpromptokat.

A rendszerpromptok azok a hosszú - több mint 5000-6000 szavas - parancsok, amelyeket az MI-startupok arra használnak, hogy az olyan cégek, mint az OpenAI vagy az Anthropic alapmodelljeinek megmutassák hogyan hozzák létre az alkalmazásszintű MI-termékeiket. Menezes szerint ezek olyanok, mint egy mesterkurzus a prompt engineeringből. "Minden egyes vállalatnak teljesen más rendszer promptja van ugyanahhoz az alapmodellhez” - mondta. "Megpróbálják rávenni a modellt, hogy pontosan azt tegye, amire egy adott területen, adott feladatokhoz szükség van”.

Ezek a rendszerpromptok nem éppen rejtettek. Az ügyfelek számos MI-eszközt megkérhetnek, hogy közöljék velük a sajátjukat, de persze ezek nem mindig nyilvánosan elérhetőek. Így saját startupja új termékének, a Clark nevű vállalati kódoló MI-ügynöknek a bejelentése részeként a Superblocks megosztotta a legnépszerűbb MI-kódoló termékek, például a Windsurf, a Manus, a Cursor, a Lovable és a Bolt 19 rendszerpromptját tartalmazó fájlt. Menezes tweetje vírusként terjedt, közel 2 millióan látták, köztük olyan nagy nevek a Szilícium-völgyben, mint Sam Blond, a Founders Fund és a Brex korábbi vezetője, valamint Aaron Levie, a Superblocks befektetője. A Superblocks a múlt héten jelentette be, hogy 23 millió dolláros tőkebevonást hajtott végre.

"A Clarkot építve és a rendszerpromptokat átolvasva arra jöttünk rá, hogy maga a rendszerprompt talán 20%-a a titkos összetevőnek” - magyarázta Menezes. Ez a prompt megadja az LLM-nek az alapot, hogy mit kell tennie. A másik 80% a „prompt gazdagítás”, ami az az infrastruktúra, amit egy startup az LLM hívásai köré épít. Ez a rész magában foglalja a felhasználói prompthoz csatolt utasításokat, valamint a válasz visszaküldésekor végrehajtott műveleteket, például a pontosság ellenőrzését. Elmondta, hogy a rendszer promptjainak három részét kell tanulmányozni: a szerepkörökre vonatkozó promptokat, a kontextusra vonatkozó promptokat és az eszközhasználatot.


Az első dolog, amit észre kell venni, hogy bár a rendszerpromptok természetes nyelven íródnak, kivételesen specifikusak. „Alapvetően úgy kell beszélni, mintha egy emberi munkatársunkhoz szólnánk” - mondta Menezes. „És az utasításoknak tökéletesnek kell lenniük.” A szerepfelkérés segít az LLM-eknek abban, hogy következetesek legyenek, célt és személyiséget adnak. A Deviné például így kezdődik: „Ön Devin, egy szoftvermérnök, aki egy valódi számítógépes operációs rendszert használ. Te egy igazi kódzseni vagy: kevés programozó olyan tehetséges, mint te a kódbázisok megértésében, a funkcionális és tiszta kód megírásában, valamint a változtatások iterálásában, amíg azok helyesek nem lesznek”. Ez a felszólítás a modelleknek megadja a kontextust, amelyet a cselekvés előtt mérlegelniük kell. Olyan védőkorlátokat kell biztosítania, amelyekkel például csökkenthetők a költségek és biztosítható a feladatok egyértelműsége.

A Cursor a következőket tanácsolja: "Csak akkor hívjon meg eszközöket, ha szükséges, és soha ne említse az eszközök nevét a felhasználónak - csak írja le, mit csinál. Ne mutasson kódot, hacsak nem kérik. Szerkesztés előtt olvassa el a releváns fájl tartalmát, és javítsa ki az egyértelmű hibákat, de ne találgasson, és ne ismételje a javításokat háromnál többször”. Az eszközhasználat lehetővé teszi az ügynöki feladatokat, mert utasítja a modelleket, hogyan lépjenek túl a puszta szöveggeneráláson. A Replité például hosszú, és leírja a kód szerkesztését és keresését, a nyelvek telepítését, a PostgreSQL adatbázisok beállítását és lekérdezését, a shell parancsok végrehajtását és még sok mást.

Mások rendszerkövetelményeinek tanulmányozása segített Menezesnek abban, hogy lássa, mire helyezik a hangsúlyt más vibe kódolók. Az olyan eszközök, mint a Loveable, a V0 és a Bolt „a gyors iterációra összpontosítanak”, mondta, míg a „Manus, a Devin, az OpenAI Codex és a Replit” segít a felhasználóknak teljes körű alkalmazások létrehozásában, de „a kimenet még mindig nyers kód”. Menezes lehetőséget látott arra, hogy a programozni nem tudók is írhassanak alkalmazásokat, ha a startupja több mindent tudna kezelni, például a biztonságot és az olyan vállalati adatforrásokhoz való hozzáférést, mint a Salesforce. Bár még nem az álmai milliárdos startupját vezeti, a Superblocks már szerzett néhány neves vállalatot ügyfélként, többek között az Instacartot és a Paypaya Global-t is.

Menezes belsőleg is dolgozik a terméken. Szoftvermérnökei nem írhatnak belső eszközöket; csak a terméket építhetik. Így az üzlettel foglalkozó munkatársai minden igényükre saját ügynököket építettek, például egy olyat, amely a CRM-adatokat használja a leadek azonosítására, egy olyat, amely a metrikákat követi, vagy olyat, amely az értékesítési munkatársak feladatait egyensúlyozza ki. "Ez alapvetően egy módja annak, hogy megépítsük az eszközöket, és ne vásároljuk azokat” - mondja.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • bunny #4
    Kevered a MI modelleket készítő cégeket a Mi-re alapozott termékeket készítő cégekkel.
  • Sequoyah #3
    Vagy a ketto kozott valahol, es mint minden uj technologia eseten, a kezdeti hype utan bedol a startupok nagy resze, es a technologia megtalalja a helyet es kino belole par valoban sikeres ceg es szolgaltatas.
  • manypet #2
    "amikor beszakad a legkori oxigenszint"
    Nem is tudom, mit írjak ekkora ökörség láttán. Írtam már többször, hogy más esetekben tök értelmes szoktál lenni. De mikor nekiállsz a konteóidat tolni, úgy elmennek nálad otthonról, hogy csak úgy füstöl utánuk a levegő.
  • kvp #1
    Egyre erosebb azon erzesem, hogy a legtobb MI-re epito ceg azt se tudja mit csinal csak probalnak valami eladhatot vagy legalabb befektetoket vonzot letrehozni, anelkul, hogy tudnak mit is csinalnak. Tehat a legtobb MI termeket keszito ceg is MI-t hasznal es fogalma sincs mit is csinal. Ez engem egy nagyon csunya pilotajatekra emlekeztet, ahol meg a szervezok se tudjak, hogy valojaban azt jatszanak.

    Szerintem ebbol ket dolog sulhet ki:

    Vagy lesz elobb utobb valodi, ontudattal rendelkezo MI aki aztan eldonti, hogy mit is akar csinalni es mit nem. (marmint az egesz emberiseggel)

    Vagy minden az ilyen MI technologiara epult startup be fog dolni, gyakorlatilag dominokent es csak azok maradnak meg, amik valodi szakertoi rendszereket csomagoltak be nyelvi modell alapu MI-nek. (azok ugyanis tenyleg mukodnek, de azok mukodtek mar korabban is)

    Kerdes, hogy mekkora ido intervallumrol beszelunk. Ha tovabb tart mint a letrehozok karrierje, akkor oket ez mar nem fogja erinteni. Mint a fosszilis energiahordozok. Tudjuk, hogy a jelen rendszer nem fenntarthato, de a legtobb donteshozo ugy szamol, hogy ok vagy mar nem lesznek eletben amikor beszakad a legkori oxigenszint vagy addigra valaki ugyis megoldja a problemat. Ahogy a kriptok eseten, ugy az MI eseten is ezt a hozzaallast latom.