SG.hu
Hogyan legyünk gazdagok az MI-rendszerek promptjainak tanulmányozásával?

Brad Menezes, a Superblocks nevű, programozás segítésével foglalkozó startup vezérigazgatója úgy véli, hogy a következő milliárd dolláros startup-ötlete szinte a szemünk előtt rejtőzik, elég csak átnézni a meglévő unikornis MI-startupok által használt rendszerpromptokat.
A rendszerpromptok azok a hosszú - több mint 5000-6000 szavas - parancsok, amelyeket az MI-startupok arra használnak, hogy az olyan cégek, mint az OpenAI vagy az Anthropic alapmodelljeinek megmutassák hogyan hozzák létre az alkalmazásszintű MI-termékeiket. Menezes szerint ezek olyanok, mint egy mesterkurzus a prompt engineeringből. "Minden egyes vállalatnak teljesen más rendszer promptja van ugyanahhoz az alapmodellhez” - mondta. "Megpróbálják rávenni a modellt, hogy pontosan azt tegye, amire egy adott területen, adott feladatokhoz szükség van”.
Ezek a rendszerpromptok nem éppen rejtettek. Az ügyfelek számos MI-eszközt megkérhetnek, hogy közöljék velük a sajátjukat, de persze ezek nem mindig nyilvánosan elérhetőek. Így saját startupja új termékének, a Clark nevű vállalati kódoló MI-ügynöknek a bejelentése részeként a Superblocks megosztotta a legnépszerűbb MI-kódoló termékek, például a Windsurf, a Manus, a Cursor, a Lovable és a Bolt 19 rendszerpromptját tartalmazó fájlt. Menezes tweetje vírusként terjedt, közel 2 millióan látták, köztük olyan nagy nevek a Szilícium-völgyben, mint Sam Blond, a Founders Fund és a Brex korábbi vezetője, valamint Aaron Levie, a Superblocks befektetője. A Superblocks a múlt héten jelentette be, hogy 23 millió dolláros tőkebevonást hajtott végre.
"A Clarkot építve és a rendszerpromptokat átolvasva arra jöttünk rá, hogy maga a rendszerprompt talán 20%-a a titkos összetevőnek” - magyarázta Menezes. Ez a prompt megadja az LLM-nek az alapot, hogy mit kell tennie. A másik 80% a „prompt gazdagítás”, ami az az infrastruktúra, amit egy startup az LLM hívásai köré épít. Ez a rész magában foglalja a felhasználói prompthoz csatolt utasításokat, valamint a válasz visszaküldésekor végrehajtott műveleteket, például a pontosság ellenőrzését. Elmondta, hogy a rendszer promptjainak három részét kell tanulmányozni: a szerepkörökre vonatkozó promptokat, a kontextusra vonatkozó promptokat és az eszközhasználatot.
Az első dolog, amit észre kell venni, hogy bár a rendszerpromptok természetes nyelven íródnak, kivételesen specifikusak. „Alapvetően úgy kell beszélni, mintha egy emberi munkatársunkhoz szólnánk” - mondta Menezes. „És az utasításoknak tökéletesnek kell lenniük.” A szerepfelkérés segít az LLM-eknek abban, hogy következetesek legyenek, célt és személyiséget adnak. A Deviné például így kezdődik: „Ön Devin, egy szoftvermérnök, aki egy valódi számítógépes operációs rendszert használ. Te egy igazi kódzseni vagy: kevés programozó olyan tehetséges, mint te a kódbázisok megértésében, a funkcionális és tiszta kód megírásában, valamint a változtatások iterálásában, amíg azok helyesek nem lesznek”. Ez a felszólítás a modelleknek megadja a kontextust, amelyet a cselekvés előtt mérlegelniük kell. Olyan védőkorlátokat kell biztosítania, amelyekkel például csökkenthetők a költségek és biztosítható a feladatok egyértelműsége.
A Cursor a következőket tanácsolja: "Csak akkor hívjon meg eszközöket, ha szükséges, és soha ne említse az eszközök nevét a felhasználónak - csak írja le, mit csinál. Ne mutasson kódot, hacsak nem kérik. Szerkesztés előtt olvassa el a releváns fájl tartalmát, és javítsa ki az egyértelmű hibákat, de ne találgasson, és ne ismételje a javításokat háromnál többször”. Az eszközhasználat lehetővé teszi az ügynöki feladatokat, mert utasítja a modelleket, hogyan lépjenek túl a puszta szöveggeneráláson. A Replité például hosszú, és leírja a kód szerkesztését és keresését, a nyelvek telepítését, a PostgreSQL adatbázisok beállítását és lekérdezését, a shell parancsok végrehajtását és még sok mást.
Mások rendszerkövetelményeinek tanulmányozása segített Menezesnek abban, hogy lássa, mire helyezik a hangsúlyt más vibe kódolók. Az olyan eszközök, mint a Loveable, a V0 és a Bolt „a gyors iterációra összpontosítanak”, mondta, míg a „Manus, a Devin, az OpenAI Codex és a Replit” segít a felhasználóknak teljes körű alkalmazások létrehozásában, de „a kimenet még mindig nyers kód”. Menezes lehetőséget látott arra, hogy a programozni nem tudók is írhassanak alkalmazásokat, ha a startupja több mindent tudna kezelni, például a biztonságot és az olyan vállalati adatforrásokhoz való hozzáférést, mint a Salesforce. Bár még nem az álmai milliárdos startupját vezeti, a Superblocks már szerzett néhány neves vállalatot ügyfélként, többek között az Instacartot és a Paypaya Global-t is.
Menezes belsőleg is dolgozik a terméken. Szoftvermérnökei nem írhatnak belső eszközöket; csak a terméket építhetik. Így az üzlettel foglalkozó munkatársai minden igényükre saját ügynököket építettek, például egy olyat, amely a CRM-adatokat használja a leadek azonosítására, egy olyat, amely a metrikákat követi, vagy olyat, amely az értékesítési munkatársak feladatait egyensúlyozza ki. "Ez alapvetően egy módja annak, hogy megépítsük az eszközöket, és ne vásároljuk azokat” - mondja.
A rendszerpromptok azok a hosszú - több mint 5000-6000 szavas - parancsok, amelyeket az MI-startupok arra használnak, hogy az olyan cégek, mint az OpenAI vagy az Anthropic alapmodelljeinek megmutassák hogyan hozzák létre az alkalmazásszintű MI-termékeiket. Menezes szerint ezek olyanok, mint egy mesterkurzus a prompt engineeringből. "Minden egyes vállalatnak teljesen más rendszer promptja van ugyanahhoz az alapmodellhez” - mondta. "Megpróbálják rávenni a modellt, hogy pontosan azt tegye, amire egy adott területen, adott feladatokhoz szükség van”.
Ezek a rendszerpromptok nem éppen rejtettek. Az ügyfelek számos MI-eszközt megkérhetnek, hogy közöljék velük a sajátjukat, de persze ezek nem mindig nyilvánosan elérhetőek. Így saját startupja új termékének, a Clark nevű vállalati kódoló MI-ügynöknek a bejelentése részeként a Superblocks megosztotta a legnépszerűbb MI-kódoló termékek, például a Windsurf, a Manus, a Cursor, a Lovable és a Bolt 19 rendszerpromptját tartalmazó fájlt. Menezes tweetje vírusként terjedt, közel 2 millióan látták, köztük olyan nagy nevek a Szilícium-völgyben, mint Sam Blond, a Founders Fund és a Brex korábbi vezetője, valamint Aaron Levie, a Superblocks befektetője. A Superblocks a múlt héten jelentette be, hogy 23 millió dolláros tőkebevonást hajtott végre.
"A Clarkot építve és a rendszerpromptokat átolvasva arra jöttünk rá, hogy maga a rendszerprompt talán 20%-a a titkos összetevőnek” - magyarázta Menezes. Ez a prompt megadja az LLM-nek az alapot, hogy mit kell tennie. A másik 80% a „prompt gazdagítás”, ami az az infrastruktúra, amit egy startup az LLM hívásai köré épít. Ez a rész magában foglalja a felhasználói prompthoz csatolt utasításokat, valamint a válasz visszaküldésekor végrehajtott műveleteket, például a pontosság ellenőrzését. Elmondta, hogy a rendszer promptjainak három részét kell tanulmányozni: a szerepkörökre vonatkozó promptokat, a kontextusra vonatkozó promptokat és az eszközhasználatot.
Az első dolog, amit észre kell venni, hogy bár a rendszerpromptok természetes nyelven íródnak, kivételesen specifikusak. „Alapvetően úgy kell beszélni, mintha egy emberi munkatársunkhoz szólnánk” - mondta Menezes. „És az utasításoknak tökéletesnek kell lenniük.” A szerepfelkérés segít az LLM-eknek abban, hogy következetesek legyenek, célt és személyiséget adnak. A Deviné például így kezdődik: „Ön Devin, egy szoftvermérnök, aki egy valódi számítógépes operációs rendszert használ. Te egy igazi kódzseni vagy: kevés programozó olyan tehetséges, mint te a kódbázisok megértésében, a funkcionális és tiszta kód megírásában, valamint a változtatások iterálásában, amíg azok helyesek nem lesznek”. Ez a felszólítás a modelleknek megadja a kontextust, amelyet a cselekvés előtt mérlegelniük kell. Olyan védőkorlátokat kell biztosítania, amelyekkel például csökkenthetők a költségek és biztosítható a feladatok egyértelműsége.
A Cursor a következőket tanácsolja: "Csak akkor hívjon meg eszközöket, ha szükséges, és soha ne említse az eszközök nevét a felhasználónak - csak írja le, mit csinál. Ne mutasson kódot, hacsak nem kérik. Szerkesztés előtt olvassa el a releváns fájl tartalmát, és javítsa ki az egyértelmű hibákat, de ne találgasson, és ne ismételje a javításokat háromnál többször”. Az eszközhasználat lehetővé teszi az ügynöki feladatokat, mert utasítja a modelleket, hogyan lépjenek túl a puszta szöveggeneráláson. A Replité például hosszú, és leírja a kód szerkesztését és keresését, a nyelvek telepítését, a PostgreSQL adatbázisok beállítását és lekérdezését, a shell parancsok végrehajtását és még sok mást.
Mások rendszerkövetelményeinek tanulmányozása segített Menezesnek abban, hogy lássa, mire helyezik a hangsúlyt más vibe kódolók. Az olyan eszközök, mint a Loveable, a V0 és a Bolt „a gyors iterációra összpontosítanak”, mondta, míg a „Manus, a Devin, az OpenAI Codex és a Replit” segít a felhasználóknak teljes körű alkalmazások létrehozásában, de „a kimenet még mindig nyers kód”. Menezes lehetőséget látott arra, hogy a programozni nem tudók is írhassanak alkalmazásokat, ha a startupja több mindent tudna kezelni, például a biztonságot és az olyan vállalati adatforrásokhoz való hozzáférést, mint a Salesforce. Bár még nem az álmai milliárdos startupját vezeti, a Superblocks már szerzett néhány neves vállalatot ügyfélként, többek között az Instacartot és a Paypaya Global-t is.
Menezes belsőleg is dolgozik a terméken. Szoftvermérnökei nem írhatnak belső eszközöket; csak a terméket építhetik. Így az üzlettel foglalkozó munkatársai minden igényükre saját ügynököket építettek, például egy olyat, amely a CRM-adatokat használja a leadek azonosítására, egy olyat, amely a metrikákat követi, vagy olyat, amely az értékesítési munkatársak feladatait egyensúlyozza ki. "Ez alapvetően egy módja annak, hogy megépítsük az eszközöket, és ne vásároljuk azokat” - mondja.