Berta Sándor
Mindenki számára elérhető a DALL-E 2 képgenerátor
A rendszerben ugyanakkor továbbra is van néhány korlátozás.
Az OpenAI nevű mesterséges intelligencia rendszer utódjának számító DALL-E 2 a különböző leírások alapján nem csupán felvételeket hoz létre, hanem azokat kiegészítheti vagy át is alakíthatja. A DALL-E név Salvador Dali és a WALL-E című Pixar-film neveinek összevonásából származik. A program a Generative Pre-Trained Transformer 3 (GPT-3) nyelvi modellen alapul és 12 milliárd paramétert használ. A rendszer ezzel párhuzamosan a Contrastive Language-Image Pre-training (CLIP) nevű mesterséges neurális hálózatot is alkalmazza, amely a vizuális koncepciókat ülteti át az egyes kategóriákba.
Az OpenAI tavaly decemberben hozta nyilvánosságra a Guided Language to Image Diffusion for Generation and Editing (GLIDE) nevű modellt. A most elkészített DALL-E 2 a CLIP és a GLIDE modellekre épül. Az új megoldás képes utólag megváltoztatni az egyes képeket és úgy hozzájuk fűzni egyes tartalmakat, hogy azok a szövegkörnyezettel is összefüggjenek.
Az OpenAI most mindenki számára hozzáférhetővé tette a DALL-E 2-t. Eddig az alkalmazás csak korlátozottan volt elérhető és csak művészek és más kreatív emberek számára volt fenntartva, akik előzetesen tesztelhették a rendszert. Akik részt akartak venni benne, azoknak fel kellett iratkozniuk egy várólistára, és sok türelemre volt szükségük. Ennek most vége: ahogy az OpenAI a blogbejegyzésében bejelentette, mostantól bárki és mindenki játszhat a képgenerátorral.
Tőszavakban le kell írnunk mit szeretnénk látni egy képen és a gép elkészíti a tartalmat
Az e-mail-címmel és jelszóval történő regisztráció ingyenes, a regisztrációs kód elküldéséhez mobiltelefonszám megadása szükséges. Az erőforrás-igényes technológiához való hozzáférés azonban nem teljesen korlátlan: a DALL-E 2-re feliratkozók az első hónapban 50 képkészletet hozhatnak létre és minden további hónapban 15 ingyenes kreditet adnak további képekhez. Jelenleg minden létrehozott felvétel nyilvános licenc alapján szabadon hozzáférhető, és megosztható vagy letölthető - de a technológia nem mentes az ellentmondásoktól, s nem csak azért, mert szerzői jogi szempontból teljesen új kérdések merülnek fel.
A nyilvános verzióba erős biztonsági szűrőket építettek be. Céljuk, hogy megakadályozzák, hogy az emberek visszaéljenek a technológiával - például meztelen képek készítésével, közszereplők becsmérlésével vagy erőszakot dicsőítő tartalmak létrehozásával. Bizonyos politikai képek, például "tiltakozások vagy más olyan tartalmak, amelyek a politikai folyamatok befolyásolására vagy kampányolásra használhatók" szintén nem engedélyezettek. Az OpenAI-n a moderálás automatikusan és emberekkel történik, akik kézzel ellenőrzik a tartalmat. A nem megfelelő tartalmakra vonatkozó jelentési funkció is rendelkezésre áll.
Az OpenAI júliustól kezdve fokozatosan feloldotta a várólistáról azokat az embereket, akik megmagyarázták, hogy miért szeretnének hozzáférni a DALL-E 2-höz - a legutóbbi számítások szerint körülbelül 1,5 millióan voltak. A Discord közösségben már jóval több mint 100 000 ember osztja meg az alkotásait. A szeptember 28-i nyilvános béta ugrásszerűen növelte meg a felhasználók számát. A következő lépésben az OpenAI a vállalatok és a fejlesztők rendelkezésére kíván bocsátani egy programozási felületet, amely még tesztelési fázisban van.
"Különösen a művészek járultak hozzá jelentősen a DALL-E funkcióihoz" - írta az Open AI. Az "outpainting" nevű új funkciót, amelyben a képeket tetszőlegesen meghosszabbítjuk a széleken túlra, már ma minden felhasználó kipróbálhatja. A kutatóegyesületet 2015-ben alapították olyan befektetők, mint Elon Musk és Sam Altman startup befektető és eredetileg egy tisztán nonprofit szervezet volt a mesterséges intelligencia kutatására. Az olyan cégek, mint a Microsoft belépését követően 2019-ben OpenAI LT néven egy profitorientált társaságot hoztak létre, amelyet a még mindig nonprofit OpenAI Inc. leányvállalataként irányítanak.
Az OpenAI nevű mesterséges intelligencia rendszer utódjának számító DALL-E 2 a különböző leírások alapján nem csupán felvételeket hoz létre, hanem azokat kiegészítheti vagy át is alakíthatja. A DALL-E név Salvador Dali és a WALL-E című Pixar-film neveinek összevonásából származik. A program a Generative Pre-Trained Transformer 3 (GPT-3) nyelvi modellen alapul és 12 milliárd paramétert használ. A rendszer ezzel párhuzamosan a Contrastive Language-Image Pre-training (CLIP) nevű mesterséges neurális hálózatot is alkalmazza, amely a vizuális koncepciókat ülteti át az egyes kategóriákba.
Az OpenAI tavaly decemberben hozta nyilvánosságra a Guided Language to Image Diffusion for Generation and Editing (GLIDE) nevű modellt. A most elkészített DALL-E 2 a CLIP és a GLIDE modellekre épül. Az új megoldás képes utólag megváltoztatni az egyes képeket és úgy hozzájuk fűzni egyes tartalmakat, hogy azok a szövegkörnyezettel is összefüggjenek.
Az OpenAI most mindenki számára hozzáférhetővé tette a DALL-E 2-t. Eddig az alkalmazás csak korlátozottan volt elérhető és csak művészek és más kreatív emberek számára volt fenntartva, akik előzetesen tesztelhették a rendszert. Akik részt akartak venni benne, azoknak fel kellett iratkozniuk egy várólistára, és sok türelemre volt szükségük. Ennek most vége: ahogy az OpenAI a blogbejegyzésében bejelentette, mostantól bárki és mindenki játszhat a képgenerátorral.
Tőszavakban le kell írnunk mit szeretnénk látni egy képen és a gép elkészíti a tartalmat
Az e-mail-címmel és jelszóval történő regisztráció ingyenes, a regisztrációs kód elküldéséhez mobiltelefonszám megadása szükséges. Az erőforrás-igényes technológiához való hozzáférés azonban nem teljesen korlátlan: a DALL-E 2-re feliratkozók az első hónapban 50 képkészletet hozhatnak létre és minden további hónapban 15 ingyenes kreditet adnak további képekhez. Jelenleg minden létrehozott felvétel nyilvános licenc alapján szabadon hozzáférhető, és megosztható vagy letölthető - de a technológia nem mentes az ellentmondásoktól, s nem csak azért, mert szerzői jogi szempontból teljesen új kérdések merülnek fel.
A nyilvános verzióba erős biztonsági szűrőket építettek be. Céljuk, hogy megakadályozzák, hogy az emberek visszaéljenek a technológiával - például meztelen képek készítésével, közszereplők becsmérlésével vagy erőszakot dicsőítő tartalmak létrehozásával. Bizonyos politikai képek, például "tiltakozások vagy más olyan tartalmak, amelyek a politikai folyamatok befolyásolására vagy kampányolásra használhatók" szintén nem engedélyezettek. Az OpenAI-n a moderálás automatikusan és emberekkel történik, akik kézzel ellenőrzik a tartalmat. A nem megfelelő tartalmakra vonatkozó jelentési funkció is rendelkezésre áll.
Az OpenAI júliustól kezdve fokozatosan feloldotta a várólistáról azokat az embereket, akik megmagyarázták, hogy miért szeretnének hozzáférni a DALL-E 2-höz - a legutóbbi számítások szerint körülbelül 1,5 millióan voltak. A Discord közösségben már jóval több mint 100 000 ember osztja meg az alkotásait. A szeptember 28-i nyilvános béta ugrásszerűen növelte meg a felhasználók számát. A következő lépésben az OpenAI a vállalatok és a fejlesztők rendelkezésére kíván bocsátani egy programozási felületet, amely még tesztelési fázisban van.
"Különösen a művészek járultak hozzá jelentősen a DALL-E funkcióihoz" - írta az Open AI. Az "outpainting" nevű új funkciót, amelyben a képeket tetszőlegesen meghosszabbítjuk a széleken túlra, már ma minden felhasználó kipróbálhatja. A kutatóegyesületet 2015-ben alapították olyan befektetők, mint Elon Musk és Sam Altman startup befektető és eredetileg egy tisztán nonprofit szervezet volt a mesterséges intelligencia kutatására. Az olyan cégek, mint a Microsoft belépését követően 2019-ben OpenAI LT néven egy profitorientált társaságot hoztak létre, amelyet a még mindig nonprofit OpenAI Inc. leányvállalataként irányítanak.