Sg.hu - Mindenki számára elérhető a DALL-E 2 képgenerátor

2022. október 01. 0:04, szombat

Berta Sándor

Mindenki számára elérhető a DALL-E 2 képgenerátor

A rendszerben ugyanakkor továbbra is van néhány korlátozás.

Az OpenAI nevű mesterséges intelligencia rendszer utódjának számító DALL-E 2 a különböző leírások alapján nem csupán felvételeket hoz létre, hanem azokat kiegészítheti vagy át is alakíthatja. A DALL-E név Salvador Dali és a WALL-E című Pixar-film neveinek összevonásából származik. A program a Generative Pre-Trained Transformer 3 (GPT-3) nyelvi modellen alapul és 12 milliárd paramétert használ. A rendszer ezzel párhuzamosan a Contrastive Language-Image Pre-training (CLIP) nevű mesterséges neurális hálózatot is alkalmazza, amely a vizuális koncepciókat ülteti át az egyes kategóriákba.

Az OpenAI tavaly decemberben hozta nyilvánosságra a Guided Language to Image Diffusion for Generation and Editing (GLIDE) nevű modellt. A most elkészített DALL-E 2 a CLIP és a GLIDE modellekre épül. Az új megoldás képes utólag megváltoztatni az egyes képeket és úgy hozzájuk fűzni egyes tartalmakat, hogy azok a szövegkörnyezettel is összefüggjenek.

Az OpenAI most mindenki számára hozzáférhetővé tette a DALL-E 2-t. Eddig az alkalmazás csak korlátozottan volt elérhető és csak művészek és más kreatív emberek számára volt fenntartva, akik előzetesen tesztelhették a rendszert. Akik részt akartak venni benne, azoknak fel kellett iratkozniuk egy várólistára, és sok türelemre volt szükségük. Ennek most vége: ahogy az OpenAI a blogbejegyzésében bejelentette, mostantól bárki és mindenki játszhat a képgenerátorral.

Tőszavakban le kell írnunk mit szeretnénk látni egy képen és a gép elkészíti a tartalmat
Az e-mail-címmel és jelszóval történő regisztráció ingyenes, a regisztrációs kód elküldéséhez mobiltelefonszám megadása szükséges. Az erőforrás-igényes technológiához való hozzáférés azonban nem teljesen korlátlan: a DALL-E 2-re feliratkozók az első hónapban 50 képkészletet hozhatnak létre és minden további hónapban 15 ingyenes kreditet adnak további képekhez. Jelenleg minden létrehozott felvétel nyilvános licenc alapján szabadon hozzáférhető, és megosztható vagy letölthető - de a technológia nem mentes az ellentmondásoktól, s nem csak azért, mert szerzői jogi szempontból teljesen új kérdések merülnek fel.

A nyilvános verzióba erős biztonsági szűrőket építettek be. Céljuk, hogy megakadályozzák, hogy az emberek visszaéljenek a technológiával - például meztelen képek készítésével, közszereplők becsmérlésével vagy erőszakot dicsőítő tartalmak létrehozásával. Bizonyos politikai képek, például "tiltakozások vagy más olyan tartalmak, amelyek a politikai folyamatok befolyásolására vagy kampányolásra használhatók" szintén nem engedélyezettek. Az OpenAI-n a moderálás automatikusan és emberekkel történik, akik kézzel ellenőrzik a tartalmat. A nem megfelelő tartalmakra vonatkozó jelentési funkció is rendelkezésre áll.

Az OpenAI júliustól kezdve fokozatosan feloldotta a várólistáról azokat az embereket, akik megmagyarázták, hogy miért szeretnének hozzáférni a DALL-E 2-höz - a legutóbbi számítások szerint körülbelül 1,5 millióan voltak. A Discord közösségben már jóval több mint 100 000 ember osztja meg az alkotásait. A szeptember 28-i nyilvános béta ugrásszerűen növelte meg a felhasználók számát. A következő lépésben az OpenAI a vállalatok és a fejlesztők rendelkezésére kíván bocsátani egy programozási felületet, amely még tesztelési fázisban van.

"Különösen a művészek járultak hozzá jelentősen a DALL-E funkcióihoz" - írta az Open AI. Az "outpainting" nevű új funkciót, amelyben a képeket tetszőlegesen meghosszabbítjuk a széleken túlra, már ma minden felhasználó kipróbálhatja. A kutatóegyesületet 2015-ben alapították olyan befektetők, mint Elon Musk és Sam Altman startup befektető és eredetileg egy tisztán nonprofit szervezet volt a mesterséges intelligencia kutatására. Az olyan cégek, mint a Microsoft belépését követően 2019-ben OpenAI LT néven egy profitorientált társaságot hoztak létre, amelyet a még mindig nonprofit OpenAI Inc. leányvállalataként irányítanak.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)

Agyturbinikusz #11 2022.10.04. 04:23

A művészet értelmezhető akár több síkon is, hiszen nekem is vannak olyan gondolataim amit nem tudok leírni semmilyen formában.
Az érzések ugyan így. Viszont egy művészeti alkotás készüljön bárhogy is, képes lehet ezeket a gondolatokat érzelmeket visszaadni, kiváltani másik emberből.
Tömören ezt érzem a művészet lényegének, amit verbalisan nem lehet kifejezni azt is át tudjuk adni valahogy.

Válasz 'noland' üzenetére (#10)

A paradoxonban az a szép, hogy paradox módon nem szép :)
noland #10 2022.10.03. 11:06

Igen, végsősoron el lehet jutni az absztarkciónak arra a fokára mikor minden (emberi művelet) művészetnek tűnik, a disznóvágástól a programozásig. De visszatérve a realitásba, igen, az emerek szeretik ha a képzőművészet kézzelfogható marad ill. megragadható lehet vagy olyan kontextusba helyezhető ahol "megszólal" és értelmet nyer.
Azonban sajnos az esztétika már eljutott oda, hogy a művészt mint kiválasztó/ válogató személyt is definiálja. Van ebben valami eröltetett újító szándék. A minimalizmus és koceptualizmus még reflektálni akar az elidegenedett társadalomra, hogy akkor nesze nektek egyétek amit csináltatok, viszont a tradicionális stilusok/eljárások képesek csak gyógyítani, és ez mindig háttérbe szorul. Szerintem, csak is teljes egzisztenciális tudatában lévő ember képes művészetet létrehozni.

Válasz 'Tetsuo' üzenetére (#9)

Im beginning to have less and less interest in what you think is possible or impossible. (Dr. Strangelove)
Tetsuo #9 2022.10.03. 02:18

Az "élő" képen túl a művészet része a szimbólumok használata, illetve a kifejezés szimbolizmusa is.
Ha a művészet értelmezése szubjektív, annak egyéni definíciója is az. Valaki tág határokkal, szabadon értelmezi, valaki szigorú szabályoknak megfelelően. Egy bizonyos szabadságon túl minden létező művészetnek tekinthető és a szigorú értelmezés is végső soron ide mutat vissza vallási tradíciók által.
Az esztétika ugyancsak szubjektívnek tűnik, miközben konkrét, erősen meghatározó alapjai vannak.
Azért azt hiszem a legtöbb ember a művészetet emberi alkotásokra vonatkoztatja, és abba nem fér bele az embernélküli, szoftveres kreáció.

Válasz 'noland' üzenetére (#6)

https://www.youtube.com/watch?v=dhjXHtk6H2U
noland #8 2022.10.02. 14:39

Részemről volt öröm a beszélgetés, hogy valaki a mai világból lenyúlt, megmozdult a művészetért. :)

Válasz 'Agyturbinikusz' üzenetére (#7)

Im beginning to have less and less interest in what you think is possible or impossible. (Dr. Strangelove)
Agyturbinikusz #7 2022.10.02. 11:53

Tudod, ezzel úgy vagyok, hogy mindenki szeresse azt ami néki tetszik, a csoportosítás, max információ átadásához jó.
Egy kép esetében, egyszerűbb a képet megnézni (hála a modern világának) mint hogy körbe kelljen írni.

Sokat agyaltam azon, hogy pl négyzet nem létezik sőt kör sem, ezek mind absztrakt fogalmak matematikai síkon, ebből gyorsan levezethető, hogy bármilyen csoportosítás csak elég hanyag megközelítő értéket ad.
Gyakorlatilag az atomokat leszámítva minden egyedi, bár ott sincsen teljes egyformaság, hiszen vannak az izotópok is, és a quantum világ miatt lehet ezt tovább feszegetni, csak akkor sosem lesz vége.

Köszönöm az értelmes társalgást, már hiányzott nagyon.

Válasz 'noland' üzenetére (#6)

A paradoxonban az a szép, hogy paradox módon nem szép :)
noland #6 2022.10.02. 11:21

Általában az ember szeret mérni, rendszerezni, összegyűjteni, azért is, hogy később hivatkozhasson rá, ez is adja az értékét.
Én úgy értettem, hogy a kép él, hogy számomra egy képnek (egy kétdimenziós alkotásnak) olyan elementális ereje van, mintha ott lenne/lennék (egy háromdimenziós valóságban), mintha megfogható valóság lenne (a művész látásmódjában). És ezt nem feltétlenül a precizitásával éri el, hanem ahogy mondtad azt a szubjektív érzetet kelti, ha úgy tetszik van egy aurája. Én ezt egy Van Gogh kiállításon éreztem, és "élőben" élőbbek voltak azok a képek mint egy album printjei (természetesen).

Ha valakinknek tetszenek ezek a képek akkor lelkük rajta, és ki lehet persze fogni jót is, mint ahogy a bolhapiacokon is vannak marha jó nyomatok, nem egyel szemeztem már. :)

Válasz 'Agyturbinikusz' üzenetére (#5)

Im beginning to have less and less interest in what you think is possible or impossible. (Dr. Strangelove)
Agyturbinikusz #5 2022.10.02. 10:19

Ez a szubjektív megítélés, mert ugye mint jelent az pl: a kép él?
Valakinek pl ezek a képek okoznak örömet, tetszik nekik.
A művészet lényege pont az lenne, hogy ne próbáld skatulyaba tuszkolni, hanem nézd meg, ha tetszik akkor nézegessed, ha nem sétáljunk tovább.

Miért akar az ember mindent megmérni qvantalni?

Leonard Cohen jut eszembe a Future című számával.
Nagyon jó a szövege.

Válasz 'noland' üzenetére (#4)

A paradoxonban az a szép, hogy paradox módon nem szép :)
noland #4 2022.10.02. 09:39

Igazad van. Ez sokkal komplexebb dolog, próbáltam egy egyszerűsített vonalat húzni. Szerintem, a művészet a qvalitásban is keresendő, tehát függetlenül, hogy megrendelés vagy sem, amit ma művészetnek tartunk az elenyésző része a valaha létrejött alkotásoknak. Másik kritérium a helyes kontextus, a mértéktartás, arányérzék, forma és tartalom, stb.
És visszatérve, ezek azért nem jó képek mert lélektelenek, lehet érdekesek, meglepőek, de láthatóan gépiesek, és végsősoron fizikailag sem megfelelők, szvsz.

Válasz 'Agyturbinikusz' üzenetére (#3)

Im beginning to have less and less interest in what you think is possible or impossible. (Dr. Strangelove)
Agyturbinikusz #3 2022.10.01. 23:35

Az ugye megvan, a legtöbb művész a múltban is megrendelésre gyártotta a képeket?
Tudod király/csata/feleség/gyerek/vallásos marhaság/stb...
Akkor most ezen mi a furcsa?
Utoljára szerkesztette: Agyturbinikusz, 2022.10.01. 23:36:35

Válasz 'noland' üzenetére (#2)

A paradoxonban az a szép, hogy paradox módon nem szép :)
noland #2 2022.10.01. 17:14

Ha megfigyeled még a Mona Lisán is lesznek ecsetvonások, gesztusok, rétegek. A festészetnek csak egy része a gondolat, és kreativitás, a másik fele a technikából adódó esetlegesség, és inspiráció. Szóval photoshoppolni és megfesteni valamit az két külön dolog, ez a gép csak az előbbit tudja, stílusa nincs, ahogy érzései sem. Pár mátrixot variál, és így jön létre a nagy durranás, a hűha érzés.

Kb. azt tudja mintha megbíznál egy élő festőművészt, hogy készítsen el a nappalidba egy képet az elképzelésed szerint.

Vagy pl. egy Van Gogh ot nézve brutálisan élőnek hatnak a képek, ez sose, sose lesz képes azt utolérni. Szerintem még jó ideig nem kell tőle félni, hogy ez bedönti a műtárgypiacot. :)

Válasz 'Tetsuo' üzenetére (#1)

Im beginning to have less and less interest in what you think is possible or impossible. (Dr. Strangelove)

További bejegyzések a fórumban...