154
Alkotás AIval
  • militavia
    #114
    A probléma az, hogy a ford mustangot felismeri, a harceszközökről és n+1 másról nem tudja, hogy mi. Nem lehet a realisztikusságát annak állítani, amit meg sem tud rajzolni.
  • ximix #113
    Nem értek hozzá sajna, de mintha rémlene valami realistic promt is, lehet meg kell adni valami értéket, hogy mennyire legyen a fikció és valóság aránya ?

  • militavia
    #112
    A full generic dolgokban el tud úszkálni.
    De pl. az én speciális hobbimban wiki szinten túl kb. fejlreáll.
    Azt se tudja mi merre hány méter.
  • Montanosz
    #111
    groteszk módon egyedül mondjuk egy programozonak kell félnie, de valoban egy grafikusnak vagy egy írónak nem, legalábbis jelenleg
    véletlenül az írói cipőben vagyok és ugye probálgattam és random, de kb egy promtal behatárolt mesében mindig valaki elindult valahova, semmi egyedi esztétika vagy példa moralitás kimerül a homokosokat nem lehet megsérteni dologban

    attol hogy ugy cseveg mint egy cimbora szkriptek, rutinok sorozata, elolvastattak vele mondjuk 10 ezer könyvet akkor abbol fog példákat felhozni

    elsütöttem még egy promtot a tankra de nagyon rugalmasan bánt továbbra is a tank felépitésével.

    elképzelhető hogy egy 100 mondatos promtra pontos képet adna de lassan már a promt irás is külöm szakmának számit
  • militavia
    #110
    Még mindig ott tartunk.

    Szép?
    Igen.
    Ha fagyos tájképet akarok, akkor én pont erre gondoltam?
    Nem...

    Inkább ilyenre, de ez sem pontos, csak úgy kb. De lehet ez megint, erdő, mező, tó, süthet a nap, lehet bordult az ég stb.


    Egy grafikusnak csak igénytelen megrendelőtől kell félnie szerintem, az MI rajzolástól nagyon nem.
    Kb. arra elég ez az izé, hogy kb. a stílust belője a grafikus. Vagy még azt sem, mert láthatólag rá van fixálódva alaptémákara.

    De erre most is képes egy grafikus.
    Gondolom egy nem félhülye is felvillant egy témáról 10-20 féle alap kinézetet, hogy akkor "erre gondol a megrendelő?"

    Még a legegyszerűbb képnek is alsó hangon 20-50 paramétere van.
    A MI full randomra választ ezek közül és stílus is. A végeredmény lehet szép, csak a büdös életbe nem sikerült azt rajzolnia, amit én szeretnék. A közelében nincs soha semminek, amit én akarok látni.
    Utoljára szerkesztette: militavia, 2023.05.09. 15:14:30
  • Montanosz
    #109
    sajnos 3 napi ingyenes van, a promtokat kiprobálni nem elég :-)
    inkább mutatok egy fagyos tájképet sztem azt nagyon eltalálta, v5.1+RAW



  • militavia
    #108
    Látni akarom a kardjára támaszkodó női paplovagot, oldalnézetből, ahogy rám néz, fekete copfos hajjal, teljes fémpáncélban a sisakra és kardjára támaszkodva.

    * nem néz rám
    * nem fekete a haja
    * copfot se látni
    * kardra se támaszkodik
    * sisakra se támaszkodik

    A képen az egyetlen pontos dolog kb az, hogy nő és páncél van rajta.
    Semmi más. És akkor még ahogy az afrikás képnél el sem kezdtem specifikálni milyen páncél legyen, milyen háttérrel stb.

    A fogalmatlan tömeg ámul, én meg továbbra is azt mondom, ez egy drága játékszer, hogy kérsz egy buta MI-t, hogy rajzoljon valamit, majd rajzol tök mást, amit kérsz...
    Ha egy grafikus ennyire buta lenne, fizetnél neki? Szerintem nem. :)

    Továbbra is azt látom. Kontextus nélkül, whoa, húdejó, szép.
    Csak rohadtul nem azt rajzolja, amit én kértem.

    Talált a segghülye "MI" valami képet, amin nő és páncél van oszt lemásolta minden értelem nélkül.
    Utoljára szerkesztette: militavia, 2023.05.09. 10:56:15
  • Montanosz
    #107

    Utoljára szerkesztette: Montanosz, 2023.05.08. 23:53:48
  • militavia
    #106
    Lássak akkor mit tud. :)

    Látni akarom a kardjára támaszkodó női paplovagot, oldalnézetből, ahogy rám néz, fekete copfos hajjal, teljes fémpáncélban a sisakra és kardjára támaszkodva.

    Vagy lássuk újra a Afrikában, szavannán a T-55-ös harckocsit.

    Vagy tetszőleges rúna magazin címlapot újraalkotva.
  • Montanosz
    #105
    v5.1

  • militavia
    #103
  • Montanosz
    #103
    amugy lestem is hogy letöltöttem a gpt4-et aztán max 8 giga lett, ha az emberi tudás elfér nyolc gigába nagy baj van :-D
  • militavia
    #102
    De amúgy tehetsz be ilyen képeket, csak hogy lássam mit csinál és szerintem mit kellene csinálnia. :)
  • militavia
    #101
    Megmutathatom majd eredeti fotót, ha érdekel...
  • militavia
    #100


    Ezt én 0 grafikus képzettséggel, simán layerezve egy fotóról rajzoltam meg full kezdőként alig 1 óra alatt.
    Ma talán 20 perc alatt is menne.

    Jelenleg ez megugorhatatlan az MI-nek. Nem is érti mi történik itt.
  • militavia
    #99
    Nah, ha majd kb. ennek alapjait megérti az MI, hogy mi micsoda és miért ott van, akkor no.1 lépés meglesz.

    Ezek egy ovis skicc arról, hogy akkor hol legyen a tank, merre álljon, hol legyen és milyen talaj alapszín, treeline, bokor/sövény, nagyobb szikla és mi robbanjon fel/égjen.

    De ez a kb. 50-100 paraméter, amivel fel kéne ruházni a rajzot csak néhány.
    Ebből egészen pontosan kb. 2-3-at értette meg a buta MI. Legyen rajta tank és robbanás. Van, csak mindkettő szar. A többi nem stimmel.

    Mert csak a tank miből állna "paraméterezve"?

    * típusa, csak maga a család, legyen T-55A mondjuk
    * milyen színe legyen? feltesszük, hogy egyszínű...!
    * merre álljon a képen a test
    * merre álljon a torony?
    * milyen szögben álljon a lövegcső?
    * áll vagy mit csinál? Kifpugóból jön füst?
    * tüzel a löveg éppen?
    * a kép melyik részén van?
    * mekkora részét töltse ki?
    * milyen távolságban van maga az egész kompozíció, hogy a tank milyen távolságban legyen a nézőtől?
    * van van a hk-n külsőleg más? Pl. üzemanyag tartály, málházva rá valami stb.

    Na, ezt az összes főelemre ráhúzod és kb. meg van, hogy mit kérsz a művésztől. Ő érti néhány kép alapján és megcsinálja.

    Az MI-nek egy ilyen 100-as listából azt sikerült eltalálni, hogy legyen rajta tank és robbanás. De az is szarul.

    Bocs, fényévekre vagyunk attól, hogy a cucc azt csinálja, amit mondanak neki.
    A saját feje után látványos, de marhaságokat firkál mindenféle értelem nélkül.


    Utoljára szerkesztette: militavia, 2023.04.18. 13:23:38
  • militavia
    #98
    Egy művésznek az angolai, szavannai fotókat megmutatod, felvázolod neki, hogy milyen szögből, melyik hogyan legyen egymáshoz képest és felskiccel neked n+1 felállást, hogy válassz.

    Az MI a skicc szintet nem képes hozni, hogy az alapelemek a képen (fogalmak és tárgyak) és pozíciók rajta legyenek.
    Mert nem érti mit csinál. Egy nagyon szűk mintából találgat aztán sokan elfogadják a full szar végeredményt is és bemesélik maguknak, hogy "na, jó, kb. stimmel."
    Hát egy f*szt.

    Látod, megmutattad mit írtál be és ízekre szedtem.
    Erőlködés nélkül.
    A képen lényegében SEMMI SEM STIMMEL.

    És erre mondod, hogy nem reménytelen?
    Én meg pislogok. :)
    Utoljára szerkesztette: militavia, 2023.04.18. 13:11:15
  • militavia
    #97
    De, az. A keresőszavak alapján és totál más képzeltem el.
    Folyamatosan erről beszélek.
    Ha kontextus és narratíva nélkül teszel ki egy képet, akkor hú, meg há.
    Ha meg összevetem azzal, hogy ÉN mit képzelek el, vagy ÉN mit akarok láttatni, akkor elröhögöm magam, hogy ez mi a foshuzatos raklapaszar...? :)

    1. A szavanna nem így néz ki. Sehol. Ez inkább egy kelet-európai zöldövezet, ahol egy erdő széle van vízátfolyással.
    Így.

    2.Ez clear sky? Ahol szemre 7/10-es borultság van...? WUT?
    Ez clers sky és szavanna.


    3. A képen egy szem truck sincs, pedig azt kérted.

    4. Vizet nem kértél, mégis van a rajzon. Páccs.

    5. A levegőben levő random tűz és robbanás mitől és hogyan? Csak simán odahányta mert nem érti, hogy minek, miért, hol és hogyan kéne lennie. Full értelem nélkül találgat. A forma, alak, stb se stimmel, hogy akkor mi és hány darabra robbanna.

    6. Ilyen harckocsi nem létezik. Se Afrikában, se sehol. Még formára sem. A lövegcső szar helyen, a lövegcső szarul néz ki.


    Mondom, ez egyelőre egy érdekes gyerekjáték.
    Semmire sem alkalmas a fogalmatan tömegek elkápráztatásán túl.
    A no+1 lépését nem érti egy művészi folyamatnak, hogy mi az a kompozíció...
    Full random hülyeségeket mixel összevissza.

    Ha csak megmutatod, hogy ilyet "rajzolt" az MI, akkor hú és há.
    Csak te megmutattad mi volt a szó és az ember az asztalt csapkodja a röhögéstől.

    t-55 angolan war képeket nézzél. Ha lenne értelme ennek az izének, akkor ez lenne a kiindulási alap, mert Afrika, szavanna és harckocsi az itt volt.

    De nem ez. Mert az MI fullhülye. Mert nem ért meg semmit. És mániákusan mindent sötét tónusban akar rajzolni. Mert ez a gyakori a háborús téma tűz és robbanásnál a sötét / sárga kontraszt és fenyegető hatás miatt.

    De az MI nem érti ezt, mert nem ember. Csak egy gép, ami sémákat másol. Szarul.
    Utoljára szerkesztette: militavia, 2023.04.18. 13:04:43
  • Montanosz
    #96
    azért nem annyira reménytelen a helyzet

    Africa, soldiers, clear skies, savannah, explosion, trucks, tanks smoke, fire, vehicle wrecks




    Utoljára szerkesztette: Montanosz, 2023.04.18. 10:58:56
  • _Atti_
    #95
    Jó kérdés amit feltettél szerintem mert megmutatja azt az oldalát ennek a gépgenerálási metódusnak amit a nagy ámulásban nehéz kicsit észrevenni, hogy ezeknek az AI-knak más 'fogalmaik' vannak mint nekünk.

    Mi persze az ő fogalmaikat nevesítjük a mi fogalmainkhoz de van köztük egy rés amit a tanítási módszerek fejlesztésével és még több adattal igyekeznek rövidebbre húzni, de szerintem mindig létezni fog.

    Amiben tényleg szuper az 'AI' képgenerálás hogy teljesen új képet hoz létre. Amikor rajzol egy híres figurát egy híres épület előtt, olyankor nem 'összefotosoppolja' azokat megkeresett képdarabokból, hanem tényleg nulláról varázsolja elő egy x*z méretű zajfelhőből.
    (Sajnos ebből van a baj mert még egy photoshoppolt kép lebukhat a források felfedésével, addig egy generativ kép tényleg az első eredeti. Na persze ha hihetőek lennének meg tökéletesek de szerencsére annyira azért nem azok és talán nem is lesznek.)

    A generáláshoz mindenesetre meg kell tanulnia megerősítésekkel hogy csinálhat olyan pixelzajt amit elfogadunk a hires figurának és olyan pixelzajt amit elfogadunk a hires épületnek, meg ugy összességében hogy elfogadjuk hihető 'kép'nek.
    Azt, hogy az egyes elemek vagy az összkép 'megértése', a létrejött modell, egészen pontosan mit takar, az tudtommal nagyonnagyrészt megfejthetetlen számunkra, azon tul amit a különböző osztályozó algoritmusokkal 'irányítunk'.

    A kapott eredményekből ítélve valószűleg egy részelem 'megértésekor' nem ugyanolyan struktúrában rendeződik a modell, mint ahogy azt mi értelmeznénk. (hozzátéve hogy a mi megértésünk struktúráiról sincsen különösen definitívnek mondható teóriánk).
    Szokás az AI neurális hálók tanítását az evolúciónkhoz hasonlítani, azért a komplexitás nem elhanyagolható, hisz a földi élet annyira sok dinamikus környezeti tényező ölelésében alakult hogy lehetetlennek tartom hogy a mi, és egy MI koncepcióképzése akár köszönőviszonyban is lehessen.
    Persze lehet szuper hatékony meg hasznos, csak a folyamatok teljesen mások.

    Pl ez a kép a dall-e kezdőlapjáról amit letöltöttem. Egy eleme egy rajzolt nap: Link (a fekete kört én huztam rá)
    Amikor a kontúr megszakad máshol folytatódik, kicsit szétesik, nem nehéz kitalálni hogy arra van 'esze' hogyan hitesse el hogy ez egy kör ami egy íven húzódik, valójában ennek a modellnek nem sok köze lehet ahhoz hogy mi mit gondolunk egy körről,vagy hogyan rajzolnánk (hogy az egy folytonos vonal egy középpont körül egyenlő távolságra stb.)
    ugyanigy utánozhat lendületességet de annak semmi köze a lendülethez, az eszközhasználat sajátosságaihoz.
    De még a digitális világban maradva is, valószinűleg az hogy egy Ait betanitsunk hogy mondjuk nyisson meg egy PS-t és az ottani eszközökkel manipuláljon képet az roppant erőforrás igényes lenne. (És valószinűleg először azt a trükköt használná hogy már legenerált képet ugymond 'brush-nyomtasson' a szoftverrel)

    Végtére azt gondolom hogy modellhű hadieszközökről készíthetnének neked ugyan képet ezek a programok elvben, de nem igazán vannak ehhez kiképezve, illetve ahogy írtad ez nagyon sok spéci fogalom modellezését igényelné aminek a pontosságát valószínűleg dollárszázezrek belefektetése után is eléggé akarnod kéne elhinned.
    Szerintem olyanokról meg álmodni se lehet ezzel a generálási módszerrel hogy pl egy modell részméreteiben megbízhass, még két szárny hosszának egyezése a 'perspektivából' fotogrammetriával ellenőrizve is szerintem scifi.
    Ebben még nagyon sokáig jobban jársz ha találsz egy nagyjából jo 3d modellt, bepózolod egy egyszerűbb real time rendermotorba és nyomsz egy screenshotot..:)
    Utoljára szerkesztette: _Atti_, 2023.04.17. 23:10:20
  • Montanosz
    #93
  • militavia
    #92
    Ezt melyik tudja amúgy?
    Én annak is örülnék, ha képes lenne az MI megérteni, hogy mutatok egy eszközt, mutatok egy effektust és kombinálja össze a kettőt.
    De hát erről szó nincs úgy látom.
  • Montanosz
    #92
    végül is akkor használhatnád, az is már AI működik azt a progit hogy beviszel egy képet a tankrol, csinál egy 3d-s drotvázat és lemodellezi ahogy akarod 3d be és akár körbe is járhatod vagy beleülhetsz :-)
  • Montanosz
    #91
    ez olyan mint a könyvírás, most az ujdonség miatt megvannak ijedve hogy a chatgpt írja majd a könyveket, valojában nem kell félni mert csak sablonok alapján tud dolgozni amit talál a neten. lelke sosem lesz amit egy jó író könyvét fel leheseen ismerni, lektorálásra nagyon jó vagy hogy rosz magyarsággal megirt sztorit ékes angol nyelvvé varázsolja egy parafázis altt...de ha konkrétan könyvirásra akarnád használni annyi időbetelne mire kisakkozoza mit szeretnél hogy annyi idő alatt én is megirom

    ez vonatkozik rád is, lehet kétnapi kinlodás után megcsinálná amit szeretnél de addigra te is megcsinálod mert gondolatot vagy elképzelt vizuális képet nem tud megjeleniteni még
  • Montanosz
    #90
    a bing képek, persze nem is hiszem hogy műszaki rajzokra van, hanem arra hogy egy táncoló majom üljön egy kopasz ficko fején...na az biztos jo kép lesz :-D
  • militavia
    #89
    Szóval én azt látom, hogy ez még mindig egy érdekes hobbi játékszer és nagyon LQ művészet a fogalmatlanoknak, ha nem számít, hogy mennyire van közel a koncepcióhoz a rajz, csak random nézzen ki jól.

    Arra képtelen, amire igazából egy grafikust kell megfizetni...
  • militavia
    #88
    Nah, a gunfire szót és a fát már érti. De full random harckocsikat rajzol, a torony hol innen, hol onnan, a futógörgők stb. A gunfire sem így néz ki, betette egy random effektet értelem nélkül.

    Ez melyik rajzoló amúgy?

    A fő probléma, hogy fogalmakat nem ért a cucc. Kéne neki egy másik MI, ami érti, hogy mi a T-55, mi az AMX-13 és mi az M1 Abrams és nem ezeket mixelné.

    Én továbbra sem érzem azt, hogy ettől egy grafikusnak be kéne tojnia.
    Egy viszonylag alap koncepció képnek is annyi paramétere van, hogy esélye nincs az MI-nek lerajzolni azt, amire gondolok. Még kb. sem, nemhogy pontosan.

    És akkor még csak fesetegetés / ceruzarajz max. amit tud.

    Ha azt kérném, hogy létező dolgokról csináljon wireframe-t 3D modell nélkül?
    Ezeket én a full noob is megtudtam csinálni és azóta sokkal többet.

    Utoljára szerkesztette: militavia, 2023.04.13. 10:51:38
  • Montanosz
    #87
    értem, pár proba




    Utoljára szerkesztette: Montanosz, 2023.04.13. 10:32:57
  • militavia
    #86
    De azt is megtudom mutatni, hogy más által csontig felszopott képekkel mi a hiba...
  • militavia
    #85
    Mi lenne a feladat?

    Legyen ott a kard, ahol a rajzon és a megfelelő irányba álljon.
    Stimmeljen a haj színe és stílusa.
    Legyen a tőr jó helyen. A tőr markolata is stimmeljen.
    Legyen a csuklópánt rajta.
    A csizma színe és karimája is ott legyen.
    A melle pont olyan szép kerek legyen, mitn a képen.
    A szeme színe legyen jó és nézzed az olvasóra. PONTSAN rá.
    De még tudnék rajta specifikálni ezt-azt, ami ezt a képet megkapóvá teszi és okkal néz ki úgy, ahogy.
    Ha majd ezt lemásolja legalább 70-80% featurrel, akkor OK.

    Egy átlagos grafikusnak ez whatever feladat. Az MJ meg nem tudott értelmezni EGYETLENEGY paramétert sem.

  • militavia
    #84
    De akkor legyen tényleg fantázia, római légiósnőt akartam páncélban, sisakban, hosszú hajjal.
    Hát öö, nem. :)

  • militavia
    #83
    Legyen akkor egy paplovag, aki kardjára támaszkodik oldalnézetben, fénylő páncéllal, felnyitott sisakrostéllyal.



    Akartam akkor egy sima lovagot piros palástban.

    A kardra támaszkodást nem írtam, magától hozta. Amikor előző rajznál kértem, akkor bezzeg nem értette...
    Arcot nem akar rajzolni, akárhogy erőltettem. A kezek nem működnek itt sem.
    Anatómiailag a bal és jobb kéz nem jó.
    Ha ez csak egy kis ikon egy NPC-nek, és, ha lenne arca, akkor tényleg OK.
    De bármelyik része közel van ahhoz, amit kértem? Hát, nagyon nem.

  • militavia
    #82
    De akkor legyen II vh téma is,

    Amerikai gyalogos rohamot akartam az erdőből ki.
    Még az irányt sem értette meg, embereket nem tud rajzolni, még egyenruha specifikusság nélkül sem.


    Mutass akkor amerikai lövészt, felszereléssel. Ez a finomított kép már...


    Mad Max környezetes Fox Mulder, ahogy fegyvert tart a kezédben badass módon?
    A jobb alsó kép mutatja azt, hogy fogalma nincs mit csinál. Mixel, agyatlanl. Az arforme se stimmel.
    Ha nem írnám oda itt, senki nem jönne rá kit ábrázol.

  • militavia
    #81
    Aztán akartam vele egy képet, akkor legyen random RPG átvezetőhöz, ami egy csatamezőt ábrázol, csata utánl.
    Halottak, csontok, holló, stb.

    Ez lett a vége, mert a battlefield szóról a játékra gondolt és nem valódi csatamezőre az egyiknél.
    De a többinél is élőhalottak rajzolt és nem holttesteke



    Második nekifutásra. A jobb alsó talán közel...
    ...lenne az egészhez, mikor beleírtam, hogy not dark és light.
    Jah, hogy témában olyan rajz ritka, ergo nem tudja mit kéne tennie.
    Csak másolni tud abból, ami van. Egy fantasy témában se tudta közelébe sem rajni annak, amit akartam.
  • militavia
    #80


    Szerinte ez F-15 Eagle. És ez nem az, hogy szarul paraméterezem.
    Nem kértem semmit. Rajzoljon le egy F-15 vadászgépet. Ennyi. Leszarom a hátteret, bármit. Nézzen ki első körben annak, ami az.
    Csak hét mivel nem érti...


    Itt M1 tank lövegével tüzelést akartam. Nem érti meg, a környeztre húzta rá a tüzelés, ez pedig már a második variáció.
    Az alapformát nem érti.


    Próbáljuk újra a gunfire szó, és tank, meg treeline. Kb. a treeline-t tudta értelmezni.


    Persze az égő városos kép, mint művészi impresszió a háborúról szép? Igen.
    Ezt akartam látni a képen? Nagyon nem...
  • Montanosz
    #79
    persze mutass egy-két példát
  • militavia
    #78
    Ha érdekel, megmutathatom, hogy én mire jutottam tavaly.
  • Montanosz
    #77
    értem már a problémádat, 100%-ban tényleg nem adja ki csak hasonlokat, ahány kép annyi m1 tank
  • militavia
    #76
    Igazából csak annyit, hogy kb. teljesen ranodm mit rajzol le, ha F-15 vadászgépet szeretnék és mondjuk egy SA-13-at és mindkettő indítson rakétát. Teljesen mindegy, hogy milyen környezetben, csak egyáltalán megérti-e ezt.

    Vagy egy T-72 / M1 Abrams tank tüzeljen a löveggel egy fa mellett állva. Nagyjából ezeket érdekelnek, hogy ilyen hóttegyszerű dolgora mit lép.

    Köszi. :)
    Utoljára szerkesztette: militavia, 2023.04.12. 14:11:17
  • Montanosz
    #75
    most már sok lehetőség van tavaly ota, először azokat probáld ki bluewillow (szintén discord de free), bing keresőben ez felturbozott dall-e2 ez is free, dreamstudio itt legujabb legujabb stablediffusion model a sdxl muzsikál ami hirtelen eszembejut
    de ha leirsz ide egy kb promtot mit szeretnél végig zongorázom és felrakom ide a képeket hagy pöröhjön a topik