SG.hu

A részletesség határait feszegeti a Midjourney 6-os verziója

Fejlesztés alatt áll a Midjourney képgenerátor hatos verziója, amelynek alfa kiadását bárki kipróbálhatja. A téli szünet alatt a modell rajongói próbára tették az új MI tudását, és az eredményeket megosztották a közösségi médiában. A tesztelők a jelenleg alapértelmezett v5.2-es verzióhoz képest sokkal több részletet és másfajta megközelítést figyeltek meg a promptolásban. A 6-os verzió már szöveggenerálásra is képes, de messze nem éri el a vezető chatbotok színvonalát.

A Discordon tett bejelentésében David Holz, a Midjourney készítője ismertette a v6-os verzió változásait, amely szerint az sokkal érzékenyebben reagál az utasításokra. Nem kell a parancssorba írni olyan dolgokat, mint "díjnyertes, fotórealisztikus, 4k, 8k", hanem egyértelműen azt, amit az ember látni szeretne. "Ez határozottan vad frissítés, jó és kevésbé jó értelemben egyaránt" - mondta Julie Wieland művész, aki gyakran osztja meg Midjourney alkotásait az interneten. "A részletek és a táj őrületes, a hátránya, hogy az alkotások nagyon nagy kontrasztúak és túlságosan telítettek. Alkalmazkodni kell és át kell gondolni a parancsokat, új struktúrákat kell kitalálni, mert most a kevesebb több a prompt tekintetében."

A mesterséges intelligencia által generált részletek drámaian megugrottak a Midjourney főbb verziói során, így felmerülhet a kérdés, hogy létezik-e olyan, hogy "túl sok részlet" egy mesterséges intelligencia által generált képen. A Midjourney v6 úgy tűnik, hogy éppen ezt a kérdést teszteli, mivel sok olyan képet hoz létre, amelyek néha irreális módon részletesebbnek tűnnek a valóságnál. Az új modell néha rosszabb eredményeket produkál, mint a v5.2, de a Midjourney veteránok szerint ezek különbségek nagyrészt annak köszönhetőek, hogy a v6.0 másképp értelmezi a promptokat. Ezt a fejlesztők idővel folyamatosan frissítik. A Midjourney egy webes felületen is dolgozik, amely a jelenlegi, csak Discord-on elérhető alternatívája, és potenciális helyettesítője lesz. Az új felülettől azt várják, hogy a Midjourney közönségét szélesítse, mivel hozzáférhetőbbé teszi azt.

A többi elérhető MI képszintetizáló modellel összehasonlítva a Midjourney még mindig a fotórealizmus bajnoka, de a DALL-E 3 és a Stable Diffusion XL finomhangolt változatai nem sokkal maradnak le mögötte. A DALL-E 3-mal összehasonlítva a Midjourney v6 lemarad a prompt hűség kategóriában, ugyanakkor a v6 a v5.2-nél jobban kezeli a leíró jellegű promptokat. "A 6-os verzió egy kicsit természetesebb nyelvezetű, kevesebb kulcsszót kell használni hozzá" - mondja Wieland.




Abraham Lincoln számítógépet használva ül asztala előtt - felül a DALL-E 3, alul a Midjourney v6 alkotása

A technikai fejlesztések ellenére a Midjourney továbbra is erősen megosztó és ellentmondásos termék. A szolgáltatás kritikusai erősen nehezményezik, hogy a Midjourney a modelljeit az internetről származó és engedély nélkül megszerzett, ember alkotta műalkotások felhasználásával képzi ki. A közösségi médiában annak sem jó a híre, hogy a technológia képes szimulálni számos létező művész stílusát. A képgenerátor képzési adatállományában szereplő művészek és stílusok novemberben kerültek nyilvánosságra a Midjourney ellen indított szerzői jogi per során, mert a cég semmilyen módon nem ellentételezi az alkotók műveinek felhasználását.

Néhány mesterséges intelligencia-modellt gyártó vállalat - például az Adobe - ezeket a problémákat úgy igyekszik elkerülni, hogy modelljeit csak engedélyezett képeken képzi ki. A Midjourney erőssége azonban vitathatatlanul abban rejlik, hogy képes a szellemi tulajdonnal való gyors és laza játékra. Tagadhatatlanul olcsóbb ingyenesen letölteni a képzési adatokat az internetről, mint több százmillió képet licencelni. Amíg nem oldódik meg az ilyen típusú adatgyűjtés jogszerűsége, vagy a Midjourney nem alkalmaz más képzési megközelítést addig nem számít, hogy a Midjourney mennyire részletes vagy ügyes, az etikája továbbra is vitatott lesz.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • reptile1313 #13
    Nagyon oreg lehetsz, ha a helyesirason hisztizel hitspaces Crybaby.
  • Tetsuo #12
    Végül is, nem sikerült a kérdésemre válaszolnod, csak a saját stílusodban (rossz helyesírással) személyeskedsz - gratulálok.
  • militavia #11
    Pont fantasy marahságban lejt a pálya ezeknek a cuccoknak, mert abból van sok és jó minta. MINDENT azok stílusában akarnak rajzolni ezek az izék. De láthatólag ezen a téren is fogalmatlan vagy.
    Utoljára szerkesztette: militavia, 2024.01.10. 08:45:41
  • Tetsuo #10
    Az a női paplovag valami fantasymarhaság lehet. Ilyen esetben mit vársz? A valósághoz nem lehet köze, mást meg ne másoljon szervilisen...
  • militavia #9
    Kipróbálná nekem az alábbiakat valaki, aki használja ezt?

    Rajzoljon egy éjszaka F-15-ös vadászgépet, ami rakétát indít.

    Rajzoljon egy női paplovagot, ami egyik lábával sisakon áll, kardra dőlve támaszkodik, fekete copfos haja van és feléd néz. Legyen rajta szürkés páncél, ami láncing.

    Rajzoljon egy Sz-300 légvédelmi rendszert, ami rakétát indít napos időben egy zöld mezőn.

    Rajzoljon egy M1 Abrams harckocsi szakaszt, ami egy erdősáv felé tart és tüzel a löveggel.

    Nagyon kíváncsi vagyok, hogy mennyire lesz ostoba. Amikor utoljára próbáltam én és más használni, szokás szerint full hülységeket rajzolt...
  • dyra #8
    sokan venni fogják a fáradtságot. Rajzolni X év megtanulni egy gépet utasítgatni meg max 1 - 2 hónap.
  • halaszlo #7
    Bátyám grafikus és rengeteget használ AI-t. Nem mindenhez, de sok helyen. Kérdeztem, hogy nem lenne jobb ezeket kézzel csinálni? Azt mondta, hogy persze, meg tudná csinálni kézzel is, de majd hülye lenne pepecselni vele órákat, amikor az AI megcsinálja neki két perc alatt. Aki grafikust kér segítségül, az nem fogja venni a fáradtságot, hogy megtanulja a midjourney használatát. Szóval ehhez is érteni kell. Egy csomót kísérletezni, hogy rájöjj, hogy ne legyenek a képek gagyik.
  • Tetsuo #6
    Lehet, hogy már minden képet sőt a világot is AI generálja? Mindenesetre amit AI-val hirdetnek, mind rondák. Azt nem mondom, hogy biztosan felismerhetőek, de nem természetesen szépek, az látszik.
  • dyra #5
    újabb lépcső az elhülyüléshez. Minnél több melót vesznek át a gépek, annál hülyébbek leszünk.
  • AndReWsss #4
    Újabb lépcső az emberiség történetében.
    Festők kiakadtak a fotósokra a XX. sz. elején, majd a fotósok kiakadtak a designerekre a XX. sz. végén, most a designerek akadtak ki az AI-ra a XXI. sz. elején :)