SG.hu
Még idén bekerül a Photoshopba a képgenerálási lehetőség
Az Adobe bejelentette, hogy azt tervezi, hogy még az idén elérhető lesz a Photoshop szoftverében a mesterséges intelligencia általi képgeneráló eszköze. A cég azt állítja, hogy az új képgenerálási modellje az eddigi legjobb, bétaverzióban már elérhetők a hátterek létrehozására, a részletek javítására és a referenciaképek használatára szolgáló új generatív MI-eszközök.
A társaság kép- és videószerkesztő eszközeit széles körben használják a kreatív szakemberek, de egyre nagyobb konkurenciát jelentenek számukra az olyan startupok, mint a Microsoft által támogatott OpenAI, a Midjourney és a Stability AI, amelyek mind olyan szolgáltatásokat kínálnak, amelyek szöveges utasításokból képesek képeket generálni. Az Adobe saját képgeneráló MI-rendszert fejleszt Firefly néven, amelyet olyan adatokon képeznek ki, amelyekhez a cég rendelkezik jogokkal, hogy elkerüljék a felhasználókkal szembeni szerzői jogi jogsértési igényeket. De a szakemberek körében általános vélemény, hogy a Firefly képgeneráló modellje hibás és gyenge, mivel hajlamos a végtagok és a tájképek torzítására, valamint a parancsok árnyalatainak elhagyására. Az Adobe a harmadik generációs modellel, a Firefly Image 3-mal próbálja helyrehozni a dolgokat, amelyet a vállalat Max London konferenciáján mutattak be.
Az Adobe korábban már kiadott olyan képgeneráló eszközöket, amelyek képesek kitölteni vagy kibővíteni egy meglévő kép részeit. Most a vállalat a londoni konferencián bejelentette, hogy a teljes képgenerálás még ebben az évben megjelenik. A modell bétaverzióban már használható a Photoshopban és az Adobe Firefly webes alkalmazásában. "Valósághűbb" képeket készít, mint elődei, köszönhetően annak, hogy képes megérteni a hosszabb, összetettebb felszólításokat és jeleneteket, valamint jobbak a megvilágítási és a szöveggenerálási képességei. Az Adobe szerint pontosabban jelenít meg olyan dolgokat, mint a tipográfia, az ikonográfia, a raszteres képek és a vonalképek, és "jelentősen" jobban képes a sűrű tömegek és az emberek "részletes vonásokkal" és "különféle hangulatokkal és kifejezésekkel" történő ábrázolására.
Az Adobe eddig is nagy hangsúlyt fektetett a szoftvereit használó szakemberek munkájának felgyorsítására. Az új képgeneráló eszköz képes lesz arra, hogy a felhasználó által feltöltött képet referenciaként használja majd a kép általános kompozíciójához. Például egy papírra felskiccelt ábrát elég lesz az okostelefonnal lefényképezni, majd megkérni a Photoshopot, hogy generáljon teljes értékű képeket különböző stílusokban - mondta Ely Greenfield, az Adobe digitális médiáért felelős technológiai igazgatója. "Ahelyett, hogy nagyon gondosan le kellene valakinek írnia, hogy pontosan mi hova tartozik, és megbizonyosodna arról, hogy minden kívánt dolog pontosan meg van adva, az is, amit nem akar, inkább a referenciából dolgozunk. Ez tehát egy elképesztően hatékony képesség" - mondta Greenfield.
Ellentmondásos, hogy az Adobe a Firefly modelleket MI által generált képeken képzi, amit egyesek az adatmosás egy formájának tartanak. Ráadásul az Adobe Stockban található, mesterséges intelligenciával generált képek nem kerülnek ki a Firefly képgeneráló modellek képzési adataiból, ami aggasztó abban a tekintetben, hogy ezek a képek tartalmazhatnak szerzői jogvédelem alatt álló anyagokat. Az Adobe megvédte a gyakorlatot, azt állítva, hogy az MI által generált képek csak kis részét teszik ki a képzési adatoknak, és moderálási folyamaton mennek keresztül, hogy biztosítsák, hogy nem ábrázolnak védjegyeket vagy felismerhető karaktereket, illetve nem hivatkoznak művészek nevére.
Az új motor számos új funkciót is támogat a Photoshopban. Az automatikus stilizálás kapcsoló lehetővé teszi, hogy a modell a színek, hátterek és alanyi pózok szélesebb skáláját generálja. Három új generatív eszköz van, a Háttér létrehozása, a Hasonló generálása és a Részletek javítása. A Generate Background (Háttér generálása) a hátteret egy generált háttérrel helyettesíti, amely beleolvad a meglévő képbe, míg a Generate Similar (Hasonló generálása) a fénykép egy kiválasztott része (például egy személy vagy egy tárgy) variációit kínálja. Ami az Enhance Detail funkciót illeti, ez "finomhangolja" a képeket az élesség és a tisztaság javítása érdekében. Ha ezek a funkciók ismerősek az azért van, mert a Firefly webes alkalmazásban bétaverzióban már legalább egy hónapja használhatók (a Midjourney pedig ennél jóval régebben tudja ezeket). Most debütálnak a Photoshopban - béta verzióban.
Ha már a webes alkalmazásnál tartunk, az Adobe nem hanyagolja el ezt az alternatív utat sem. A Firefly webes alkalmazás megkapja a Structure Reference és a Style Reference alkalmazást, amelyeket az Adobe a "kreatív irányítás továbbfejlesztése" új módjaként hirdet. (Mindkettőt márciusban jelentették be, de most válnak széles körben elérhetővé.) A Structure Reference segítségével a felhasználók olyan új képeket generálhatnak, amelyek megfelelnek egy referenciakép "szerkezetének", a Style Reference pedig más néven stílustranszfer, amely megőrzi egy kép tartalmát (pl. elefántok az afrikai szafarin), miközben egy célkép stílusát (pl. ceruzavázlat) utánozza.
Jelenleg a legolcsóbb Firefly prémium csomag havi 4,99 dollár - ezzel jóval olcsóbb az olyan versenytársaknál, mint a Midjourney (havi 10 dollár) és az OpenAI (amely egy havi 20 dolláros ChatGPT Plus előfizetés fejében kapja meg a DALL-E 3-at). Az Adobe közölte, hogy ez jelenleg változatlan marad ahogyan a cég MI által generált tartalmak vízjelezésével kapcsolatos megközelítése sem. A Content Credentials - az MI által generált média azonosítására szolgáló metaadatok - továbbra is automatikusan csatolva lesznek minden Firefly munkához mind a weben, mind a Photoshopban, függetlenül attól, hogy azokat a semmiből generálták, vagy csak részben szerkesztették a generatív funkciókkal.
A társaság kép- és videószerkesztő eszközeit széles körben használják a kreatív szakemberek, de egyre nagyobb konkurenciát jelentenek számukra az olyan startupok, mint a Microsoft által támogatott OpenAI, a Midjourney és a Stability AI, amelyek mind olyan szolgáltatásokat kínálnak, amelyek szöveges utasításokból képesek képeket generálni. Az Adobe saját képgeneráló MI-rendszert fejleszt Firefly néven, amelyet olyan adatokon képeznek ki, amelyekhez a cég rendelkezik jogokkal, hogy elkerüljék a felhasználókkal szembeni szerzői jogi jogsértési igényeket. De a szakemberek körében általános vélemény, hogy a Firefly képgeneráló modellje hibás és gyenge, mivel hajlamos a végtagok és a tájképek torzítására, valamint a parancsok árnyalatainak elhagyására. Az Adobe a harmadik generációs modellel, a Firefly Image 3-mal próbálja helyrehozni a dolgokat, amelyet a vállalat Max London konferenciáján mutattak be.
Az Adobe korábban már kiadott olyan képgeneráló eszközöket, amelyek képesek kitölteni vagy kibővíteni egy meglévő kép részeit. Most a vállalat a londoni konferencián bejelentette, hogy a teljes képgenerálás még ebben az évben megjelenik. A modell bétaverzióban már használható a Photoshopban és az Adobe Firefly webes alkalmazásában. "Valósághűbb" képeket készít, mint elődei, köszönhetően annak, hogy képes megérteni a hosszabb, összetettebb felszólításokat és jeleneteket, valamint jobbak a megvilágítási és a szöveggenerálási képességei. Az Adobe szerint pontosabban jelenít meg olyan dolgokat, mint a tipográfia, az ikonográfia, a raszteres képek és a vonalképek, és "jelentősen" jobban képes a sűrű tömegek és az emberek "részletes vonásokkal" és "különféle hangulatokkal és kifejezésekkel" történő ábrázolására.
Az Adobe eddig is nagy hangsúlyt fektetett a szoftvereit használó szakemberek munkájának felgyorsítására. Az új képgeneráló eszköz képes lesz arra, hogy a felhasználó által feltöltött képet referenciaként használja majd a kép általános kompozíciójához. Például egy papírra felskiccelt ábrát elég lesz az okostelefonnal lefényképezni, majd megkérni a Photoshopot, hogy generáljon teljes értékű képeket különböző stílusokban - mondta Ely Greenfield, az Adobe digitális médiáért felelős technológiai igazgatója. "Ahelyett, hogy nagyon gondosan le kellene valakinek írnia, hogy pontosan mi hova tartozik, és megbizonyosodna arról, hogy minden kívánt dolog pontosan meg van adva, az is, amit nem akar, inkább a referenciából dolgozunk. Ez tehát egy elképesztően hatékony képesség" - mondta Greenfield.
Ellentmondásos, hogy az Adobe a Firefly modelleket MI által generált képeken képzi, amit egyesek az adatmosás egy formájának tartanak. Ráadásul az Adobe Stockban található, mesterséges intelligenciával generált képek nem kerülnek ki a Firefly képgeneráló modellek képzési adataiból, ami aggasztó abban a tekintetben, hogy ezek a képek tartalmazhatnak szerzői jogvédelem alatt álló anyagokat. Az Adobe megvédte a gyakorlatot, azt állítva, hogy az MI által generált képek csak kis részét teszik ki a képzési adatoknak, és moderálási folyamaton mennek keresztül, hogy biztosítsák, hogy nem ábrázolnak védjegyeket vagy felismerhető karaktereket, illetve nem hivatkoznak művészek nevére.
Az új motor számos új funkciót is támogat a Photoshopban. Az automatikus stilizálás kapcsoló lehetővé teszi, hogy a modell a színek, hátterek és alanyi pózok szélesebb skáláját generálja. Három új generatív eszköz van, a Háttér létrehozása, a Hasonló generálása és a Részletek javítása. A Generate Background (Háttér generálása) a hátteret egy generált háttérrel helyettesíti, amely beleolvad a meglévő képbe, míg a Generate Similar (Hasonló generálása) a fénykép egy kiválasztott része (például egy személy vagy egy tárgy) variációit kínálja. Ami az Enhance Detail funkciót illeti, ez "finomhangolja" a képeket az élesség és a tisztaság javítása érdekében. Ha ezek a funkciók ismerősek az azért van, mert a Firefly webes alkalmazásban bétaverzióban már legalább egy hónapja használhatók (a Midjourney pedig ennél jóval régebben tudja ezeket). Most debütálnak a Photoshopban - béta verzióban.
Ha már a webes alkalmazásnál tartunk, az Adobe nem hanyagolja el ezt az alternatív utat sem. A Firefly webes alkalmazás megkapja a Structure Reference és a Style Reference alkalmazást, amelyeket az Adobe a "kreatív irányítás továbbfejlesztése" új módjaként hirdet. (Mindkettőt márciusban jelentették be, de most válnak széles körben elérhetővé.) A Structure Reference segítségével a felhasználók olyan új képeket generálhatnak, amelyek megfelelnek egy referenciakép "szerkezetének", a Style Reference pedig más néven stílustranszfer, amely megőrzi egy kép tartalmát (pl. elefántok az afrikai szafarin), miközben egy célkép stílusát (pl. ceruzavázlat) utánozza.
Jelenleg a legolcsóbb Firefly prémium csomag havi 4,99 dollár - ezzel jóval olcsóbb az olyan versenytársaknál, mint a Midjourney (havi 10 dollár) és az OpenAI (amely egy havi 20 dolláros ChatGPT Plus előfizetés fejében kapja meg a DALL-E 3-at). Az Adobe közölte, hogy ez jelenleg változatlan marad ahogyan a cég MI által generált tartalmak vízjelezésével kapcsolatos megközelítése sem. A Content Credentials - az MI által generált média azonosítására szolgáló metaadatok - továbbra is automatikusan csatolva lesznek minden Firefly munkához mind a weben, mind a Photoshopban, függetlenül attól, hogy azokat a semmiből generálták, vagy csak részben szerkesztették a generatív funkciókkal.