SG.hu·

Siri AI néven született újjá az Apple hangasszisztense

Siri AI néven született újjá az Apple hangasszisztense
A Google Gemini technológiájára épülő fejlesztés új szintre emeli a Siri képességeit az e mailek kezelésétől a képernyő és a környezet értelmezéséig.

Az Apple a Worldwide Developers Conference előre felvett nyitóelőadásán végre eljutott oda, hogy teljes egészében bemutassa a Siri hangasszisztens számára régóta késlekedő „Apple Intelligence” frissítést. Az új „Siri AI”, amelyet most az „idén ősszel” érkező operációs rendszerfrissítésekkel ígérnek, az Apple eszközön futó Foundation Models modelljeinek új, Google által támogatott frissítésével együtt érkezik, valamint azzal, hogy ezek az MI-képességek sokkal szorosabban integrálódnak az Apple számos operációs rendszerébe. Miközben más vállalatok „úgy tűnnek, mintha előre rohannának, látszólag önmagáért az MI-ért hajszolva az MI-t, kevés figyelmet fordítva azokra az emberekre, akiket szolgálnia kellene” - mondta Craig Federighi, az Apple szoftverfejlesztésért felelős alelnöke -, „mi úgy hisszük, hogy az igazán hasznos MI-nek rád és az igényeidre kell összpontosítania”.

A vállalat ezt a szemléletet egy sor előre megírt, beszélgetésszerű Siri AI bemutatóval szemléltette. Ezekben a példákban a kimondott kérdések és Siri válaszai között több másodperces, látszólag vágatlan szünetek is szerepeltek. A bemutatók során az Apple vezetői megmutatták, hogyan vált a Siri AI különböző használati módok és alkalmazásokhoz kapcsolódó feladatok között, hogy érzékeltesse, az Apple Intelligence immár „jóval túlmutat az egyszeri feladatokon”, és egy „teljesen új beszélgetési élményt” kínál a virtuális asszisztenssel.

Az egyik példában a felhasználó a labdarúgó-világbajnokság menetrendjéről érdeklődött, majd olyan recepteket kért, amelyek egy Brazília-Marokkó mérkőzés ihletésére készülhetnének. Ezután egy olyan desszertről kérdezett, amelyről emlékezett, hogy barátja, Maria nemrég említést tett róla. A Siri ezt az Üzenetek alkalmazásban találta meg. Ezt követően a felhasználó arra kérte a Sirit, hogy mindezt egy közös meccsnéző összejövetel menüjévé állítsa össze, majd küldje el ezt a menüt a csoportos beszélgetésébe egy meghívóval együtt.

Egy másik bemutatóban a Siri-beszélgetés egy olyan kérdéssel indult, hogy hol készült egy boltívet ábrázoló fénykép, majd a feladat egy Jeff nevű barát címének felkutatására váltott, aki nemrég költözött el. Miután ezek az információk rendelkezésre álltak, Siri képes volt arra, hogy az Apple Térkép segítségével közvetlenül „útvonalat adjon a boltívhez, Jeffnél egy megállóval”, anélkül hogy a felhasználónak manuálisan kellett volna összekapcsolnia az adatokat.


Bár sok más MI-modell is képes hasonló feladatok végrehajtására, ezek és más bemutatók azt hangsúlyozták, hogy az Apple Intelligence és a Siri AI előnyét az jelenti, hogy szorosan integrálódik az eszközön tárolt adatok „személyes kontextusába”. Ez például azt jelenti, hogy Siri képes információkat keresni az üzenetek és az e-mailek között akkor is, ha a felhasználó már nem emlékszik arra, pontosan hol tárolta az adott információt. Ez azt is jelenti, hogy amikor a felhasználó e-mailt ír Siri segítségével, ez a „személyes kontextus” képes a szöveg stílusát a korábban ugyanannak a személynek küldött levelek hangvételéhez igazítani - közölte az Apple.

Az Apple szerint a Siri MI a „világról szerzett tudást” az interneten végzett keresések révén használja fel, amelyeket privát felhőalapú számítási infrastruktúra támogat, és ennek segítségével állít elő válaszokat. Emellett alkalmazásműveletekkel is integrálódik, hogy eldöntse, mely eszközöket kell használnia egy adott feladat végrehajtásához. Az eszközön futó asszisztens képernyőértelmezési képességekkel is rendelkezik, így a segítségnyújtást ahhoz tudja igazítani, amit a felhasználó éppen csinál. Az Apple kiemelte a Siri új „vizuális intelligenciáját” is, amely például közvetlenül a kameraalkalmazásból képes releváns válaszokat adni a kérdésekre, vagy akár egy koncertprogram összetett képéből több naptárbejegyzést is automatikusan kinyerni.

A VisionOS rendszerben a felhasználók közvetlenül kérdéseket tehetnek fel a környezetükben látható fizikai tárgyakról is, és válaszokat kaphatnak az Apple Intelligence-től. Eközben egy új „Write with Siri” funkció lehetővé teszi majd, hogy az Apple Intelligence segítségével „gyakorlatilag bárhol szöveget generálj, ahol gépelsz” - közölte a vállalat. Emellett egy új, MI-alapú automatikus lektoráló rendszer is érkezik, amely rendszer szinten ellenőrzi az írásstílust, hasonlóan a helyesírás-ellenőrzéshez.

MacOS alatt ezek az új Siri AI funkciók a Spotlight keresőbe integrálódnak. A rendszer képes lesz felismerni, amikor egy begépelt lekérdezésnek inkább egy Siri-beszélgetést kell elindítania, nem pedig csupán fájlok vagy webes találatok listáját megjelenítenie. A felhasználók az operációs rendszer bármely pontján a Ctrl billentyű lenyomása melletti kattintással kérdéseket tehetnek fel Sirinek fényképekről, fájlokról vagy szövegekről, sőt akár egyszerre több fájlról is. Akik továbbra is VisionOS-t használnak, azok egy világító, animált Siri-gömböt helyezhetnek el a munkaterületükön, amely bármikor válaszol a kérdésekre, amikor ránéznek. A Sirivel folytatott beszélgetések helyben, valamint az iCloudban is tárolódnak majd egy új, dedikált Siri alkalmazásban. Ez lehetővé teszi, hogy a felhasználó egy Apple-eszközön kezdjen el egy beszélgetést, majd egy másikon fejezze be azt.


Az Apple az év elején jelentette be, hogy több évre szóló megállapodást kötött a Google-lel, amelynek értelmében a Gemini modell szolgál majd a Siri frissítésének alapjául. A múlt hónapban azonban olyan hírek láttak napvilágot, amelyek szerint az Apple nehézségekbe ütközött, amikor a Gemini összes funkcióját teljes mértékben helyben futó eszközös modellekbe próbálta beépíteni. A WWDC rendezvényen az Apple bejelentette, hogy új, kétszintű struktúrát vezet be az eszközön futó Apple Intelligence szolgáltatásoknál. A vállalat „legerősebb modellje” ezentúl csak olyan eszközökön lesz elérhető, amelyek megfelelnek bizonyos chip- és memóriaelvárásoknak. Ezek a következők:
- iPhone Air és iPhone 17 Pro
- M4 vagy újabb processzorral, valamint legalább 12 GB memóriával rendelkező iPadek
- M3 vagy újabb chippel, valamint legalább 12 GB memóriával rendelkező Mac számítógépek

Azok a kevésbé erős eszközök, amelyek jelenleg támogatják az Apple Intelligence szolgáltatást, egy gyengébb modellt kapnak majd, amelyből néhány funkció hiányzik. Ezek közé tartozik például a Siri válaszaihoz tartozó új, kifejezőbb hang is. Ez a „kifejezőkészség” egy csúszkával szabályozható, a beszédtempót vezérlő beállítás mellett. A legerősebb modell emellett az Apple szerint jelentős javulást kínál a diktálási pontosság terén is, beleértve a jobb helyesírást és írásjelezést.

Az Apple Intelligence számos funkciója továbbra is a „privát felhőalapú számítási” szerverekre támaszkodik majd. Az olyan szolgáltatások azonban, mint a képgenerálás, napi használati korlátokhoz lesznek kötve, mivel ezek külső szerverek erőforrásait használják. Az Apple közlése szerint a legtöbb iCloud+ előfizetés előfizetői kibővített használati lehetőséget kapnak ezekhez a funkciókhoz. Az Apple ismét hangsúlyozta, hogy az új Apple Intelligence funkciókat olyan „alku tárgyát nem képezhető” adatvédelmi garanciákkal építették fel, amelyek biztosítják, hogy a Siri MI-vel folytatott beszélgetések sem az Apple, sem bárki más számára ne legyenek hozzáférhetők. Az új Siri MI funkciók kezdetben csak angol nyelven lesznek elérhetők, de idővel minden olyan nyelven megjelennek majd, amelyet az iOS támogat.

Kapcsolódó cikkek és linkek

Hozzászólások

Jelentkezz be a hozzászóláshoz.

Nem érkezett még hozzászólás. Legyél Te az első!