Berta Sándor

3 éves gyerekre hasonlít a mesterséges intelligencia

Reálisan nézve vegyes az összkép a technológia megítélésében.

A Seeing AI nevű ingyenes szoftver megkönnyítheti a vakok mindennapjait, hiszen lehetővé teszi a számukra a környezet feltérképezését. Az alkalmazást a Microsoft kutatói fejlesztették ki és mesterséges intelligencia használatával ismer fel a kamerán keresztül objektumokat, majd hanggal tájékoztatja a vakokat arról, hogy mik vagy kik vannak a környezetükben. Felolvassa az étlapot és a recepteket, leírja a nyaralási fotókat és az illetőre rámosolygó embereket is jelzi. Ebből az okból a Seeing AI-t a Microsoft úgy is nevezte, mint "beszélő kamerát vakoknak". A jelenleg angol, francia, spanyol, holland, japán és német nyelven elérhető programért Saqib Shaikh, a Microsoft főfejlesztője felel. A szakember 7 évesen veszítette el a látását. A redmondi konszernnél részt vett a Bing és a Cortana fejlesztésében, most pedig azzal foglalkozik, hogy a mesterséges intelligencia miként könnyítheti meg a vizuális korlátozásokkal élő emberek életét.

"Hatalmas előrelépést értünk el a mesterséges intelligencia kutatásának területén, de még sok évre vagyunk attól, hogy a számítógépek körbenéznek és mindent megértenek, amit látnak. Én vak vagyok, ezért szívesen megyek a feleségemmel és a barátaimmal sétálni. Olyankor mindig arról beszélgetünk, hogy mit látnak. Elmondják, ha valami izgalmasat fedeznek fel vagy rákérdezek, ha nem tudok azonosítani egy zajt. Azt kívánom, hogy egy mesterséges intelligencia mindezt egy napon képes legyen átvenni, éppúgy, mint egy személyi asszisztens. Nagyon nehéz a jövőbe látni, ezért csak vadul tudok spekulálni. Nem tudom, hogy 2, 3, 4 vagy 5 évig tart-e majd ez a folyamat, ugyanis annyi minden történik ezen a területen. Minden évben van egyrészt számos előrelépés, másrészt rendkívül nagy kihívások is akadnak. Még mindig nagyon nehéz például egy mesterséges intelligencia számára azt felismerni, hogy az emberek pontosan mit csinálnak egy bizonyos helyzetben" - ecsetelte Saqib Shaikh.


A fejlesztő hozzátette, hogy amiben a mesterséges intelligencia már most is nagyon jó, az a világosan meghatározott feladatok elvégzésének átvétele az emberektől. A technológia ezt az elmúlt években tanulta meg. A képeket és a beszédet egyre jobban ismeri fel, a mesterséges intelligencia ezeken a területeken a legfejlettebb. E technikának köszönhetően tud például a Seeing AI képeket felismerni. Ugyanakkor a mesterséges intelligenciát úgy kell elképzelni, mint egy 3 éves gyereket. Az ember megmutat számos fotót és közli, hogy ez egy autó, ez egy fa, ez egy kutya. Eleinte a gyerek is csak olyan dolgokat ismer fel, amelyeket már korábban látott. Később ezeket a dolgokat kezdi mondatokban leírni. A gyerekhez hasonlóan - idővel - a mesterséges intelligencia is egyre jobb lesz. Tudósok emellett azon dolgoznak, hogy a képzési módszerek egyre jobbak legyenek.

"Számos funkció még nagyon kísérleti. Ennek ellenére a felhasználóknak meg akarjuk adni a lehetőséget arra, hogy a lehető leghamarabb használhassák az új fejlesztésű Microsoft-technológiákat. Profitálunk abból, hogy az emberek elmondják, hogy mit gondolnak az egyes funkciókról. Az alkalmazást az ügyfeleinkkel közösen fejlesztjük. Néhányuk számára a szoftvernek nem kell tökéletesnek lennie. Sokkal fontosabb az, hogy hasznos segítő legyen" - közölte a szakember.

Saqib Shaikh végül leszögezte, hogy a mesterséges intelligenciában nagyon sok lehetőséget látnak arra, hogy a Seeing AI segítségével javítsanak elsősorban a látásromlással küzdő emberek életén. De a kollégáik készítenek eszközöket a nagyothallóknak is, hogy a feliratokat valós időben lehessen megmutatni. Emellett vannak olyan megoldások, mint például az Eye Gaze, amelynél szemmozgásokkal lehet a Windows operációs rendszert futtató PC-t vezérelni.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Tetsuo #15
    Dehogyis. Azok algoritmusok alapján jönnek elő, semmi különleges nincs benne.
  • dyra #14
    Nem tudom miért akarsz hasonlatot tenni oda nincs. Az ember akkor is megtanulja mi a kutya ha soha senki nem mondja vagy mutat róla neki képet elég ha ismétlődve néha néha lát egyet (az hogy a fejében nem a te általad azonosított kutyaképpel azonosítja a végeredmény szempontjából teljesen mind1). A számítógépnek meg ezrével pakolhatod a kutyás képeket pont azért mert nem talál összefüggéseket.
  • dyra #13
    "ahol az olyan osszefuggeseket talal, amikre mi emberek (a programozok) soha nem is gondoltak"

    Példát kérlek. Az időjárást KB két hétre tudjuk előrejelezni nagyjából. A BIG data kb ott tart, hogy a strukturált adatokban megtalálja azokat az összefüggéseket amit kerestetnek vele. Erre nyilvánvalóan nem képes az emberi agy olyan hatékonyan.

    Ha strukturálatlan adattal dobod meg teljesen hasztalan hacsak nem írtál előtte egy algoritmust ami képes a strukturálatlan adatból valamit is kihámozni.
  • Sequoyah #12
    A gépi tanulás is azon múlik mennyi adattal rendelkezel.

    ...ahogy az emberi tanulas is. A fiamnak is jonehany kutyat meg kellett mutatni mire nem keverte ossze a macskaval es a nyuszival... Ugyan az az elv, csak a mesterseges egyelore sokkal kezdetlegesebb, es mivel a neuralis halo az szoftveres es nem hardveres mint az agy, sokkal kevesbe hatekony.
  • Sequoyah #11
    Dehogynem talal. A Big Data azert is van robbanasszeru novekedesben, mert a mai modern technologiakkal raereszthetjuk a mesterseges intelligenciat egy nagy adatbazisra, ahol az olyan osszefuggeseket talal, amikre mi emberek (a programozok) soha nem is gondoltak.
    Ez ellentetben all a klasszikus modszerrel, ahol a szamitogepnek meg kellett mondani hogy mit keresunk, pl SQL nyelven.

    Ez nem elmelet, hanem a gyakorlatban mar evek ota mukodik. Lasd pl IBM Watson.
    Az Amazonnak es a Facebooknak is emiatt lett hiretelen olyan ertekesek a felhasznalok adatai...
  • dyra #10
    Tudsz mondani példát? Egyenlőre amit látunk, hogy sok adatból (nagyon sok adatból) képes sokkalta gyorsabban eredményt kimutatni mint az ember. Ezen alapszik a GO GO a MR felvételek elemzése és még sok minden más. A gépi tanulás is azon múlik mennyi adattal rendelkezel.

    Összefüggéseket nem tud felmutatni mert nem képes összefüggéseket találni. Ellenben a sok sok adatból a gépi tanulás útján sokkal jobb bizonyos feladatokban mint az ember de összefüggéseket szerintem még nem talált (megjegyzem addig jó nekünk utána jön a Skynet aztán csá).
  • Sequoyah #9
    Udv 1990-ben...

    Jah varj, most mar 2019 van, es szamos olyan piacon levot termek van mar, amiben a mesterseges intelligencia kepes kitalalni ujszeru, eddig ismeretlen dolgokat. Peldaul olyan mintakat es osszefuggeseket talalni, amikre az ember soha nem is gondolt.
    Az hogy te teljesen hulye vagy a temahoz es meg nem hallottal ezekrol, az nem azt jelenti hogy nem is leteznek.

    A mesterseges intelligencia egyaltalan nem "csak" turkal a hattertarban. Az MI mintakat probal felismerni, epp ugy mint ahogy az agy is csinalja. Persze meg messze nem olyan hatekony ebben mint az agy, de a mukdesenek az alapjai pontosan ugyanazok.
  • Zoltan1984 #8
    Egy ora alatt kb 100000 szer lathatja.
  • barret #7
    Szerintem az,hogy önállóan képes kitalálni újszerű,eddig ismeretlen dolgokat.Ezt egy gép sosem fogja megoldani önerőből. A gép csak turkál a háttértárban...
  • ostoros #6
    Jó lesz az egy évesnek is.