Berta Sándor
Intelligensebb adatbázisok kellenek
A mesterséges intelligencia és a gépi tanulás fejlesztéséhez hatalmas adatmennyiség kell, de nagyon nem mindegy annak minősége.
Az adatok egyre fontosabb nyersanyaggá válnak a kutatás és a gazdaság számára. A mesterséges intelligencia a gépi tanuláson alapul, ez azt jelenti, hogy az algoritmusokat nagy adatmennyiségeken trenírozzák, azokban keresnek mintákat és törvényszerűségeket. Ez a konyhanyelven tanulásnak nevezett dolog kiválóan működik számos területen, például az egészségügyi képadatok elemzésekor (daganatok keresése röntgenfelvételeken) vagy a műholdas felvételek tanulmányozásakor. A kutatás területén sok fontosnak számító technika van a DNS-elemzéstől az elektronmikroszkópos vizsgálatokig és ezeknél szükség van a hatalmas adatmennyiségek hatékony kezelésére. Éppen ezért kell az adatbázisoknak is intelligensebbé válniuk, hogy lehetővé tegyék a komplexebb adatlekérdezéseket.
Reinhard Pichler professzor, a Bécsi Műszaki Egyetem Logikai és Számítástechnikai Intézetének munkatársa, a szakterületének az adatbázisok és a mesterséges intelligencia számítanak. Csoportja kutatásainak középpontjában az információintegráció áll. A szakember kifejtette, hogy számos vállalatnak az a problémája, hogy az adataikat heterogén forrásokban, különböző módokon szervezett adatbázisokban tárolják. Amennyiben lekérdeznék vagy összesítik az ezekből a heterogén adatbázisokból származó információkat, akkor könnyen következetlenségek valósulhatnak meg. Például hogyan kell eljárni akkor, ha két különböző kórház adatait összesítik? Mindez jelenleg egy nagyon fontos kutatási terület az adatbázis-közösségben.
Amennyiben valaki nagy adatmennyiségeket kezel, akkor néha fel kell adnia azt a célt, hogy megtalálhatja a tökéletes választ egy bizonyos kérdésre. Gyakran csak akkor érhető el a szükséges adatfeldolgozási sebesség és hatékonyság, ha ehelyett inkább arra összpontosítanak a szakemberek, hogy egy észszerű megoldást találjanak. Éppen emiatt egyre fontosabb szerepet játszanak például a statisztikai módszerek. Tehát a cél nem csupán az, hogy az algoritmusok alkalmazási területét szélesítsék és azok hatékonyságán javítsanak, hanem az is, hogy azok használhatóbbak legyenek az elemzők számára azért, hogy racionálisabb döntések születhessenek.
Az adatok egyre fontosabb nyersanyaggá válnak a kutatás és a gazdaság számára. A mesterséges intelligencia a gépi tanuláson alapul, ez azt jelenti, hogy az algoritmusokat nagy adatmennyiségeken trenírozzák, azokban keresnek mintákat és törvényszerűségeket. Ez a konyhanyelven tanulásnak nevezett dolog kiválóan működik számos területen, például az egészségügyi képadatok elemzésekor (daganatok keresése röntgenfelvételeken) vagy a műholdas felvételek tanulmányozásakor. A kutatás területén sok fontosnak számító technika van a DNS-elemzéstől az elektronmikroszkópos vizsgálatokig és ezeknél szükség van a hatalmas adatmennyiségek hatékony kezelésére. Éppen ezért kell az adatbázisoknak is intelligensebbé válniuk, hogy lehetővé tegyék a komplexebb adatlekérdezéseket.
Reinhard Pichler professzor, a Bécsi Műszaki Egyetem Logikai és Számítástechnikai Intézetének munkatársa, a szakterületének az adatbázisok és a mesterséges intelligencia számítanak. Csoportja kutatásainak középpontjában az információintegráció áll. A szakember kifejtette, hogy számos vállalatnak az a problémája, hogy az adataikat heterogén forrásokban, különböző módokon szervezett adatbázisokban tárolják. Amennyiben lekérdeznék vagy összesítik az ezekből a heterogén adatbázisokból származó információkat, akkor könnyen következetlenségek valósulhatnak meg. Például hogyan kell eljárni akkor, ha két különböző kórház adatait összesítik? Mindez jelenleg egy nagyon fontos kutatási terület az adatbázis-közösségben.
Amennyiben valaki nagy adatmennyiségeket kezel, akkor néha fel kell adnia azt a célt, hogy megtalálhatja a tökéletes választ egy bizonyos kérdésre. Gyakran csak akkor érhető el a szükséges adatfeldolgozási sebesség és hatékonyság, ha ehelyett inkább arra összpontosítanak a szakemberek, hogy egy észszerű megoldást találjanak. Éppen emiatt egyre fontosabb szerepet játszanak például a statisztikai módszerek. Tehát a cél nem csupán az, hogy az algoritmusok alkalmazási területét szélesítsék és azok hatékonyságán javítsanak, hanem az is, hogy azok használhatóbbak legyenek az elemzők számára azért, hogy racionálisabb döntések születhessenek.