Tech hvg.hu 2013. március. 03. 21:10

Adatrobbanás a NAV-nál

Az IBM által szervezett Storage Fórum 2013 kerekasztal-beszélgetésén állami intézmények és gazdasági társaságok döntéshozói azokról a konkrét lépésekről beszéltek, amelyeket szervezeteik a nagy adattömegek feldolgozásában most tesznek meg. A NAV-nál drasztikusan begyorsult az új adatok felhalmozódása.

Vágújhelyi Ferenc, a NAV informatikai szakfőigazgatója szerint az adatrobbanás mértékét jól érzékelteti, hogy az adóhatóságnál 1988 és 2000 között összesen gyűlt össze annyi adat, mint a legutóbbi négy hónapban. A feldolgozás már jórészt online folyamat, az évi 80 millió ügyből csak másfél milliót intéznek papíralapon.

A szakértő megerősítette az IBM kutatója, Robyn Schwartz trendjelzését a szingularizáció ügyében. Ma már a NAV sem csak aggregált adatokkal dolgozik, hanem a tételes ÁFA esetében például atomizált, nagyszámú eseményekkel is. (A beérkező adatmennyiség a pénztárgépek bekötése miatt hamarosan nagyságrendekkel megugrik majd.) A beszerzett petabájtos tároló mellett ehhez pedig egyre bonyolultabb matematikai modellekre, elemzőképességekre van szükség.

Összeköttetések

A tavalyi év nagy hazai Big Data történetét Kerékgyártó Sándor, az Educatio ügyvezető igazgatója mutatta be. A magyar népszámlálás 11,4 millió kitöltött kérdőívét ugyanis az Educatio dolgozta fel a KSH számára. A továbblépés lehetősége az adatbázisok összekötésében rejlik. Például a felsőoktatásban végzettek elhelyezkedését figyelő, az Educatio által kezelt diplomás pályakövető rendszer még csak a NAV és az OEP adatbázisaival van összekötve, de ha a foglalkoztatási hivatal adatbázisával is összekapcsolódna, akkor a rendszer nem csak regisztrálni tudná, de munkalehetőséget is ajánlana.

Bóday Tamás, a Vodafone szakértője az IBM és a mobilszolgáltató közös pilot-projektjéről beszélt. Egy sikeres isztambuli Big Data együttműködés nyomán a két cég most Győrben is elkezdte feldolgozni a mobilhasználók anonimizált cellainformációit. A geolokáció segít pontosan rekonstruálni honnan hová, mikor és hogyan mozognak az emberek a városban, és így abban is, milyen minták alapján kerülhet sor a közlekedési rendszer optimalizációjára. Eredmények egy éven belül várhatók.