Adatvizualizáció

Az adatvizualizáció egy hatalmas csoport, amely szinte önálló területté nőtte ki magát. Hogy miért hasznos az adatokat vizualizálni, azt senkinek nem kell elmagyarázni annak, aki valamely természettudományi területtel foglalkozik. Mégis álljon itt egy igen szemléletes példa:

Hány darab 9-es szerepel a következő 4 sorban?

1457086636637364645474346347575436453642424362554456345644325469434394653645465345242541000042534542340532416734253483440423122438345343475395369064350684513834504368964976454616453185345743503514634676921462433465495240341324213216356181315818351863513824329462426291435043513469643246294624305341532942642643564038942535

Elég hosszadalmas dolog kibogarászni. Nézzük meg, hogy mennyivel könnyebb a következő esetben!

145708663663736464547434634757543645364242436255445634564432546 9 4343 9 46536454653452425410000425345423405324167342534834404231224383453434753 9 536 9 064350684513834504368 9 64 9 76454616453185345743503514634676 9 214624334654 9 524034132421321635618131581835186351382432 9 4624262 9 143504351346 9 6432462 9 4624305341532 9 42642643564038 9 42535

Nem tettünk mást, mint kivastagítottuk a 9-es számot, illetve eggyel nagyobb betűméretet állítottunk be, és szemünk máris könnyen kiszűri a számsorból. (Wiederkehr, 2011)

Napjainkban hatalmas mennyiségű adat áll rendelkezésünkre az élet legkülönbözőbb területeiről, de nagyon sokszor feldolgozatlan formában. Egyre több szakterület kezd azonban ráébredni arra, hogy az adatok megfelelő feldolgozásából számos előnyt lehet kovácsolni. Például a múzeumoknak fontos adat a látogatói szokások feltérképezése, egy egyetemnek a hallgatók száma és a legnépszerűbb szakok nyomon követése, vagy egy újságnak az olvasói szokások, a legolvasottabb cikkek követése. Az adatok több módszerrel is feldolgozhatóak, ezek közül az egyik igen hatékony a vizuális ábrázolás.

Adatokat sokféleképpen lehet vizualizálni, minden szakterületnek megvannak a saját adatvizualizációs technikái. Leggyakoribb példák a különböző diagramok.

17. ábra: Az adatvizualizáció típusai McCandless szerint (McCandless, 2010)

Az adatvizualizációval foglalkozó szakember legfontosabb aranyszabálya az, hogy meg kell találni az arányt a precíz adatmennyiség és a design között. Ha túl sok az illusztráció, akkor abban elveszhet az információ, ha viszont túl sok az adat, az olvasó nehezen értelmezi, amit lát, és éppen az illusztráció célja veszik el. (Wiederkehr, 2011)

18. ábra. Mire kell figyelni az adatvizualizáció során? (Wiederkehr, 2011 alapján)

A jó ábra készítéséhez fontos alaposan ismerni az adatot és érteni a mondanivaló lényegét, summázatát. Ez így elég banálisan hangzik, mégsem az. Nem elég venni egy számsort, valamilyen szempontból csoportosítani, majd felvinni egy grafikonra. Ismerni kell, hogy mit takarnak az adatok, tudni kell, mi a célunk az ábrával, milyen folyamatok vannak az adatok mögött, milyen viszonyok, mit lehet kiemelni, mit lehet elhagyni stb. Venni kell a fáradságot, hogy ha nem a saját adatsorunkról van is szó, legalább alapjaiban megértsük, miről is szólnak a számok. Enélkül az ábra nem lesz jó. (Cairo, 2012)

Ha már tudjuk, mi a cél, mit szeretnénk ábrázolni, átadni, megértetni, akkor meg kell találni azt az ábrázolási módot, ami a célnak leginkább megfelel. Érdemes kísérletezni, hiszen nem biztos, hogy az elsőre jónak tűnő megoldás a legjobb. Ugyanakkor, ha egy grafika öncélú, és semmi kapcsolata nincs az adatokkal, amit ábrázolni akar, akkor feleslegesen dolgoztunk, hiszen éppen az adatvizualizáció egyik kulcsösszetevőjét hagytuk figyelmen kívül. (Cairo, 2012)

Adatvizualizáció készítésekor figyeljünk arra, hogy az ábra minden fontos információt közöljön az olvasóval. Az ábra céljától függően fontos lehet megadni a méretarányt vagy megfelelő skálát. Szükség lehet még az irányultság jelzésére, jelmagyarázatra is. És nem csak a térképeknél! (Tufte, 2006)

19-20. ábra. Edward Tufte halas ábrája. (Tufte, 2006) A felső ábráról hiányzik a méretarány, illetve nem tudjuk, hogy a keresztmetszeti ábra a hal mely részét ábrázolja. Az alsó ábrán már mind a skála, mind a metszet helyét jelző kis vonalak szerepelnek. Főleg tudományos ábránál oda kell figyelni, hogy az ábra kellően precíz legyen.

Fontos szerepe van a színeknek is. Például, hogy valaminek az eredeti színeivel dolgozunk-e vagy a szín csak szimbolikus. Arra is figyelni kell, hogy bizonyos színek komoly jelentéssel rendelkeznek, ami kultúránként, szubkultúránként változhat. Például: ha egy grafikonon pirossal jelölünk valamit, könnyen előfordulhat, hogy egyesek valami problémát kezdenek keresni az adatok mögött, hiszen a piros gyakran a veszély jele. Ráadásul számos tudományterületen a színekhez, jelekhez már rögzült jelentések tartoznak (pl. geológiai szelvények, meteorológiai ciklonok). Ezekre is mindig figyelmet kell fordítani, hogy ne zavarjuk össze se a szakértő, se a laikus olvasót. (Weinschenk, 2011)

21-22. ábra. A különböző tudományterületeknek megvan a kialakult szín- és jelkulcsrendszere, legyen szó geológiai szelvényről vagy a ciklonok kialakulását magyarázó meteorológiai ábráról. ( http://fold1.ftt.uni-miskolc.hu/~foldshe/foldal10.htm ;http://mkweb.uni-pannon.hu/tudastar/ff/04-levego/Levegokornyezet.xhtml )