Sběr dat pro webovou analýzu

Každý nástroj poskytující webovou analýzu potřebuje získat data o webu, který má analyzovat. Metody sběru dat se u nástrojů mohou lišit. Je to důvod, proč se nedoporučuje srovnávat data mezi nástroji pro webovou analytiku, zejména pokud nástroje používají různé metody.
Martin Čech[1] uvádí čtyři základní metody a jednu metodu, která je kombinací základních metod.

Značkování stránek

Značkování stránek (Page Tagging) je metoda založená na principu vloženého sledovacího kódu (JavaScriptu), který je třeba umístit na každou sledovanou webovou stránku. Data jsou sbírána pomocí webového prohlížeče. Základem metody jsou soubory cookies vytvořené na straně návštěvníka. Tuto metodu využívá např. Google Analytics . Mezi výhody patří zejména vysoká míra přesnosti, sběr dat v reálném čase, snadná implementace. Nevýhodou je hlavně závislost na správné implementaci JavaScriptu (při nesprávné implementaci nedochází ke sběru dat) a vytváření souboru cookies, který uživatel může zakázat či vymazat.

Serverové logy

Serverové logy (Web Server Logfile) sbírají data na straně serveru. Logovací soubory jsou primárně určeny pro sběr technických dat. Jsou zde evidovány požadavky ze strany klienta. Tuto metodu využívá např. AWstats, ClickTracks. Mezi výhody patří možnost zpracování i starších dat, nenáročná implementace, vlastnictví dat na straně firmy či organizace. K nevýhodám lze zařadit nutnost vlastní archivace dat, menší množství dat o uživatelích a jejich chování a identifikaci návštěvníka pomocí IP adresy.

Měření tečkou

Měření tečkou (Web Beacons) je založeno na použití průhledného obrázku, jehož adresa vede na web třetí strany, který sleduje volání požadavku na obrázek. Součástí jsou i soubory cookies. Tuto metodu využívá např. TOPlist. K výhodám patří měření prohlížeče i počítače a rychlé zpracování dat. K nevýhodám patří možnost zakázat ze strany uživatele zobrazování obrázků a omezené možnosti měření.

Sledování packetů

Sledování packetů (Packet Sniffing) je metoda, která využívá evidence webového serveru o přenášených datech. Jde o shromažďování dat o webovém provozu. Výhodou je rychlost a komplexnost v dostupnosti dat. Nevýhodou je zejména cenová náročnost na provedení i implementaci.

Hybridní metoda

Hybridní metoda (Hybrid Method) je kombinace metody značkování stránek a serverových logů k eliminaci nedostatků. Využít lze také data ze sledování packetů.

Literatura a použité zdroje
1. ČECH, Martin. Nástroje webové analytiky. In: Inflow [online]. 2010, roč. 3, č. 6 [cit. 2014-03-01]. ISSN 1802–9736. Dostupné z: http://www.inflow.cz/nastroje-webove-analytiky
Není-li uvedeno jinak, obsah této stránky je pod licencí Creative Commons Attribution-ShareAlike 3.0 License