Înainte de a interpreta datele, trebuie să știm ce prind acestea și ce le scapă, iar pentru asta trebuie să cunoaștem modul de funcțonare al instrumentelor de web analytics.
Colectarea datelor din site se face de pe server sau prin intermediul unui tag inserat în fiecare pagină web a site-ului. Acesta este și criteriul care împarte soluțiile web analytics în două categorii. Nu sunt singurele tipuri, dar sunt de departe cele mai utilizate. De notat că niciuna dintre cele două soluții nu este perfectă, ele completându-se reciproc, motiv pentru care de multe ori sunt folosite în tandem un instrument pe server și unul cu tag în site.
Analiza log-urilor de pe server
În trecut era cea mai utilizată metodă, însă și astăzi se întâlnesc destul de des astfel de soluții (AWStats și Webalizer sunt încă populare). Funcționează analizând log-urile de pe server, indiferent de browser-ul vizitatorului.
Avantaje
- Poate măsura statistici pentru toate tipurile de fișiere (de ex. descărcări de PDF)
- Nu este oprit de firewall
- Poate măsura traficul de date
- Poate oricând (re)analiza datele din trecut
- Nu are probleme cu vizitele de pe mobile
Dezavantaje
- Probleme cu paginile aflate in cache, pe care nu le poate măsura
- Nu măsoară interacțiunea javascript, flash, inserturi tip web 2.0
- Nevoie de hardware
Aceste soluții măsoară și traficul realizat de roboți, ceea ce este un avantaj (având o informație în plus), dar și un dezavantaj (de multe ori ei sunt adăugați vizitatorilor umani).
Analiza prin tag în pagini
Colectează date din browser-ul vizitatorului prin tag-ul inserat în pagini. De regulă este folosit un cod javascript. Aceste soluții sunt mai populare în prezent, fiind oferite inclusiv de Google și Yahoo!.
Avantaje
- Filtre mai bune pentru date
- Colectarea datelor chiar dacă se folosesc cache și proxy
- Colectarea datelor client-side (javascript, html…)
- Update-urile și întreținerea tehnică sunt în grija furnizorului
- Stocarea și interpretarea datelor folosesc resursele furnizorului
Dezavantaje
- Probleme cu firewall-urile
- Nu obțin date precum traficul efectuat sau download-uri complete
- Nu raportează activitatea roboților
- Dacă nu este setat corect, datele pur și simplu lipsesc