După ce luna trecută am scris despre cum grupăm paginile asemănătoare în rapoartele GA, excluzând o parte din URL, și după articolele despre diverse tipuri de triggere din GTM (Form Submission Trigger și Trigger Group), continui seria articolelor cu sfaturi practice și ușor de aplicat cu un articol despre excluderea adreselor de email din rapoarte, cu ajutorul GTM.
Google Analytics a interzis întotdeauna colectarea informațiilor personalizate cu ajutorul acestui instrument. Reguli asemănătoare au și alte servicii de analiză web. De când cu GDPR, regulile sunt și mai stricte. Mulți interpretează reglementarea europeană ca interzicând mai mult decât apariția informațiilor personale în rapoarte. Informațiile care pot identifica utilizatorii nu trebuie să fie trimise spre aceste servicii, fiind vorba despre alte companii la care ajung datele.
Despre GDPR publicam în urmă cu un aproximativ un an un articol scris de Sorin Amzu (guest post), cu setările de bază care trebuie făcute de toată lumea în conturile de GAanalytics, GTM, Google Ads și Hotjar. Este un început, dar în unele cazuri este insuficient, fiind nevoie și de configurări personalizate De aceea, luna trecută când am scris de lansarea Trigger Groups în Google Tag Manager am menționat că acestea pot fi folosite pentru a respecta regmenetările GDPR privind acordul personal. Tot de aceea, continui și cu publicarea acestui articol.
Prin informații care pot identifica utilizatorii întețegem adrese de email, adrese fizice, numere de telefon, adrese IP, numele de utilizator, alte coduri personale (precum CNP) și diverse informații sensibile (despre înfățișare, preferințe personale, informații medicale etc.). De departe, site-urile au cele mai multe probleme cu adresele de email, care sunt folosite de multe ori și ca identificator unic, motiv pentru care apar și în URL-uri.
Altfel spus, filtrele puse în vizualizările de Google Analytics nu sunt suficiente, pentru că informațiile respective sunt oricum trimise către Google! În plus, din proprie experiență pot spune că aceste filtre mai dau și greș, o mică parte din informațiile care trebuie filtrate ajungând în continuare în rapoarte.
Desigur, cel mai bine ar fi să nu folosim informațiile respective în URL-uri, dar tot din experiență știm că aceste lucruri se întâmplă în unele cazuri și ar fi foarte scump să fie schimbate.
Identificarea adreselor de email în Tag Manager
În situația în care nu poate fi modificată aplicația, pentru a nu mai folosi adrese de email în URL, și când nici filtrele din GA nu sunt suficiente, ne rămâne varianta de a exclude cu totul respectivele pageviews din GTM, adică să nu mai acționăm tag-urile de tracking în aceste cazuri. Așadar, aplicăm această soluție după ce am aplicat filtrul pe profil și am văzut că încă ne-au mai rămas câteva sesiuni cu probleme.
În RegEx putem scrie o regulă care să identifice de câte ori apare semnul @ sau echivanetul lui în ascii, %40. Încercăm să excludem cât mai puține pageviews, pentru a afecta cât mai puțin datele colectate, așa că vom pune mai multe reguli într-un RegEx, pentru a ne asigura că vom exclude doar ceea ce conține o adresă de email. Regula exemplificată aici va căuta parametrul ?email= sau &email=, urmat de adresa de email. Desigur, acesta poate fi schimbat cu ce folosește fiecare site.
Așadar, în regula RexEx care va căuta acest tipar este (\?|&).*email=.*(@|%40)
. Se poate merge și mai departe, de exemplu prin a pune condiții ca după @ să avem .com sau .ro, dar dacă nu este neapărat nevoie, prefer să nu complic lucrurile.
După ce am stabilit această regulă, nu ne rămâne decât să o punem într-un trigger simplu, așa cum se vede în imaginea de la începutul articolului și apoi, foarte important, să adăugăm acest trigger în toate tag-urile pe care nu le vrem activate atunci când este găsită o adresă de email (în cazul nostru, în URL). Acest tag ar trebui folosit în majoritatea tag-urilor pentru servicii web.