În iulie 2018, semnalam apariția funcționalității de Data Blending în produsul de raportare și dashboarding de la Google. Scriam atunci că aceasta este echivalentul unui left join din SQL.
Luna aceasta, Data Studio a lansat mai multe tipuri de combinare a datelor, oferind pentru acestea toate tipurile majore de operatori join. Voi oferi detalii despre cum funcționează acești operatori, în continuarea articolului.
Data blending ne oferă posibilitatea să creăm tabele și grafice folosind mai mult de o sursă de date. În Data Studio, această combinație se numește blended data source și putem combina până la 5 surse de date.
Avem 3 modalități prin care putem combina sursele de date în interfață, cu rezultate similare:
- secțiunea Resource din meniul de sus, opțiunea Manage blends
- tab-ul Data din partea dreaptă, în cadrul căreia avem secțiunea cu sursele de data din tabelul sau graficul selectat, sub care avem opțiunea Blend data
- vizual, plecând de la 2 sau mai multe grafice, pe care le selectăm și alegem opțiunea Blend data
Operatorii join
Funcționalitatea recent adusă în Data Studio este că putem folosi mai mulți operatori de tip join pentru a combina datele. Iată lista acestora:
- left join
- right join
- inner join
- full join
- cross join
1. left join (left outer join)
Este cel mai folosit, de aceea a și fost primul introdus în Data Studio. Acesta returnează toate rândurile din tabelul din stânga (deci primul tabel ales la combinare), împreună cu rândurile care se potrivesc cu acestea din tabelul din dreapta.
De exemplu, dacă la câmpul de legătură (key), avem data, iar tabelul din stânga are la dată lunile ianuarie, februarie și martie, iar tabelul din dreapta are date pentru martie, aprilie și mai, tabelul final (blended), va avea rândurile de date care coincid cu ianuarie, februarie și martie, adică tot ce conținea tabelul din stânga, dar cu date din ambele tabele pentru acest interval de timp.
2. right join (right outer join)
Va returna rândurile din tabelul din dreapta, precum și rândurile din tabelul din stânga care coincid.
Putem spune că este un fel de left join, dar tabelul principal este cel din dreapta. Și atunci, de ce mai avem nevoie și de acest operator? În Data Studio, avem posibilitatea să combinăm mai multe tabele, cu diverși operatori și acolo se vede această schimbare de operator, care ne ajută să ajungem la rezultatul dorit.
De exemplu, putem combina un tabel cu alte dou[ tabele. Cu unul va fi conectat prin right join, iar cu celalalt prin left join.
3. inner join
Este un operator care va returna numai rândurile care există în ambele tabele. Așadar, câmpul key trebuie să fie identic între rândurile din ambele tabele, pentru a le returna ca blended data.
Este folositor atunci când vrem să izolăm un anumit segment. De exemplu, poate fi folosit atunci când vrem să vedem în analytics utilizatorii care au venit de la un anumit program de afiliere.
4. full join (full outer join)
Returnează rândurile din ambele tabele, chiar dacă nu a fost îndeplinită condiția.
Un exemplu de utilizare ar fi vânzările online, atât din analytics, cât și din CRM. Este nevoie de toate vânzările, chiar dacă au fost prinse doar într-unul dintre cele două sisteme.
5. cross join
Returnează produsul cartezian al ambelor tabele. Altfel spus, toate rândurile din primul tabel, vor fi multiplicate cu toate rândurile din următorul tabel pentru a se ajunge la blended data. Acest tip de operator nu are nevoie de un câmp pentru key.
Este un operator mai puțin folosit în Data Studio, fiind folosit pentru lucuri avansate. De regulă, se folosește împreună cu funcții și calcule.
Managementul datelor
Atunci când creăm un data blending, ne ocupăm și de coresondența datelor dintre tabele.
În procesul de blending, avem ocazia să dăm câte un nume fiecărui tabel. Numele alese ne vor ajuta ulterior, pentru a găsi mai ușor dimensiunile și metricele. Atunci când dimensiunile au același nume, va apărea și numele tabelului, ca sufix.
Tot în setările pentru data blending avem și ocazia să ascundem câmpurile care sunt comune. Este vorba de câmpul / câmpurile folosite drept key în operația de join.
Nu în ultimul rând, avem ocazia să punem un nume și pentru data blending. Acest lucru este util în rapoartele cu mai multe combinări de date.
Dacă aceste lucruri au fost omise când s-a facut procesul de blending, se poate reveni oricând la editarea lor, prin meniul Resource, opțiunea Manage blends, iar de acolo butonul Edit din dreptul fiecărui data blending.
Ce NU avem în Data Studio
Așadar, avem acum posibilitatea de a manipula datele în diverse feluri, cu ajutorul operatorilor de tip join.
În aceeași categorie a combinării datelor, putem vedea că încă nu există operatori de tipul union. Pe de altă parte, în Google Data Studio se folosesc date agregate, adică vedem un rezultat al acestora, deci în multe cazuri nu este nevoie de union. În alte cazuri, pot fi înlocuite de una dintre funcțiile deja existente în GDS.
Rămâne de văzut dacă în viitor vom primi și acest tip de operatori. Până atunci, ne bucurăm de operatorii join, care lărgesc sfera lucrurilor ce pot fi realizate în Data Studio.