Power BI este produsul de Business Intelligence de la Microsoft. Acesta este un tool de raportare și vizualizare de date, însă vine și cu instrumente bune pentru modelarea și transformarea datelor. Produsul din urmă, pentru modelarea datelor, se numește Power Query.

Microsoft a anunțat recent că va introduce un nou instrument pentru Power BI. Acesta se numește Power BI Datamart și unii îl consideră produsul de date al anului. Vom vedea argumentele în articolul de mai jos.

Ce este un data mart

Înainte de a vorbi despre produsul de la Microsoft, să vedem ce înseamnă un data mart, în general.

Datele dintr-o organizație pot fi organizate și structurate cu ajutorul data wharehouse și data mart. Data wharehouse deține toate datele care pot fi utile în firmă sau în organizație. În schimb, un data mart deține toate datele de care pot avea nevoie cei dintr-un departament sau o divizie. Astfel, un data wharehouse poate avea mai multe data marts, la care să aibă acces diferite persoane. Dar un data mart poate exista și independent, adică fără a face parte dintr-un data wharehouse.

Pe lângă acces, un data mart are și avantajul că deține o cantitate limitată de date, astfel încât datele să fie structurare și încărcate mai repede atunci când este nevoie de crearea unui raport.

Pentru business intelligence, lucrul cu un data mart este mai eficient decât cu un data wharehouse, costurile de setare și de operare fiind mai mici. De asemenea, performanța din data wharehouse este optimizată dacă se lucrează cu data marts, pentru că vor fi procesate mai puține date.

Data mart în Power BI

Până acum, persoanele care fac analiză de date așteptau ca datele, de multe ori, din diverse surse, să fie prelucrate de către IT, lucru care poate dura săptămâni sau luni, pentru ca apoi să aibă acces la datele necesare și să creeze rapoarte.

Microsoft Power BI este un produs din care poți administra datele într-un mod vizual. Dacă ești la început cu acesta, te invit să citești articolul Introducere în Power BI. Același lucru, administrarea vizuală a datelor, va fi făcut și cu Power BI Datamart, în care poți administra data marts din interfață. Pentru cei care doresc, există și posibilitatea de a crea baza de date în formatul clasic, adică folosind programare.

Sursele de date sunt aceleași ca în rapoartele din Power BI. Amintesc Google Analytics și Adobe Analytics, dar și baze de date din Microsoft Azure, Google BigQuery, Amazon Redshift, IBM Db2 sau MySQL.

Datele pot fi extrase, transformate și încărcate (ETL) fără a folosi cod. Există un editor de interogări vizual, dar există și posibilitatea de a scrie cod T-SQL. Mai mult, datele vor fi actualizate automat.

Microsoft va oferi Azure SQL pentru stocarea noilor date până la 1TB, ceea ce nu este tocmai puțin pentru date tip text, deci nu mai este nevoie de noi baze de date, setarea acestora, acces etc. Pentru că datele sunt în cloud, acestea ar trebui să ruleze rapid și să nu existe probleme atunci când cantitatea de date crește.

Odată ce avem datele în data mart, putem seta ușor tabelele care ne interesează în analiza datelor și le putem exporta. În acest sens, putem folosi inclusiv operatori tip join sau operatori de agregare. De exemplu, putem seta chiar aici suma vânzărilor pe regiuni. Poate fi setată și din rapoartele Power BI, dar există riscul ca cel care face rapoartele să se grăbească și să o facă greșit în unele rapoarte 😉

Pentru cei familiarizați cu scrierea de SQL, aceștia pot folosi orice SQL IDE preferă, mai ales pe cele de la Micosoft, precum SSMS (SQL Server Management Studio) sau Azure Data Studio.

Accesul la un data mart creat în Power BI se poate da și altor utilizatori, la fel cum le dăm acces și la un document Microsoft Office stocat online. Aceștia pot prelucra datele cum doresc, indiferent dacă asta înseamnă în Power BI (desktop sau online), într-un editor SQL etc.

Având o bază de date SQL în Power BI nu înseamnă că nu mai avem acces la funcțiile asemănătoare care existau deja în Power BI. Putem folosi și acum un Power BI Dataset în care să stabilim relații între tabele și chiar să adăugăm măsuri (un fel de date agregate din SQL).

Dispare Microsoft Excel?

Am văzut personal organizații din România în care angajații prefă să își facă treaba în Power BI în loc de Microsoft. Aducerea unui data mart în Power BI le va folosi și mai mult și vor depinde în măsură mai mică de IT. În unele cazuri, pot să nu mai depindă deloc, odată ce au acces la bazele de date.

Analiștii își pot crea acum propriile rapoarte și analize de date, chiar dacă acestea sunt complexe și au în spate baze de date din surse diferite. Teoretic, pot renunța la Excel, la fel cum pot renunța și la timpii de așteptare după cei de la departamentul tehnic. Practic, depinde de fiecare persoană cât de mult o interesează acest lucru. În Power BI poți face toate lucrurile din Excel, plus multe altele.

Power BI Datamart se află în acest moment în stadiul de preview pentru utilizatorii Power BI Premium. Așteptăm ca acesta să fie disponibil pentru toți utilizatorii Power BI, pentru a-l testa și a vedea dacă lucrurile se desfășoară așa ușor cum anunță cei de la Microsoft. În orice caz, este un mare pas înainte pentru un data analyst, mai ales că cei mai mulți dintre aceștia au deja acces la Power BI prin abonamentul Microsoft Office 365 de la organizație.

Etichete: