Săptămâma trecută a avut loc ediția din 2023 a Google Data Cloud & AI Summit, parte din Google Cloud Summit. La acest eveniment au fost anunțate mai multe noutăți importante pentru zona de date și analytics. Ne interesează acest lucru și pentru că Google Analytics 4 se integrează nativ în BigQuery.
Prețuri noi pentru BigQuery, lansarea Looker Modeler, BigQuery data clean rooms, precum și lansarea AlloyDB Omni sau noile capacități de machine learning și Generative AI sunt doar câteva dintre știrile de anul acesta. Voi detalia în continuarea articolului.
Noi ediții și prețuri pentru Google BigQuery
Au fost anunțate 3 ediții de BigQuery, cu prețuri diferite. Acestea se numesc Standard, Enterprise și Enterprise Plus.
În paralel, au anunțat creșterea cu prețurilor pentru on-demand analysus model cu 25%. Este un lucru care a surprins piața, mai ales că există o concurență acerbă pe această piață, de la Amazon Redshift (cu Amazon Athena), la Microsoft Azure (cu SQL Data Warehouse) și până la servicii precum Snowflake.
Cred că este o mișcare pentru ca vechii clienți să treacă și ei la edițiile anunțate mai sus, despre care se spune că ar fi mai ieftine decât varianta mai veche on-demand.
În scopul susținerii noilor ediții și prețuri, Google a anunțat și câteva inovații. Prima se referă la faptul că vor avea autoscaling, adică resursele de calcul vor crește în timp real, doar atunci când este nevoie și va fi plătită doar capacitatea utilizată.
A doua inovație anunțată de Google este că datele vor fi plătite în funcție de capacitatea lor de după comprimare.
Looker Modeler
Looker a apărut în 2012 și a avut de la început un model semantic, precum și un limbaj pentru acesta, numit LookML. Modelul semantic este util în companii pentru ca anumite metrici să fie consistente.
Săptămâna trecută, Google a anunțat că va lansa Looker Modeler. Acesta produs este considerat a fi un semantic modeling as a service. Mai exact, înseamnă că layer-ul de date este decuplat de la serviciul de BI și poate fi cumpărat separat, pentru ca apoi să poată fi utilizat cu orice tip de serviciu BI.
Ediția preview a Looker Modeler ar trebui să fie gata chiar luna aceasta.
BigQuery Data Clean Rooms
Companii diferite pot folosi date împreună. În urmă cu un an, Google Cloud a anunțat Analytics Hub, un produs bazat pe BigQuery, care le permite companiilor să împartă aceleași date, dar și facturile de la Google BigQuery 😉
Dar datele puse la dispoziția altor companii sunt de diverse tipuri. De multe ori, este nevoie de câteva straturi diverse de protecție și securitate. Din acest motiv, a fost anunțat Data clean rooms pentru BigQuery.
Nu sunt costuri suplimentare pentru acest produs nou. Cei care adaugă date vor plăti pentru spațiul ocupat de acestea, iar companiile care le folosec vor plăti doar pentru interogările din baza de date.
Acest produs nu trebuie confundat cu Confidential Space, un alt produs lansat toamna trecută de Google Cloud. Acesta din urmă este un serviciu prin care datele confidențiale sunt ascunse partenerilor 🙂
AlloyDB Omni
AlloyDB este un alt serviciu anunțat în urmă cu un an, iar acum s-a anunțat AlloyDB Omni.
Pentru cine nu știe, AlloyDB este o bază de date compatibilă cu PostgreSQL, pentru sarcini de lucru tranzacționale și analitice. Concret, este o combinație între open-source-ul de la PostgreSQL, care beneficiază de puterea Google Cloud. Astfel, utilizatorii PostgreSQL pot scala în Google Cloud, fără a face schimbări la nivelul aplicației.
AlloyDB Omni este un program pe care îl puteți descărca și din care să folosiți AlloyDB de oriunde doriți. Astfel, el poate rula direct pe un laptop, dar și de pe un server sau chiar cu date din diverse cloud-uri.
Cei de la Google spun ca AlloyDB Omni este de cel puțin 2 ori mai rapid decât PosgreSQL la sarcini tranzacționale și de peste 100 de ori la interogări analitice. Ediția Developer se poate descărca gratuit.
BigQuery ML Inference Engine
BigQuery ML este disponibil din 2019 și a făcut un pas în față, aducând zona de machine learning mai aproape de date (presupunând că aveți datele în BigQuery, desigur).
BigQuery ML inference engine este pasul următor. Prin acesta, vor putea fi rulate și alte modele de date decât cele populare, cum se întâmpla până acum.
Este un pas important pentru a rula predictive analytics într-un data wharehouse. Se vor putea importa modele „antrenate” (trained) în afara BigQuery, dar se vor putea rual și cele găzduite în Vertex AI Prediction sau alte modele pre-trained.
Generative AI în Vertex AI
Generative AI pare a fi vedeta anului, de când cu ChatGPT. Acesta este un tip de machine learning care poate genera tipuri variate de conținut, precum text, imagini audio și date sintetice.
Vertex AI este un produs Google Cloud care a fost lansat în 2021. Este o platformă unificată de inteligență artificială care oferă toate serviciile Google Cloud sunt același acoperiș.
Suportul pentru Generative AI este cea mai importantă actualizare a Vertex AI de la apariția acestuia.
Vertex AI oferă interfața prin care se poate lucra cu Generative AI. După ce sunt create, modelele pot fi scalate, administrate și trecute în producție folosind Vertex AI.
Tot Vertex AI a mai anunțat și alte două actualizări importante:
- Model Garden – descoperi modele de date folosite de Google și de alți utilizatori sau parteneri
- Generative AI Studio – acesta este un mediu administrat în Vertex AI care facilitează interacțiunea cu modelele de bază, ajustarea și implementarea acestora în producție
Gen App Builder
Este un alt produs nou anunțat în suita Google Cloud. După cum îi spune și numele, este un alt produs care folosește Generative AI.
Numele său este o prescurtare de la Generative AI App Builder. Dezvoltatorii au acces prin API la modelele de date ale Google și pot pleca de la acestea pentru a crea propriile aplicații generative.
De la Google eram obișnuit să vină cu produse bazate pe machine learning, dar e clar că anul acesta subiectul este unul în trend. Cu toate aceste produse și instrumente pentru dezvoltatori și pentru profesioniștii în date, așteptăm să vedem de unde apare următorul ChatGPT 😀