RStudio este principalul IDE (Integrated Development Environment) pentru programare în limbajul R. Este mai mult decât un editor de cod, având multe funcționalități create special pentru lucrul cu R. Subiectul ne interesează pentru că R este un limbaj creat pentru modelare statistică și data science.
Citește tot articolul →Vizualizarea Datelor din Analytics cu ggplot2
ggplot2 este pachetul de vizualizare de date preferat de profesioniștii în R. Pe baza sa a fost creat și un pachet numit ggplot pentru Python. Numele său vine de la „Grammar of Graphics”, un concept introdus de Leland Wilkinson în 1999, concept pe care se bazează și acest pachet.
ggplot2 pare complicat inclusiv pentru cei care cunosc deja noțiuni de scripting și vizualizare de date în R, pentru că are o logică diferită. Mai jos, voi explica simplu cele mai importante noțiuni și cum poți începe să îți creezi grafice pe baza propriilor date.
Datele din Google Analytics în R
R este cel mai popular limbaj de programare open source folosit pentru analiza datelor. Luna trecută, Stack Overflow anunța că secțiunea lor dedicată acestui limbaj a avut în ultimii 5 ani una dintre cele mai ridicate rate de creștere, comparativ cu secțiunile dedicate celorlalte limbaje. Aceeași sursă l-a numit și limbajul cu cei mai puțini oameni cărora nu le place să lucreze cu acesta. Desigur, trebuie ținut cont că are o bază mai mică de utilizatori, ceea ce este absolut normal, fiind un limbaj nișat.
Mai important, este un limbaj robust cu o comunitate solidă. A apărut în urmă cu 24 de ani pentru a fi folosit de statisticieni, iar în prezent avem aproximativ 12.000 de pachete create de comunitate, și asta doar pe site-ul „oficial”. Un pachet este o colecție de funcții care extinde capabilitățile limbajului. Pentru a observa creșterea, trebuie menționat că în iunie s-a atins cifra rotundă de 10.000 de pachete, în fiecare săptămână lansându-se câteva titluri interesante. De exemplu, în urmă cu o lună a apărut officer, un pachet care exportă din R grafice editabile pentru documentele Microsoft Office.
De ce am vrea datele noastre din Google Analytics în R? În primul rând, avem o flexibilitate mai mare pentru prelucrarea acestora. Cum spuneam mai spus, în R avem pachete pentru orice fază din analiza datelor, de la curățare și transformare, la modelare statistică, raportare și vizualizare de date și chiar generare de predicții și machine learning. Citește tot articolul →