Vizualizări de date în R pe stilul BBC

BBC este una dintre instutițiile model în ceea ce privește jurnalismul bazat pe date. O parte majoră din această activitate este prezentarea datelor. Vestea bună este că, anul acesta, cei de acolo au decis să ofere gratuit pachetul lor pentru crearea de vizualizări în R, precum și documentația pentru acesta, pentru ca oricine este interesat să poată crea grafice care arată la fel ca cele ale BBC.

Echipa de jurnalism bazat pe date și vizualizare a datelor de la BBC a povestit câte ceva și despre experiența lor. Aveau nevoie de o soluție pentru a crea grafice diferite, care să folosească stilul propriu, fără a apela la echipa de design. Așa au descoperit ggplot2, despre care spun ei că oferă mult mai mult control și creativitate decât un tool de creat grafice.

Pachetul de la BBC se numește bbplot și este o extensie a ggplot2, cel mai popular pachet pentru creat vizualizări de date în R. Anul trecut am scris mai multe despre ggplot2, iar la începutul acestui an am prezentat o altă extensie a acestuia, gganimate.

Citește tot articolul →

Etichete: , ,

Noutățile aduse de RStudio 1.2

RStudio este principalul IDE (Integrated Development Environment) pentru programare în limbajul R. Este mai mult decât un editor de cod, având multe funcționalități create special pentru lucrul cu R. Subiectul ne interesează pentru că R este un limbaj creat pentru modelare statistică și data science.

Citește tot articolul →

Etichete: ,

Vizualizarea animată a datelor din analytics în R cu gganimate

În urmă cu un an scriam despre ggplot2, cel mai popular pachet pentru vizualizarea datelor cu limbajul R. Funcționalitățile acestuia pot fi extinse cu alte pachete, care funcționează ca niște extensii. Este și cazul gganimate, pachet care la începutul acestui an a fost publicat în CRAN, arhiva oficială de pachete pentru R.

În acest articol voi prezenta gganimate și voi trece printr-un studiu de caz în care voi importa date din analytics, le voi prelucra în R, le vom vizualiza cu ggplot2 și apoi voi anima vizualizarea cu gganimate, la finalul articolului fiind disponibil și codul sursă pentru toate aceste etape.

Citește tot articolul →

Etichete: , , , , ,

Vizualizarea Datelor din Analytics cu ggplot2

ggplot2 este pachetul de vizualizare de date preferat de profesioniștii în R. Pe baza sa a fost creat și un pachet numit ggplot pentru Python. Numele său vine de la „Grammar of Graphics”, un concept introdus de Leland Wilkinson în 1999, concept pe care se bazează și acest pachet.

ggplot2 pare complicat inclusiv pentru cei care cunosc deja noțiuni de scripting și vizualizare de date în R, pentru că are o logică diferită. Mai jos, voi explica simplu cele mai importante noțiuni și cum poți începe să îți creezi grafice pe baza propriilor date.

Citește tot articolul →

Etichete: , , ,

Datele din Google Analytics în R

R este cel mai popular limbaj de programare open source folosit pentru analiza datelor. Luna trecută, Stack Overflow anunța că secțiunea lor dedicată acestui limbaj a avut în ultimii 5 ani una dintre cele mai ridicate rate de creștere, comparativ cu secțiunile dedicate celorlalte limbaje. Aceeași sursă l-a numit și limbajul cu cei mai puțini oameni cărora nu le place să lucreze cu acesta. Desigur, trebuie ținut cont că are o bază mai mică de utilizatori, ceea ce este absolut normal, fiind un limbaj nișat.

Mai important, este un limbaj robust cu o comunitate solidă. A apărut în urmă cu 24 de ani pentru a fi folosit de statisticieni, iar în prezent avem aproximativ 12.000 de pachete create de comunitate, și asta doar pe site-ul „oficial”. Un pachet este o colecție de funcții care extinde capabilitățile limbajului. Pentru a observa creșterea, trebuie menționat că în iunie s-a atins cifra rotundă de 10.000 de pachete, în fiecare săptămână lansându-se câteva titluri interesante. De exemplu, în urmă cu o lună a apărut officer, un pachet care exportă din R grafice editabile pentru documentele Microsoft Office.

De ce am vrea datele noastre din Google Analytics în R? În primul rând, avem o flexibilitate mai mare pentru prelucrarea acestora. Cum spuneam mai spus, în R avem pachete pentru orice fază din analiza datelor, de la curățare și transformare, la modelare statistică, raportare și vizualizare de date și chiar generare de predicții și machine learning. Citește tot articolul →

Etichete: , ,