Tidyverse 1.3.0

Pachetele extind funcționalitățile de bază ale limbajului R, iar tidyverse este un set de pachete folosite în lucrul cu date. Pachetele din tidyverse au în spate aceeași filosofie și un mod de lucru comun. Pentru că tidyverse are o sintaxă diferită de cea obișnuită din R, se spune și că el însuși este un limbaj pentru rezolvarea problemelor de data science cu ajutorul codului R.

În urmă cu câteva zile s-a lansat versiunea 1.3.0. Mai multe despre aceasta, despre pachetele conținute și despre ce face fiecare dintre ele, găsiți în continuarea articolului.

Citește tot articolul →

Etichete: ,

Aplicații utilizate pe telefon

Inițial hotărâsem să nu public articole în perioada de concedii, după care mi-a venit ideea unui articol mai altfel (nu am obiceiul să public articole așa personale). Așadar, continui seria articolelor de vacanță cu unul despre comportmentul personal pe telefonul mobil.

Vizualizarea de mai sus prezintă de câte ori am deschis eu respectivele aplicații de la începutul acestei luni. Trebuie să dau câteva explicații despre cum am ajuns la această listă, lucru pe care o să-l fac în restul articolului.

Citește tot articolul →

Etichete: , ,

Vizualizări de date în R pe stilul BBC

BBC este una dintre instutițiile model în ceea ce privește jurnalismul bazat pe date. O parte majoră din această activitate este prezentarea datelor. Vestea bună este că, anul acesta, cei de acolo au decis să ofere gratuit pachetul lor pentru crearea de vizualizări în R, precum și documentația pentru acesta, pentru ca oricine este interesat să poată crea grafice care arată la fel ca cele ale BBC.

Echipa de jurnalism bazat pe date și vizualizare a datelor de la BBC a povestit câte ceva și despre experiența lor. Aveau nevoie de o soluție pentru a crea grafice diferite, care să folosească stilul propriu, fără a apela la echipa de design. Așa au descoperit ggplot2, despre care spun ei că oferă mult mai mult control și creativitate decât un tool de creat grafice.

Pachetul de la BBC se numește bbplot și este o extensie a ggplot2, cel mai popular pachet pentru creat vizualizări de date în R. Anul trecut am scris mai multe despre ggplot2, iar la începutul acestui an am prezentat o altă extensie a acestuia, gganimate.

Citește tot articolul →

Etichete: , ,

Noutățile aduse de RStudio 1.2

RStudio este principalul IDE (Integrated Development Environment) pentru programare în limbajul R. Este mai mult decât un editor de cod, având multe funcționalități create special pentru lucrul cu R. Subiectul ne interesează pentru că R este un limbaj creat pentru modelare statistică și data science.

Citește tot articolul →

Etichete: ,

Vizualizarea animată a datelor din analytics în R cu gganimate

În urmă cu un an scriam despre ggplot2, cel mai popular pachet pentru vizualizarea datelor cu limbajul R. Funcționalitățile acestuia pot fi extinse cu alte pachete, care funcționează ca niște extensii. Este și cazul gganimate, pachet care la începutul acestui an a fost publicat în CRAN, arhiva oficială de pachete pentru R.

În acest articol voi prezenta gganimate și voi trece printr-un studiu de caz în care voi importa date din analytics, le voi prelucra în R, le vom vizualiza cu ggplot2 și apoi voi anima vizualizarea cu gganimate, la finalul articolului fiind disponibil și codul sursă pentru toate aceste etape.

Citește tot articolul →

Etichete: , , , , ,