RStudio este principalul IDE (Integrated Development Environment) pentru programare în limbajul R. Este mai mult decât un editor de cod, având multe funcționalități create special pentru lucrul cu R. Subiectul ne interesează pentru că R este un limbaj creat pentru modelare statistică și data science.
În ultimul an, atât R, cât și cele mai utilizate pachete pentru acesta au primit update-uri majore, lucru care arată preocuparea tot mai mare pentru lucrul cu date. Săptămâna aceasta a venit rândul RStudio să lanseze o versiune nouă, la care au lucrat peste 1 an de zile.
Integrarea cu alte limbaje
R este un limbaj matur, cu funcții și pachete pentru orice fază din data analysis & data science. Totuși, de cele mai multe ori în practică, ești nevoit să realizezi task-uri și în alte limbaje, așa că RStudio a făcut ușor lucrul cu celelalte limbaje sau scripturi utilizate în lucrul cu date:
- SQL – de cele mai multe ori, datele sunt importate dintr-o bază de date, motiv pentru care RStudio a simplificat conectarea la acestea, fără a mai stoca parolele ca text simplu; de asemenea, interogările bazelor de date sunt de acum instante; tot de la versiunea 1.2 avem și autocompletare și previzualizare pentru SQL
- Stan – este un alt limbaj statistic, din acest punct de vedere asemănător cu R, iar cele două au utilizatori comuni, motiv pentru care este acum suportat și în RStudio
- Python – este un limbaj generalist, dar foarte utilizat și în data science; existau și până acum pachete de R care îți permiteau să lucrezi concomintent în ambele limbaje, dar de acum ele sunt integrate mult mai bine și cu alte pachete R; în plus, pot fi rulate scripturi Python direct din RStudio
- D3 – este o librările de JavaScript utilizată pentru a crea vizualizări de date, în special când acestea sunt publicate pe web; noul RStudio va permite rularea scripturilor D3, precum și transformarea obiectelor scrise în R în scripturi D3
Interesant este că lunile trecute, când s-au lansat versiunile de preview pentru RStudio 1.2, vorbeau și de integrări cu C/C++, oferind chiar și exemple în acest sens, dar în anunțul final nu mai apar informații pe acest subiect. Probabil că în curând vom avea și aceste integrări…
Testare și API
Zona de testare aduce mai multe funcționalități noi în această versiune, care integrează în acest sens câteva pachete noi, atât pentru testarea codului R, cât și a produsului altor pachete comune (cum ar fi pachetele din care sunt create rapoarte, prezentări, dashboard-uri sau chiar aplicații web). Astfel, apar funcții pentru înregistrarea testelor.
Crearea, testarea și publicarea de web API din R este și ea mult mai simplă de acum, datorită pachetului plumber, care este și el o integrare foarte bună cu RStudio.
Este interesant modul de lucru al celor de la RStudio, care oferă aceste pachete pentru oricine este interesat de ele, chiar și pentru cei care nu folosesc un client de la RStudio.
Rularea simultană a scripturilor
Până acum, când rulai un script din RStudio, nu mai puteai face altceva până când acesta își termina treaba. Pentru a schimba acest lucru, noua versiune aduce două funcționalități noi, local jobs și remote jobs. Ambele pot fi folosite pentru a rula scripturi în background, în timp ce îți poți continua treaba în editor.
Local job este un script R care rulează într-o sesiune separată (dedicată) de R. Remote job face cam același lucru, dar din RStudio Server Pro. Progresul scripturilor rulate în aceste feluri poate fi monitorizat în timp real, fiind prezentat grafic în interfață (vezi imaginea).
Noua versiune de RStudio are mai multe funcționalități noi. Aș mai aminti de crearea de teme customizate pentru utilizatorii acestui program, teme care pot fi de acum și importate din alte surse sau shareuite. Totul pentru o experiență mai plăcută în timp ce prelucrăm datele 🙂