dbplyr este un pachet extrem de puternic din ecosistemul tidyverse al limbajului R. Acesta permite folosirea sintaxei dplyr direct pe baze de date. Utilizatorul poate să scrie codul în limbajul R (filter, select, mutate, group_by, summarise etc.), iar dbplyr îl traduce automat în SQL și îl rulează în baza de date, fără să încarci datele în memorie.
Inițial, tidyverse a avut un singur pachet pentru manipularea și curățarea datelor, numir dplyr, dar în iunie 2017 s-a lansat dbplyr pentru cei care utilizează baze de date SQL. Anul acesta am scris un alt articol despre istoria și noutățile din dplyr.
Înapoi la pachetul folosit pentru SQL, acesta și-a lansat recent ultima versiune, dbplyr 2.6.0, care aduce noi tipuri de conexiuni prin ADBC și JDBC, suport complet pentru IBM DB2 și noi funcții SQL. le vom detalia pe toate în continuarea acestui articol.
Citește tot articolul →

