S-a lansat Positron pentru Data Science în R și Python

Atunci când am început să lucrezîn limbajul R, toată lumea avea cuvinte de laudă pentru RStudio, principalul IDE (Integrated Development Environment) pentru acest limbaj. Nu același lucru s-a întâmplat atunci când am trecut la Python, acolo unde utilizatorii au mai multe IDE-uri preferate, chiar și în cazul utilizării pentru date.

În urmă cu 2 ani, compania care creează RStudio și-a schimbat numele din RStudio PBC în Posit PBC (inițialele vin de la Public Benefit Corporation), scopul fiind acela de a oferi cele mai bune soluții pentru data science, nu numai pentru limbajul R.

Inițial, au creat o versiune de RStudio care poate rula și Python, însă limitat. Recent, aceeași companie a venit cu un nou IDE, numit Positron.

Citește tot articolul →

Etichete: , ,

NumPy 2.0.0

NumPy este cel mai popular pachet pentru Python. Acesta se ocupă de calcule numerice, inclusiv pentru serii, matrice și vectori multidimensionali. Include funcții matematice, inclusiv algebră liniară, transformări sau generări aleatorii de numere. De altfel, numele său vine de la Numerical Python.

În data science, NumPy este unul dintre principalele pachete utilizate și a servit, în timp, la crearea altor pachete populare în zona de date, precum pandas sau Matplotlib. La finalul articolului, am inclus și un grafic cu cele mai populare pachete Python în analiza datelor, în funcție de apariția pe GitHub.

În urmă cu un an scriam că pandas a ajuns la versiunea 2.0.0, moment din care pandas nu s-a mai bazat pe NumPy. Zilele trecute, a apărut și versiunea 2.0.0 din NumPy. La fel ca și în cazul pandas, și pentru NumPy aceasta este cea mai mare actualizare de la apariția sa, despre care voi detalia în acest articol.

Citește tot articolul →

Etichete:

Ce este Noteable și cum analizăm date cu acest instrument

În ultima perioadă, am căutat instrumentul potrivit pentru analiza datelor. Îmi doream un tool care, în primul rând, să proceseze rapid cod în Python și SQL, eventual și în R.

Așa am ajuns la Noteable, care este un data notebook. Poți să scrii cod pentru date, însă vine și cu alte funcționalități utile pentru o persoană care lucrează frecvent cu date, precum vizualizări de date, integrări cu AI, automatizări și lucru în echipă. Există chiar și un plugin pentru lucrul cu ChatGPT. Mai mult, totul se face într-o fereastră de browser.

Citește tot articolul →

Etichete: , , , , ,

pandas 2.0.0

pandas este un pachet sau o bibliotecă software care se ocupă cu manipularea și analiza datelor, scrisă pentru limbajul de programare Python. Conform Stack Overflow, peste 50% dintre utilizatorii de Python au experiență în pandas, fiind pachetul numărul 2 în acest clasament, după NumPy, pachet cu care are legături, după cum o să vedeți mai jos.

pandas a apărut în 2008, iar din 2009 este un program open-source. Săptămâna aceasta a apărut versiunea 2.0 din pandas. Este cel mai important update din cei aproximativ 15 ani de când exită pandas. Veți vedea în continuare de ce.

Citește tot articolul →

Etichete: