Blog Analýza dát - R alebo Python?

Analýza dát – R alebo Python?

Asi každý začínajúci analytik sa zaoberá otázkou či sa začať učiť R alebo Python, keď chce robiť analýzu dát. Ja osobne mám skúsenosť s Rkom, nakoľko sa ho učíme v škole, avšak k diplomovej práci, ktorá sa bude zaoberať analýzou dát a predikciou, mi bolo odporúčané robiť v Pythone. Preto som začala pátrať a skúmať, ktorý z týchto dvoch programovacích jazykov je na to vhodnejší. Základy v Pythone som sa učila pomocou aplikácie SoloLearn a neprišlo mi to nejako náročné, ale to ani Rko 🙂

Ak by som mala spraviť jednoduchý záver z toho, čo som si prečítala z viacerých článkov o porovnávaní Rka a Pythona, tak ani v jednom sa nezhodli na tom, ktorý z nich je všeobecne lepší. Závisí naozaj od toho, čo chcete s dátami robiť a do akej miery sa chcete „ponoriť” do sveta data science.

Ktorý je používanejší?

Prieskum KDnuggets, webstránky, kde nájdete veľa zaujímavých informácii o data science, jasne ukazuje, že Python sa teší väčšej popularite aj medzi analytikmi. Na rozdiel od roku 2016, kedy bolo medzi analytikmi (zahŕňam sem štatistikov, data scientistov a každého kto pracuje v tejto oblasti) najpoužívanejšie Rko, v roku 2018 to vyhral Python. Dôvodom je najmä rozmach machine learningu, ale aj ďalšia výhoda Pythonu, a to jednoduché napojenie na web či webovú aplikáciu, odkiaľ si vie rýchlo a bez problémov „naťahať” dáta. Preto ak viete, že budete úlohy dátovej analýzy integrovať s webovou aplikáciou alebo produkčnou databázou, odporúča sa pracovať v Pythone.

Ktorý je jednoduchší?

Vo všeobecnosti sa Python považuje za jednoduchší programovací jazyk. Jeho syntax je intuitívna, kód prehľadný. Odporúča sa aj pre úplnych začiatočníkov v programovaní. Nemyslím si však, že jazyk R je ťažký. Práve naopak, bol vytvorený pre štatistikov, pre spracovanie, analyzovanie dát a vykonanie jednoduchších či zložitejších štatistických metód. Preto ak vám ide „iba” o čisto štatistiku ako takú, s Rkom budete spokojní. Určite však odporúčam prečítať si tento blog od Dataquest, kde aj reálne uvidíte porovnanie kódov v Rku a Pythone na jednoduchých úlohách.

Na nasledujúcom obrázku možeme vidieť porovnanie R a Pythona pri kalkulácii funkcie summary (podáva výsledky z modelu). V tomto prípade má výhodu Rko lebo je táto funkcia (ako aj mnohé ďalšie štatistické funkcie) zabudované priamo v ňom. Kdežto do Pythona musíte naimportovať balík statsmodel.

Záver

Obidva programovacie jazyky sú voľne dostupné, k obidvom máte na internete veľa tutoriálov a komunít, kde vám vedia pomôcť pri riešení problému. Ak s programovaním začínate, dobré základy z Rka nájdete na DataCampe, k Pythonu som našla tento free kurz, ktorý si v blízkej budúcnosti plánujem prejsť.

Ak sa chcete pohrať iba so štatistikou, zanalyzovať dáta a spraviť z nich výskum, odporúča sa na začiatok Rko. Obsahuje všetko, čo k tomu potrebujete. Môj subjektívny názor je, že je to taká základná výbava dátového analytika. Ak vás to bude baviť a budete chcieť alebo už chcete robiť komplikovanješie algoritmy, metódy s veľkými datasetmi prepojenými na aplikácie, odporúča sa naučiť aj Python. Výhoda pri ovládaní jazyka Python je aj tá, že ak by vás svet data science omrzel, s Pythonom môžete skúsiť napríklad aj web development (vývoj webu).

Budem rada, ak sa v komentároch podelíte o svoje skúsenosti s týmito programovacími jazykmi.

 

Dobrý článok? Chceš dostávať ďalšie?

Už viac ako 6 200 ITečkárov dostáva správy e-mailom. Nemusíš sa báť, nie každé ráno. Len občasne.

Súhlasím so spracovaním mojich osobných údajov. ( Viac informácií. )

Tvoj email neposkytneme 3tím stranám. Posielame naňho len informácie z robime.it. Kedykoľvek sa môžeš odhlásiť.

Simona Demová
Simona Demová
Absolventka aplikovanej matematiky na Matfyze. V súčasnosti pracuje ako konzultantka. Vrámci sveta IT ju najviac fascinuje myšlienka digitalizácie a inovácií naprieč všetkými oblasťami hospodárstva.

Scala Developer/ka

Máš rád svoju slobodu, pracuješ na projektoch, ideálne remote? Staň sa súčasťou startupu, ktorý buduje platformu na podporu maloobchodu a...

Java Software Architect

Mrháš svojim talentom? Urob prvý krok a zistí čo Ti dnešok ponúka. Medziiným aj prácu v medzinárodnej IT spoločnosti,...

Back-End Developer / REMOTE

Pracuj na svetovom SW produkte, ktorý je používaný miliónmi používateľov! Firma rýchlo rastie a vyvíja nové features. Poznáme ich prostredie...

FullStack PHP Developer

Chcel by si dlhodobú spoluprácu, dobré pracovné podmienky, seriózny prístup? Hľadáme FullStack PHP Developera pre spoločnosť, ktorá sa zaoberá...

Python Medior/Senior Developer

Si Python developer, chceš sa naučiť Go, ideálne remote? Spoločnosť, ktorá sa zaoberá pokročilou analýzou dát a automatizáciou marketingu...

Data Scientist / REMOTE

Pre mladý startup vyvíjajúci softvér, ktorý prispieva hráčom k lepšiemu zážitku z hrania, hľadáme Data Scientist. Založili ho dvaja...

IT Aplikačný Architekt

Chceš stabilné zamestnanie, vychutnávať si skvelý kolektív a mať priestor na realizáciu svojich riešení? Pre spoločnosť pôsobiacu v energetike...

Zapojte sa do prvého NCC hackathonu!

Nenechajte si ujsť prvý hackathon Národného kompetenčného centra pre HPC a využite jedinečnú príležitosť podieľať sa na vývoji aplikácie,...

Zviditeľnite sa v médiách ako odborník v oblasti IT

Zaujímajú vás novinky zo sveta IT a chýbajú vám v médiách? Pomôžte budovať povedomie v oblasti informačných technológií a...

Súťaž Scracth Match 2021 zaznamenala nárast, dominovali jej edukatívne hry

Porota celoslovenskej súťaže Scratch Match 2021 už po piaty raz ocenila nádejné programátorky vo veku 8-15 okov. Medzi ocenenými...

Čítaj ďalej:

Dobrý článok? Chceš dostávať ďalšie?

Už viac ako 6 200 ITečkárov dostáva správy e-mailom. Nemusíš sa báť, nie každé ráno. Len občasne.

Súhlasím so spracovaním mojich osobných údajov. ( Viac informácií. )

Tvoj email neposkytneme 3tím stranám. Posielame naňho len informácie z robime.it. Kedykoľvek sa môžeš odhlásiť.