R ou PYTHON ? - Para CIência de Dados


R ou PYTHON ? - Para Ciência de Dados

Quanto se fala, em Ciência de Dados, instintivamente vem á nossa mente dia fantásticas linguagens de programação...R e Python.

Muitos paradigmas envolvem estas duas mestrias em programação, e como não poderíamos deixar de esperar, muitas divisões criam na comunidade de cientistas de dados.
Uns defende fervorosamente a linguagem R, outros elevam aos céus a famosa Python. Mas qual ferramenta usar e qual será a melhor?

Para podermos efetuar uma decisão mais certa, necessitamos conhecer melhor cada uma delas.

Nós na Incube elaboramos um estudo e levamos para nossos seguidores um overview de cada ferramenta.

Python


Python é uma linguagem muito generalizada, podendo ser utilizada para inúmeras situações, desde coleta de dados, análise de dados, Web Scraping , aplicativos web, entre outras funções.
Sua curva de aprendizado é bem menor que R para quem já tem domino de linguagens de programação orientada a objetos como o Java por exemplo.
Devido ao fato de ser uma linguagem orientada a objetos, torna-se mais fácil de codificar em grande escala e de forma mais sólida que R.
 Embora Python não tenha um conjunto de pacotes e bibliotecas tão abrangente como os disponíveis para a linguagem R, a combinação de Python com ferramentas como Pandas, Numpy, Scipy, Scikit-learn e Seaborn, torna a linguagem uma das principais escolhas entre os Cientistas de Dados.
Graças ao seu crescimento rápido e elevado, e com uma comunidade muito ativa, Python já começa a ser utilizado para tarefas que antes, só R executava, como atividades de estatística avançada.

R


R tem uma uma longa história de muito confiavél, sua comunidade é muito forte e dedicada, logo suporte não será problema.
Sua abundância de pacotes (são mais de 5.000), são totalmente gratuitos e com uma otima documentação.
Tornando R uma otima ferramenta para análise de dados exploratória.
Possui uma ótima integração com outras linguagens como C++ e Java.
Mas onde R gosta de mostrar todo o seu potêncial é quando utilizado para análises estatisticas pesadas e/ou gráficas.

Comparando ao Python, é bem menos flexível e diversificado e também possui uma comunidade focada na linguagem.
R se diferencia do Python na sua implementação natural, suporte a aritmética matricial e estruturas de dados associados, com vetores e matrizes bem próximos do matlab.
Devido ao seu repositório muito bem alimentado, o CRAN, quem utiliza esta linguagem, acaba até por ter dificuldade em qual pacote utilizar, o que pode ser bom...ou pode se tornar uma complicação.

Qual usar, quando e por que?

 Ambas as linguagens têm inúmeros pacotes sólidos e com enorme capacidade.
Muitas pessoas defendem que todo o cientista de dados deve começar por R ao invés de Python. Mas tem algo que nenhum cientista de dados deve esquecer...uma coisa é criar um algoritmo no seu laptop, outra coisa é colocar esse algoritmo em produção, e nesse quesito, é provável que Python atenda melhor.
Resumindo, não será erro algum optar por R ou Ptyhon! Cada linguagem tem seus prós e contras.
Como sempre defendemos aqui na InCUbe, não existe linguagem melhor, existe sim a linguagem que irá solucionar o problema!

Para poder explorar melhor estas duas fantásticas linguagens, nada melhor do que colocar a mão na massa e tirar suas próprias conclusões.

Para isso disponibilizamos aqui os repositórios de download para cada ferramenta.

R:
https://www.r-project.org/

Python:
https://www.python.org/downloads/ 

Anaconda:
https://www.anaconda.com/distribution/


E você, qual linguagem utiliza para Ciência de Dados? E porquê?

 

Comentários

Postagens mais visitadas deste blog

Tutorial de Machine Learning com Python - Iniciantes - Parte 1

Regressão Múltipla com R

Tutorial de Machine Learning com Python - Iniciantes - Parte 2