Ciência de dados, Análise de Dados e Big Data recentemente tornaram-se termos famosos e são comumente utilizados por pessoas em diversas áreas do conhecimento, dado a necessidade de se fazer entender o que os dados podem comunicar. Nesse sentido, temos diversas linguagens que nos auxiliam na exploração desses dados, como a linguagem R.

Aqui falaremos sobre a linguagem R como ferramenta aliada no desenvolvimento dos seus projetos, principais aplicações e por que é tão importante ter essa skill no seu currículo.  

Então, vamos conferir quais tópicos mostraremos neste post:

O que é a Linguagem R e para que serve?

R é uma linguagem versátil, desenvolvida por dois pesquisadores do departamento de Estatística da Universidade Auckland, na Nova Zelândia. Ela surgiu a partir da necessidade de um programa que auxiliasse na manipulação, análise e visualização de dados. Nesse sentido, desde 2020, essa ferramenta de código aberto e multiparadigma ocupa o 33º lugar no ranking de linguagens mais utilizadas do GitHub

Além disso, a linguagem conta com uma série de pacotes para fins estatísticos, que servem para o desenvolvimento de algoritmos de séries temporais, análise de sobrevivência, aprendizado de máquina e outros. 

Quais as aplicações e usos da Linguagem R?

Atualmente, contamos com diversas aplicações para o uso da linguagem R. Entre elas, vale destacar: 

Data Science

Data Science (Ciência de dados) vem ganhando bastante destaque com a sua versatilidade de aplicações. Um profissional que trabalha com ciência de dados entende de estatística e ferramentas computacionais para a manipulação de dados. Dessa forma, a linguagem de programação R auxilia na coleta, tratamento e transformação desses dados.

Além disso, ela é responsável por ajudar na implementação de algoritmos para realizar análise estatísticas, modelos de inferência, regressão e visualização de dados. 

Machine Learning 

R também é utilizada no aprendizado de máquina. Para a realização de análises preditivas, R conta com pacotes para manuseio de modelos de regressão linear e não linear, clusterização e outros. Tudo isso é utilizado em projetos de detecção de padrões, por exemplo. 

Estatística Computacional

R é uma linguagem fortemente utilizada por estatísticos e pesquisadores. Como sabemos, ela foi criada por estatísticos e para estatísticos, logo, podemos ver a sua influência forte no meio acadêmico.

Nesse sentido, ela vem sendo utilizada como ferramenta essencial no dia a dia do pesquisador que precisa trabalhar com análise de dados. Além disso, mesmo pessoas que não possuam vasta experiência com programação, elas ainda conseguem realizar as suas análises no R, dado a simplicidade da sintaxe da linguagem.

Instalando R no seu computador!

Até aqui, já mostramos a importância da linguagem R e algumas das suas aplicações, agora, vem comigo que eu vou te ensinar como instalá-lo no seu computador

 Mac

Para realizar a instalação do R no seu macOS, siga os seguintes passos: 

  1. Entre no site do Cran do R
  2. Clique na opção “Download R for macOS
Download Linguagem R Windows

Então, é só escolher a versão mais recente e iniciar a instalação 😀

Instalação Linguagem R no Mac

Linux

Instalar o R no Ubuntu talvez seja um pouco difícil se você nunca trabalhou com linha de comando. Mas fique tranquilo, pois seguindo o passo a passo vai ser fácil para você.

Primeiro, note que o R é uma linguagem open source e está em constante atualização. Logo, é provável que a atualização mais recente não esteja disponível nos repositórios do Ubuntu. 

Adicionando a chave GPG:

sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9

Atualize os pacotes:

sudo apt update

Instale o R:

sudo apt install r-base

Para abrir o console R, digite o seguinte comando:

$ R

Prontinho, agora é só executar o programa e se divertir manipulando dados.

Windows

  1. Baixe a última versão do software R.
  2. Atente-se quanto a versão, caso o seu computador seja de 32 bits, instale a de 32 bits. Caso seja a de 64 bits, instale-a. 
  3. Execute os passos de instalação e prontinho, você já pode executar o programa. 

Como instalar o RStudio?

RStudio é a IDE para desenvolvimento de scripts R e possui ainda uma licença gratuita. Para a sua instalação, primeiramente certifique-se que o R já está instalado no seu sistema. Logo após, baixe o arquivo conforme o seu sistema operacional e execute os passos da instalação.

Download do RStudio

O seu ambiente de desenvolvimento poderá lhe ajudar a criar com facilidade os seus scripts R e debugar o seu código. O ambiente é dividido em quatro seções, conforme mostramos abaixo:

Ambiente de desenvolvimento Rstudio em linguagem R

Criando o seu primeiro programa em R

Depos de instalar o R e o RStudio, já está tudo preparado para você começar a codar e criar os seus primeiros programas em R. Assim, enfatizamos que a linguagem R possui uma gama de pacotes que permite à pessoa programadora facilidade na hora de desenvolver os seus códigos. A exemplo disso, temos o ggplot2 que é um pacote para visualização de dados. Vem com a gente que mostraremos a você como instalar pacotes no R.

1- No console do R digite e execute-o.

install.packages("ggplot2")

2- Após a instalação, carregue a biblioteca e já está pronto para utilização.

library(ggplot2)

Essa biblioteca será muito útil para a criação e personalização de gráficos. 

Agora, vamos simular um programa no R. Na própria base de instalação do R, nós também temos vários pacotes que já vêm instalados e prontinhos para uso. Entre eles, o pacote “datasets”, que fornece vários conjuntos de dados para você explorar e treinar as suas habilidades com análise de dados. 

Assim, com poucas linhas de código, você já pode iniciar a análise exploratória dos seus dados. Importaremos o conjunto de dados “women” que fornece as informações de peso e altura de mulheres americanas de 30 a 39 anos. Ele foi retirado do livro “The World Almanac and Book of Facts, 1975” e já vem no pacote “datasets “ do R pronto para uso. 

# ler o conjunto de dados
> data("women")
# retorna o cabeçalho
> head(women)
  height weight
1  58  115
2  59  117
3  60  120
4  61  123
5  62  126
6  63  129
# retorna a estatística descritiva dos dados
> summary(women)
     height    weight     
 Min. :58.0 Min. :115.0  
 1st Qu.:61.5 1st Qu.:124.5  
 Median :65.0 Median :135.0  
 Mean :65.0 Mean :136.7  
 3rd Qu.:68.5 3rd Qu.:148.0  
 Max. :72.0 Max. :164.0  
# cria um gráfico de dispersão
> plot (women, xlab = "Altura", ylab = "Peso",
+   main = "Mulheres americanas de 30 a 39 anos")

Atenção: esse gráfico será exibido na seção direita do RStudio

Gráfico apresentado pelos dados informados

Para que não fique confuso, vamos explicar a você o código.

> data(women)

A primeira linha de código vai ler os dados do dataset women e importá-lo.

head(women)

Traduzindo para o português a palavra “head” significa cabeça ou cabeçalho. Logo, quando chamamos essa função, ela exibirá na tela as principais informações do conjunto de dados women. 

Tabela de dados
> plot (women, xlab = "Altura", ylab = "Peso",
+   main = "Mulheres americanas de 30 a 39 anos")

Criar gráficos é a melhor maneira de visualizar como os seus dados estão distribuídos. Aqui, a função plot do próprio R nos auxilia nesse processo e só precisamos definir os parâmetros.

Esse é apenas um exemplo básico de como a linguagem R funciona. No seu dia a dia ela é uma ferramenta poderosa capaz de auxiliar na análise de grandes conjuntos de dados e em outras tarefas. 

Primeiros passos com o R Console

Como visto anteriormente, o RStudio é apenas uma IDE para escrever e executar os seus scripts R. Nesse sentido, é importante ressaltar que em alguns momentos nem sempre você terá disponível uma IDE para rodar o seu projeto. Logo, é necessário utilizar o prompt de comando ou terminal e assim, executar o seu código. 

Para isso, basta abrir o console R que fica disponível assim que você o instala na sua máquina. 

Primeiros passos com R Console

No próprio console você poderá escrever o seu código

> valor_total <- sum(1, 2, 3, 4, 5)
> valor_total
[1] 15

Aqui, o comando é executado a cada momento que você pressionar o “enter” e caso exista, em seguida ele já exibirá uma saída. Nesse caso, chamamos uma função para somar os números e atribuímos a uma variável chamada valor_total. Após, chamamos a variável valor_total, que nos retorna a soma de todos os números.

Além disso, é possível apenas chamar os seus scripts já prontos para serem executados dentro do console. Para isso, utilizamos o comando source()

> source("teste.R ")
To exit the command prompt we can call the q() function (as in quit).
> q()

Outras formas de executar scripts R

Além do RStudio e do R console, existem outras maneiras para você executar os seus scripts em R, entre elas cabe citar:

Jupyter Notebook

Se você programa em Python e já teve contato com o Jupyter Notebook e não quer mudar o seu ambiente de desenvolvimento para codar, pode continuar utilizando o Jupyter para executar os seus arquivos. Dessa forma, você precisa instalar o “R Essentials” dentro do seu Anaconda. 

No prompt do Anaconda digite: 

conda install -c r r-essentials 

Instalando o “R Essentials” no seu ambiente de desenvolvimento atual.

Caso você queira criar um novo ambiente de desenvolvimento: 

conda create -ambiente r_env r-essentials r-base

Prontinho! Agora você já pode criar seus códigos e executá-los dentro do seu jupyter.

Script Shell

Você também pode precisar executar um script R dentro do Shell. Assim, use o seguinte comando:

Rscript /home/demo/programas/programR.R

Também é possível transformar esse programa R em um executável. Para isso, apenas adicione o seguinte comando no início do seu código:

#!/usr/bin/env Rscript
dados = c(49, 12, 100, 23, 18)
mean(dados)

Então, você poderá executá-lo diretamente do seu prompt. Assim, basta digitar:

./programR.R

Por que aprender a Linguagem R? Quais os principais benefícios?

A linguagem R tornou-se popular graças a sua versatilidade na manipulação de dados. Nesse sentido, a sua utilidade é aplicada em diferentes áreas de negócio, indústrias e até mesmo no poder público. Além disso, é um concorrente de sistemas como o SAS, que apesar de oferecer um ótimo desempenho como ferramenta estatística, por sua vez, é um sistema caro que limita os usuários que desejam iniciar os seus projetos estatísticos.

Os exemplos abaixo mostram porque aprender a linguagem R é tão importante e quais são os seus principais benefícios:

  • Open-Source, por ser uma linguagem de código aberto, R está sendo constantemente atualizada e qualquer pessoa pode contribuir para o desenvolvimento da linguagem criando novos pacotes e funcionalidades;
  • 100% Gratuito. Exatamente, com R você tem acesso a uma tecnologia de ponta e não precisa pagar nada por isso;
  • Fácil integração. O R é facilmente integrado com outras linguagens de programação como Java, Python e C. Também é possível utilizar Latex e Markdown no R para a criação dos seus relatórios. Além disso, é possível importar e exportar dados do Excel
  • Aumenta as oportunidades: a linguagem R está dominando o mercado de trabalho e cada vez mais é importante saber a linguagem no meio corporativo. Nesse sentido, aprender R aumenta as suas oportunidades em carreiras como Data Science, pois dá aquele upgrade no seu currículo.                                   

5 dicas para aprender R

Quando começamos a aprender uma nova linguagem de programação, podemos encarar também como o aprendizado de um novo idioma. Assim, com a linguagem R não é tão diferente. Vem com a gente conferir algumas dicas que podem ajudar você a aprender R e utilizar a linguagem nos seus projetos.

Valorize o básico

Talvez, você ache isso óbvio, mas muitas pessoas querem começar grandes projetos sem entender os fundamentos básicos e encontram dificuldades durante a execução dos seus projetos. Nesse sentido, é importante que você se organize e tenha disposição para compreender conceitos como lógica de programação, uma vez que permitem que o desenvolvimento do aprendizado seja mais fluido e contínuo, sem pular etapas. 

Pratique

Assim como um atleta precisa treinar diariamente para manter-se em forma, na hora de aprender a linguagem R não é muito diferente. Nesse momento, é imprescindível que você foque em praticar, pois de nada adianta assistir uma maratona de aulas se você não tentar desenvolver o raciocínio lógico por meio da repetição de exercícios.

Faça projetos

Além de deixar o seu portfólio mais bonito, fazer projetos vai ajudar você a adquirir experiência na linguagem e poder mostrar aos recrutadores que você sabe de fato utilizar a linguagem. Logo, você pode começar copiando projetos para fixar o seu aprendizado até que consiga desenvolver os seus.

Participe de comunidades

Uma frase muito interessante do filme “A Nova Cinderela”, fala que não podemos deixar que o medo de errar nos impeça de jogar. Analogamente falando, não tenha medo de tirar dúvidas. No processo de aprendizado, é comum encontrar-se confuso.

Nesse sentido, a linguagem de programação R conta com uma comunidade muito grande, onde as pessoas trocam ideias e compartilham o conhecimento. Também é uma ótima maneira de aumentar o seu networking. Além disso, o Stack Overflow é um ótimo aliado nos momentos de dúvidas.

Entenda estatística

Por último e não menos importante, entenda sobre estatística! Se você trabalhar com a linguagem R, provavelmente você vai utilizá-la como ferramenta para manipulação dos seus dados. Por isso, é primordial a compreensão de estatística para que os seus projetos sejam feitos.

Quais as desvantagens da Linguagem R? 

Apesar de o R ser uma linguagem incrível, no entanto, como em toda boa linguagem de programação, ele possui também as suas desvantagens.

Pouca memória

Infelizmente, quando precisamos processar datasets muito grandes, podemos enfrentar alguns probleminhas com o R. Dessa forma, nem sempre uma boa memória RAM será suficiente para auxiliar no processamento desses dados, tal qual acaba ficando atrás de outras linguagens estatísticas.

Para a solução desse problema, às vezes é necessário fracionar o dataset para obter melhor desempenho.

Sem interface gráfica

Se você está acostumado a codar em IDE’s (ambiente de desenvolvimento integrado), provavelmente isso não será um problema, pois utilizamos o RStudio ou qualquer outro ambiente de desenvolvimento para executar o nosso código.

No entanto, caso você seja uma pessoa que utiliza interface gráfica, isso pode ser impactante na sua experiência. Mas, isso não é uma grande interferência na solução dos seus problemas.

Espero que as suas dúvidas sobre a linguagem R tenham sido resolvidas. Essa linguagem é uma excelente ferramenta na hora de trabalhar com dados. Mas, não esqueça que a melhor maneira de compreender um conjunto de dados é entendendo como a estatística funciona.

Assim, é importante que você estude o básico para ter boas noções no desenvolvimento dos seus projetos, uma vez que o R pode te ajudar também na otimização deles. Caso tenha dúvidas em algum processo de instalação ou simplesmente queira começar a aprender a linguagem, você pode consultar a documentação oficial do R.

Além do mais, também é importante ter uma visão geral sobre programação. Então, não esqueça de ler o nosso texto sobre, aqui nós oferecemos um guia completo!

0 Shares:
Você também pode gostar