Introdução ao SAS e ao SAS University

S285_sas100K_TPTK40K_horiz

Este post possui uma versão atualizada: Instalando o SAS University… de novo.

Hoje vamos dar início a uma série de posts com mais conteúdo de programação, especificamente em SAS. Por quê? Porque se você pretende fazer modelos estatísticos utilizando grandes bases de dados – e.g.: bases de 10 milhões de linhas -, você não vai conseguir utilizar o Excel.

Você pode até tentar utilizar o R, já mencionado aqui, um software gratuito e bastante popular. Porém, não é tão comum ver o R nas grandes empresas – pelo menos não nas brasileiras -, principalmente porque o SAS fornece outros serviços. Além disso, o que eu (e alguns outros) consideram uma grande vantagem no R é considerada por alguns sua maior desvantagem: os pacotes criados pelos usuários. Muitos usuários podem criar pacotes com funções prontas para ajudarem nas análises, mas não há garantia de que o pacote não possui erros. Um software como o SAS é menos propenso a esse risco.

O SAS é um software criado na década de 60-70 e hoje é um dos maiores players de mercado de analytics. A programação SAS é simples, e com a prática torna-se intuitiva , sua estrutura é composta de procedimentos e dados (data e procs), e aprofundaremos em cada tópico quando for necessário.

Embora o SAS mais utilizado nas empresas seja uma versão paga, o software possui também sua versão gratuita: o SAS University. Se você tiver dificuldades com a instalação, veja o passo a passo em Instalando o SAS University.

Terminada a instalação, vamos começar construindo uma tabela para praticar. Na tabela abaixo, temos uma lista de clientes, cuja identificação se dá pelo campo id. Além da chave de identificação, temos a UF do cliente, a data em que o cadastro foi realizado e as respectivas idades:

/*Cria tabela exemplo*/
data tabela_exemplo;
     input id $ uf $ dt_cadastro yyyymmdd. idade;
     cards;
12531 SP 20170102 23
41456 SP 20180103 25
55564 GO 20180203 30
97943 PR 20171029 25
88712 PR 20150722 27
88712 SP 20140620 22
;
run;

intro_sas

O que podemos aprender desse código simples?

Para rodar um data step, você deve começar com Data + Nome da tabela que você vai criar, seguido por “;“.

Input com datalines serve para você inserir os dados manualmente. Após o input você deve colocar os nomes das suas variáveis e após o datalines os valores delas. Para finalizar, você deve utilizar o run.

Comentários são feitos utilizando uma barra seguida do asterisco e encerrados com asterisco seguido de uma barra. Ou então, e isto será mostrado nos próximos exemplos, com um asterisco e encerrado com ponto e vírgula.

Outro comando simples que é bastante utilizado e útil é o if, que pode servir tanto para filtrar quanto para executar um comando dada uma condição. Veja os exemplos abaixo:

* filtra clientes do parana;
data tabela_pr;
     set tabela_exemplo;
     if uf = "PR";
run;

intro_sas_4

* se o cliente for de SP marca a fl_sp igual a 1;
* caso contrario fl_sp igual a 0;
data tabela_pr;
     set tabela_exemplo;
     if uf = "SP" then fl_sp = 1;
     else fl_sp = 0;
run;

intro_sas_5

UTILIZANDO SQL DENTRO DO SAS

O SQL é a principal linguagem para manipular bases de dados. Como o SAS deve ser completo, fazendo com que o trabalho de ponta a ponta fique fácil para o usuário, é possível utilizar o SQL para fazer alterações nas bases. Para utilizá-lo, basta combinar o comando proc sql com os comandos tradicionais de SQL. No exemplo abaixo, selecionamos apenas os clientes com UF igual a SP:

proc sql;
       create table clientes_sp as
       select * from tabela_exemplo
       where uf = "SP"
;
run;

intro_sas_2

Neste outro exemplo, tiramos a média das idades dos clientes:

proc sql;
    select mean(idade) as media_idade
    from tabela_exemplo
;
run;

Agora que você já sabe o básico, acesse Programação em SAS e pratique!

 

Anúncios

1 comentário

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s