Correlação Parcial e Semiparcial: Definição e Código SAS

Além da correlação linear comumente utilizada na estatística, duas outras correlações podem ser interessantes para sua análise: parcial e semiparcial. Ambas dizem respeito à associação entre as variáveis, no entanto, agora trabalhamos com a ideia de manter outras variáveis controle constantes. Note que isso é importante, pois havendo uma terceira variável que possa causar interferência nas duas analisadas, teremos uma análise equivocada.

A correlação parcial mede a associação (~correlação) entre duas variáveis, X1 e X2, mantendo uma terceira variável, X3, constante. Sua fórmula é dada a seguir:

Captura de Tela 2018-07-28 às 16.31.01

onde ‘r’ indica a correlação entre as variáveis subscritas na fórmula.

Você pode encontrar a relação entre o peso e a quantidade de exercícios feitos, mantendo constante a idade. Ou a relação entre o preço da gasolina e do álcool, mantendo constante o preço do diesel ou do açúcar.

A correlação semiparcial mede a associação (~correlação) entre duas variáveis, X1 e X2, mantendo uma terceira variável, X3, constante somente para X1 ou somente para X2. Suas fórmulas – vou inserir uma para cada variável sendo mantida constante – é dada a seguir:

Captura de Tela 2018-07-28 às 16.34.00 ou Captura de Tela 2018-07-28 às 16.34.32

No primeiro caso, mantemos X3 constante para X2, no segundo a mantemos constante para X1.

Não há muito segredo para a sintaxe no SAS. Se quiser calcular a correlação parcial, basta utilizar o PROC CORR com o argumento PARTIAL. No exemplo abaixo, vamos calcular a correlação da variável (=VAR) PESO com (=WITH) QTD_EXERCICIOS, mantendo constante a variável IDADE:

PROC CORR DATA = NOME_DA_TABELA;
 VAR PESO;
 WITH QTD_EXERCICIOS;
 PARTIAL IDADE;
 RUN;

Você vai observar que há uma tabela duas linhas no output. A primeira linha representa a correlação entre as duas variáveis analisadas, mantendo a terceira constante. Já na segunda linha, há um p-valor para testar se o coeficiente é significativamente diferente de zero.

Aparentemente, não há uma função para correlação semiparcial no SAS. Ao menos, não encontrei nenhuma no link do CORR Procedure.

Como alternativa, você pode transpor a fórmula manualmente, criando uma nova função. Ou, trabalhar com o R, que também é um ótimo software estatístico. Utilize o pacote ppcor:


library(ppcor)
with(nome_da_tabela, spcor.test(PESO,QTD_EXERCICIO,IDADE))

Sei que ficou confuso, utilizar dois softwares diferentes. E dessa vez não utilizei uma tabela como exemplo. Mas como tenho tido menos tempo, e ainda assim gostaria de compartilhar esse conhecimento, acabei inserindo o que sei. A biblioteca ppcor também possui função para correlação parcial (pcor.test).

Espero que apesar de tudo isso, o post seja proveitoso. Bons estudos!

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s