RETA RESISTENTE
Quando estamos buscando ajustar uma reta para uma nuvem de pontos, o "sonho" é que a maioria dos pontos sejam representados por essa reta, o que nem sempre é verdade ou possível, dependendo do formato dessa nuvem e do método de ajuste empregado. A medida que os pontos dessa nuvem estiverem afastados de uma tendência linear, o ajuste de uma reta torna-se prejudicado, com um número maior de resíduos de tamanho grande.
O método de ajuste de uma reta para duas variáveis, mais conhecido, é o de Mínimos Quadrados. O qual envolve o uso de médias, da suposição de normalidade dos resíduos, e um pouco de cálculo matemático (derivadas, máximos e mínimos). Não é um método resistente a valores extremos, e um ponto grosseiramente medido, ou outlier, pode alterar completamente o ajuste e a análise da regressão.
EXEMPLO: A nuvem de pontos do gráfico a seguir indicam o ajuste por mínimos quadrados com a reta crescente e coeficiente angular positivo, b= 1,35.
No entanto, retirando o ponto discrepante (8,11), resulta em outro ajuste, agora com reta decrescente, e coeficiente angular negativo, b=-2,6. Note como apenas um ponto, discrepante, alterou todo o ajuste.
Em dados onde queremos fazer uma análise exploratória de duas variáveis X e Y, e da relação entre elas, podemos usar a técnica chamada RETA RESISTENTE, que evita os problemas do ajuste por mínimos quadrados.
A TÉCNICA: USANDO TRÊS GRUPOS.
Para a análise da associação entre duas variáveis quantitativas, é comum iniciar o estudo com um gráfico, chamado DIAGRAMA DE DISPERSÃO", que mostra como se comportam os valores y e à medida que x varia.
Quando esses pontos se distribuem aproximadamente linear, uma reta resumirá essa tendência. Por outro lado, caso os pontos revelem uma curva, procura-se fazer uma transformação de x , t(x), ou de y, t(y), ou de ambos, para que se possa ajustar uma reta.
O que veremos agora, é uma análise exploratória que indica um ajuste de uma reta, levando em consideração mais o grupo de pontos, doa que os pontos individualmente, sempre pensando na resistência.
Os pontos discrepantes fornecerão resíduos que são considerados grandes, no ajuste, e algumas vezes podem ser deixados à parte da análise para melhorar a análise e o ajuste.
Aidéia básica para o ajuste linear resistente, é dividir o conjunto de pontos (x1,y1), (x2,y2), .....(xn,yn), em três grupos, usando dentro de cada grupo uma mediana para X e outra para Y, obtendo-se então 3 pares de mediana que representarão a nuvem de pontos, pelos quais passará a reta resistente.
PARA OBTER OS 3 PARES DE MEDIANAS:
1) - Ordena-se os xi , levando juntamente os respectivos valores yi .
2) - A partir dos pontos ordenados, divide-se os n pontos em 3 grupos de tamanhos aproximadamente iguais: Grupo da Esquerda (E), Grupo do Centro(C), Grupo da Direita(D) . O número de pontos em cada grupo dependerá de n, como por exemplo, se n=9, e não existirem empates, cada grupo terá 3 pontos.
Generalizando:
|
|
tamanho do conjunto de pontos(n) |
||
|
GRUPO |
n=3k |
n=3k+1 |
|
Ferramenta