Regressão
Quest˜es de interesse: o Ser´ que duas vari´veis s˜o independentes ou pelo contr´rio dependentes? E se a a a a forem dependentes, qual o tipo e grau de dependˆncia? e Existem diversas formas de associa¸˜o entre vari´veis num´ricas. Por exemplo, ca a e podemos ter rela¸oes lineares, exponenciais, logar´ c˜ ıtmicas ou quadr´ticas. a
Bioestat´ ıstica, 2007
1
60,00
40,00 50,00
40,00 30,00
ylinear
yexp
20,00 10,00 0,00 5,00 10,00 15,00 20,00
30,00
20,00
10,00
0,00
0,00
5,00
10,00
15,00
20,00
x
0,00 150,00
x
100,00 -1,00
yquad
-2,00 -3,00 0,00 5,00 10,00 15,00 20,00
ylog
50,00
0,00
-50,00
0,00
5,00
10,00
15,00
20,00
x
x
Bioestat´ ıstica, 2007
2
Como analisar a associa¸˜o entre 2 vari´veis num´ricas ca a e
Primeiro passo: constru¸˜o de diagramas de dispers˜o. ca a Quando duas vari´veis s˜o independentes, o diagrama de dispers˜o respectivo a a a apresenta uma mancha de pontos aleat´ria (ou quando muito) um conjunto de o pontos dispostos sobre uma recta horizontal.
40,00
8,00 30,00
20,00 6,00
10,00
yind
4,00
yind
0,00 -10,00 2,00 -20,00 0,00 -30,00 0,00 5,00 10,00 15,00 20,00
0,00
5,00
10,00
15,00
20,00
x
x
Bioestat´ ıstica, 2007
3
Se a rela¸˜o entre duas vari´veis for linear, ao confrontarmos duas amostras ca a num diagrama de dispers˜o devemos esperar observar um conjunto de pontos a que se disp˜em aproximadamente sobre uma recta. Por vezes os desvios em o rela¸˜o ` recta s˜o m´ ca a a ınimos, mas noutras os pontos apresentam bastante dispers˜o tornando dif´ a identifica¸˜o da dita rela¸˜o linear. a ıcil ca ca
40,00 60,00
40,00 30,00
ylinear1
ylinear2
20,00 10,00 0,00 5,00 10,00 15,00 20,00
20,00
0,00
-20,00
0,00
5,00
10,00
15,00
20,00
x
x
Segundo passo: calcular medidas de associa¸˜o ou efectuar uma an´lise de ca a regress˜o caso a