Roteiro de Regressão Linear

Modelo de Relatório – Análise de Regressão e Correlação

1

Roteiro para Apresentação do Relatório da Análise de Regressão
I.

Descrição do Experimento

Um estudo sugere que o,número de anos que uma pessoa estuda determina o salário que esta pessoa
receberá. Para verificar a veracidade desta hipótese, coletou-se 37 observações das variáveis, sendo que 0
(zero) anos de estudo significaque o respondente tem no máximo o 1º grau completo; os anos seguintes
significam anos completos de estudo (ex: 2 anos significam que o respondente completou o 2º ano do 2º
grau). Estes dados estão demonstrados na tabela abaixo:
Tabela 1. Dados coletados sobre salários (em R$) e número de anos de estudos.
Salários (R$) Anos de Estudo
120
0
507
2
...
...
4.140
23
4.305
22
Fonte:Pesquisa realizada em 00/00/00 na localidade X.
II.

Objetivos do Experimento.

O interesse principal consiste em verificar se existe uma relação entre o valor do salário recebido e o
número de anos de estudo declarado. Para isso, determinaremos como X (a variável explicativa) a
variável anos de estudo, uma vez que este valor pode ser determinado; Y (variável resposta) será o
salário, por ser avariável que temos interesse em prever e por ser aleatória (ou seja, não podemos
determinar o valor exato do salário somente com o número de anos de estudo; se isto acontecesse, não
teríamos modelo de predição, mas determinações).
Formalmente, desejamos verificar se existe ou não relação entre X e Y.
III.

Metodologia utilizada na análise.

3.1 Investigação Preliminar.
Para termos umaidéia do comportamento dos dados, analisaremos inicialmente o Diagrama de
Dispersão mostrado na figura 2 a seguir. A figura 1 mostra um esboço daquilo que acreditamos que deve
acontecer, ou seja, a medida que aumentam o número de anos de estudo, também devem se elevar os
salários.

Prof. Laura Maria Saporski Cachuba

Modelo de Relatório – Análise de Regressão e Correlação

2

SalárioAnos de Estudo

Figura 1. Esboço do modelo de regressão esperado.
Anos de Estudo Plotagem de ajuste de linha
5000

y = 177,91x + 124,05
R2 = 0,9773

Salários (R$)

4000
3000
2000
1000
0
0

5

10

15

20

25

Anos de Estudo

Figura 2. Diagrama de Dispersão de X (Anos de Estudo) contra Y (Salário), exibindo a reta de regressão
ajustada e o valor de R2.
A figura 2sugere a existência de uma forte relação linear entre os anos de estudo e o salário
recebido. Observamos que quanto maior o número de anos de estudo, maior também o salário, conforme
havíamos imaginado no esboço da Figura 1.
Ainda na Figura 2, temos a reta de regressão estimada plotada e o valor de R 2 o qual parece indicar
uma forte relação entre as variáveis, podendo, caso os pressupostos estejamsem problemas, mostrar que a
variável anos de estudo explica bem o valor do salário recebido.
No entanto, esta reta de predição também só poderá ser usada quando confirmarmos a qualidade do modelo.
3.2 Análise dos Pressupostos.

Prof. Laura Maria Saporski Cachuba

Modelo de Relatório – Análise de Regressão e Correlação

3

Ao estabelecermos o modelo de regressão linear simples,devemos, portanto, pressupor que:
1) A relação entre X e Y é linear; este pressuposto pode ser verificado observando o Diagrama de
Dispersão (Figura 2), mas também utilizando o coeficiente de correlação linear de Pearson. No nosso
caso, este coeficiente resultou em 0,98857558 (conforme tabela 3 apresentada na seqüência)
indicando uma forte correlação linear entre X e Y, uma vez que o coeficientevaria de -1 a 1;
2) A variável X não é aleatória, ou seja, os valores de X são fixos. Muito embora em alguns casos a
variável X também possa ser aleatória (neste caso a definição de X e Y se dará pelo interesse em
predição) para garantir a aleatoriedade e o bom resultado do modelo, se fixamos o valor de X o
valor de Y deverá ser aleatório;
3) E() = 0, ou seja, a média do erro  (variável...
tracking img