Amostra complexa

Disponível somente no TrabalhosFeitos
  • Páginas : 6 (1495 palavras )
  • Download(s) : 0
  • Publicado : 20 de maio de 2012
Ler documento completo
Amostra do texto
UNIVERSIDADE FEDERAL DE VIÇOSA
CENTRO DE CIÊNCIAS AGRÁRIAS
DEPARTAMENTO DE ECONOMIA RURAL

ERU 726 - ECONOMETRIA II
1.o Semestre/2008

AULA PRÁTICA

ANÁLISE DE DADOS AMOSTRAIS COMPLEXOS USANDO O STATA

João Ricardo Ferreira de Lima*

Objetivo: introduzir o estudo de dados amostrais complexos, comparando os resultados de dois tipos de análises: a) desconsiderando o plano amostral; b)considerando o plano amostral. Para isto será utilizada a base de dados da PNAD/IBGE para o ano de 2003 e o software Stata.

Conceitos Básicos

1) Amostragem

Amostragem surge da necessidade de obter informações sobre a população, que mesmo sendo finita, pressupõe elevado custo para coleta de todas as observações. O objetivo é, através de uma parte da população (denominada de amostra), sefazer inferência a respeito de toda a população. Esta amostra deve ser representativa da população e, para isso, deve ser selecionada de forma aleatória e probabilística. A forma como o processo de seleção da amostra é executado denomina-se plano amostral ou desenho amostral.
O plano amostral mais simples é a amostragem aleatória simples (AAS), na qual todos os elementos possuem a mesmaprobabilidade de serem escolhidos. Este processo de seleção pode ser feito com reposição (AASC) ou sem reposição (AASS). No caso da AASC, as observações obtidas são tratadas como IID (independentes e identicamente distribuídas)[1]. Na prática, contudo o processo de seleção amostral é mais “complexo” do que a AAS. Os seguintes aspectos definem um plano amostral complexo: estratificação das unidades deamostragem, conglomeração (seleção da amostra em vários estágios), probabilidades desiguais de seleção em um ou mais estágios, e ajustes dos pesos amostrais para calibração com totais populacionais conhecidos. Conseqüentemente, dados obtidos de amostras complexas não podem ser considerados IID.
Qualquer processo de amostragem que não seja AASC possui design complexo e requer considerações especiaisna análise, para não se obter resultados viesados ou calculados erroneamente.

2) Classificação dos Planos Amostrais

Um plano amostral é denominado informativo quando o mecanismo de seleção das unidades amostrais pode depender dos valores das variáveis de pesquisa, como nos estudos de caso-controle e das “variáveis auxiliares”. Esta situação se refere ao caso em que na amostra existem casos(unidades que atendem a determinada condição) e controle (unidades sem essa condição). Por outro lado, um plano amostral é não-informativo, quando independe dos valores das variáveis da pesquisa, podendo depender apenas das variáveis auxiliares.
Entre os planos amostrais não-informativos, pode-se fazer uma subdivisão entre ignorável, no caso em que o plano amostral é AASC, e não-ignorável, comoos oriundos de desenho amostral complexo. É possível demonstrar que nos planos amostrais não-ignoráveis, estimativas que não consideram o desenho amostral são viesadas.

3) Diferenças nos resultados das estimações com e sem considerar o plano amostral

Existem alguns métodos para avaliar o impacto da incorporação do plano amostral, denominado de EPA (Efeito do Plano Amostral). O primeiroa ser desenvolvido foi o DEFF (design-effect) (Kish, 1965), definido como a razão entre a estimativa da variância do parâmetro obtida considerando o plano amostral e a estimativa da variância do parâmetro, considerando que os dados fossem obtidos como AAS. Posteriormente, é criado um conceito ampliado de DEFF e bem mais simples de calcular, denominado MEFF (misspecification effect). O MEFFcompara a estimativa da variância do parâmetro obtida considerando o plano amostral com outra estimativa, do mesmo modelo, só que desconsiderando peso, conglomerado e estratificação. Quanto mais o valor calculado do MEFF for afastado de 1, mais incorreta será considerada a especificação do plano amostral ou do modelo. Se MEFF > 1, desconsiderar o plano amostral subestima a variância verdadeira. Se...
tracking img