Amostragem e Sondagens

2011/12

2º Ciclo de Estudos em Matemática
1º Ciclo de Estudos em Matemática
2º Ciclo de Estudos em Engenharia Geográfica
Menor em Informação e Decisão

| Informações Gerais | Programa | Bibliografia | R-Sampling |


Informações Gerais

Apresentação
Nesta disciplina estudam-se as bases teóricas que suportam os procedimentos utilizados na inferência estatística em populações finitas.

Docente
Carlos Tenreiro
Gabinete 6.5, DMUC
URL: http://www.mat.uc.pt/~tenreiro/
E-mail: tenreiro@mat.uc.pt

Horário de atendimento
Segunda-feira, 14h30-16h00
Quarta-feira, 14h30-16h00

Conhecimentos de base recomendados
Esta disciplina utiliza conhecimentos básicos de Probabilidades e de Estatística.

Avaliação contínua
O aluno de Amostragem e Sondagens realizará 2 testes, com a duração de 60 a 90 minutos.

1.º Teste: 13 de Abril de 2012
2.º Teste: 28 de Maio de 2012

A classificação da avaliação contínua, expressa numa escala de 0 a 20 valores, é a média aritmética, arredondada às unidades, das classificações obtidas nos testes.
Considera-se aprovado o aluno que obtenha na avaliação contínua uma classificação igual ou superior a 10 valores, desde que em nenhum dos testes obtenha uma classificação inferior a 7 valores e não tenha faltado a mais de 25% das aulas leccionadas.
A classificação obtida em avaliação contínua não é garantida no exame da época normal.

Calendário de exames
Calendário escolar


Programa

Introdução
Breve resenha histórica sobre a teoria das sondagens: da enumeração completa à utilização de dados parciais; amostragem aleatória versus amostragem empírica; os resultados de Neyman baseados em planos aleatórios de amostragem; a amostragem com probabilidades desiguais; não existência de resultados de optimalidade; a modelização da população; utilização de informação auxiliar. Breve descrição dos principais métodos clássicos de amostragem. Etapas na realização duma sondagem. Fontes de enviesamento. A teoria estatística das sondagens: amostragem e estimação.

1. Amostragem: conceitos básicos
População e parâmetros. Amostra e plano de amostragem. Tamanho da amostra. Plano de tamanho fixo. Plano sem reposição e plano sem reposição. Planos de amostragem simples com e sem reposição. Função de redução. Plano de amostragem reduzido. Versão reduzida de um plano de amostragem. Versão reduzida do plano de amostragem simples sem reposição. Plano de amostragem de Bernoulli. Média, variância e erro quadrático médio de um estimador. Viés dum estimador. Estimadores cêntricos. Comparação de sistemas de amostragem. Intervalos de confiança. O tamanho da amostra.

2. Amostragem aleatória simples
Amostragem simples com reposição (SCR) e sem reposição (SSR). Estimação cêntrica da média e variância do estimador. Estimação cêntrica da variância. Intervalos de confiança e tamanho da amostra. Comparação da eficiência dos planos SCR e SSR. Estimação de outros parâmetros de interesse. Estimação dum total. Estimação duma proporção. Estimação dum rácio. Aproximações para o viés e erro quadrático médio dum estimador de tipo rácio. Estimação num domínio.

3. Amostragem estratificada
Definição do plano de amostragem estratificada simples. Decomposições da média e da variância. Estimação da média. Tamanho da amostra: afectação proporcional. Eficiência da amostragem estratificada com afectação proporcional relativamente ao plano SSR. Afectação de Neyman. Afectação e custo.

4. Estimação com informação auxiliar em planos simples
Utilização de informação auxiliar na fase de estimação. Estimadores da diferença, do quociente e de regressão linear. Comparação dos diferentes estimadores e sua eficiência relativamente ao estimador de HT. Pós-estratificação. Média e variância do estimador pós-estratificado do total. Eficiência relativamente ao estimador estratificado com afectação proporcional.

5. Planos de amostragem com probabilidades desiguais
Planos de amostragem com reposição. O estimador de Hansen-Hurvitz (HH). Média, variância e estimação da variância de estimador de HH. Utilização de informação auxiliar na definição do plano de amostragem com reposição. Planos de amostragem PPS (Probability Proportional to Size). Planos de amostragem sem reposição. O estimador de Horvitz-Thompson (HT). Média e variância do estimador de HT. Estimação de formas quadráticas. Estimação da variânica do estimador de HT. O plano de Poisson. Definição de planos IPPS (Inclusion Probabilities Proportional to Size) de Poisson que minimizam o tamanho médio da amostra ou que minimizam a variância do estimador de HT. Planos de amostragem sem reposição de tamanho fixo. Expressão de Yates-Grundy-Sem (YGS) para a variância do estimador de HT e estimador de YGS. Condições de YGS. Utilização de informação auxiliar na definição do plano de amostragem sem reposição. Exemplos de planos IPPS de tamanho fixo: plano de Midzuno, plano sistemático com probabilidades desiguais, plano de Rao-Sampford. Centricidade do estimador dum quociente no caso dum plano de Midzuno. Referência breve às aproximações propostas por Hájek (1964) e Berger (1998) para a variância do estimador de HT que dependem exclusivamente das probabilidades de inclusão de primeira ordem do plano de amostragem.

6. Optimalidade e admissibilidade
Eficiência dos planos com e sem reposição. O Teorema de Basu e Ghosh. O caso do plano simples com reposição e conservação das unidades distintas. Noção de estimador óptimo e Teorema de Godambe e Joshi sobre a não existência de estimadores óptimos na classe dos estimadores cêntricos de um parâmetro de interesse. Noção de estimador admissível. Admissibilidade do estimador de HT na classe dos estimadores cêntricos do total.

7. Amostragem por grupos a uma e a duas etapas
Amostragem por grupos a uma etapa. Selecção dos grupos com probabilidades iguais e eficiência relativamente ao plano SSR. Selecção dos grupos com probabilidades proporcionais ao seu tamanho. Amostragem sistemática. Amostragem por grupos a duas etapas. Selecção dos grupos com probabilidades iguais. Selecção dos grupos com probabilidades desiguais.

8. Tratamento da não-resposta
O problema da não-resposta: níveis, causas e tipos. Métodos de reponderação e de imputação para o tratamento da não-resposta total e parcial, respectivamente. Efeito da não-resposta na precisão dos estimadores. Análise do viés do estimador usual da média no caso do mecanismo de resposta ser determinístico (modelo determinístico). Tratamento da não-resposta por reponderação. Análise do viés do estimador obtido por reponderação num plano de amostragem com probabilidades desiguais no caso do mecanismo de resposta ser aleatório (modelos de Poisson e de Bernoulli).


Bibliografia

Bibliografia principal

Lohr, S.L., Sampling: design and analysis, Duxbury Press, 1999 (Cota: 62D/LOH)

Tillé, Y., Théorie des sondages: échantillonnage et estimation en populations finies, Dunod, 2001 (Cota: 62D/TIL).

Bibliografia complementar

Hedayat, A.S., Sinha, B.K., Design and inference in finite population sampling, Wiley, 1991 (Cota: 62D/HED)

Barnett, V., Sample survey: principles and methods, Arnold, 2002 (Cota: 62D/BAR).

Cochran, W.G., Sampling techniques, Wiley, 1977 (Cota: 62D/COC).

Levy, P.S., Lemeshow, S., Sampling of populations: methods and applications, Wiley, 1999 (Cota: 62D/LEV).

Thompson, S.K., Sampling, Wiley, 2002 (Cota: 62D/THO).


R-Sampling

The R Project for Statistical Computing
An Introduction to R
The R Commander: A Basic-Statistics GUI for R
An R Introduction to Statistics | R Tutorial
Quick-R
Package "Sampling"
Manual do "Sampling"

Instalação do R
Para descarregar e instalar o programa estatístico R (gratuito) seguir os passos seguintes:
- Ver a página http://www.r-project.org/
- Na coluna da esquerda clicar em "CRAN".
- Escolher um servidor. Por exemplo: http://cran.cict.fr/
- Escolher o sistema operativo: Windows, Linux, Mac. Tendo escolhido Windows, seleccionar "base".
- Clicar em "Download R 2.14.1 for Windows" e instalar o programa escolhendo as opções por defeito.
- A partir da janela R, e após seleccionar um servidor, pode instalar a package "sampling".