Amostragem e Sondagens

2023/24

Mestrado em Matemática

*
Informações Gerais
Programa
Bibliografia
R-Sampling


Informações Gerais

Apresentação
Nesta disciplina estudam-se as bases teóricas que suportam os procedimentos utilizados na inferência estatística em populações finitas.

Docente
Carlos Tenreiro
Gabinete 5.8, DMUC
URL: https://www.mat.uc.pt/~tenreiro/
E-mail: tenreiro{at}mat{dot}uc{dot}pt

Horário

Conhecimentos de base recomendados
Esta disciplina utiliza conhecimentos básicos de Probabilidades e de Estatística.

Sumários, folhas de exercícios e formulário
Disponíveis na página da disciplina na plataforma UC Student.

Calendário escolar


Programa

Introdução
Breve resenha histórica sobre a teoria da amostragem. Amostragem aleatória e não-aleatória. Erros de amostragem. Outras fontes de enviesamento. Amostragem aleatória simples com e sem reposição. Principais métodos clássicos de amostragem aleatória. A teoria estatística das sondagens: amostragem e estimação.

1. Amostragem: conceitos básicos
População e parâmetros. Amostra e plano de amostragem. Tamanho da amostra. Plano de tamanho fixo. Plano sem reposição e plano sem reposição. Planos de amostragem simples com e sem reposição. Função de redução. Plano de amostragem reduzido. Versão reduzida de um plano de amostragem. Versão reduzida do plano de amostragem simples sem reposição. Plano de amostragem de Bernoulli. Média, variância e erro quadrático médio de um estimador. Viés dum estimador. Estimadores cêntricos. Comparação de sistemas de amostragem. Intervalos de confiança. O tamanho da amostra.

2. Amostragem aleatória simples
Amostragem simples com reposição (SCR) e sem reposição (SSR). Estimação cêntrica da média e variância do estimador. Estimação cêntrica da variância. Intervalos de confiança e tamanho da amostra. Comparação da eficiência dos planos SCR e SSR. Estimação de outros parâmetros de interesse. Estimação dum total. Estimação duma proporção. Estimação dum rácio. Aproximações para o viés e erro quadrático médio dum estimador de tipo rácio. Estimação num domínio.

3. Amostragem estratificada
Definição do plano de amostragem estratificada simples. Decomposições da média e da variância. Estimação da média. Tamanho da amostra: afectação proporcional. Eficiência da amostragem estratificada com afetação proporcional relativamente ao plano SSR. Afetação de Neyman. Afetação e custo.

4. Estimação com informação auxiliar em planos simples
Utilização de informação auxiliar na fase de estimação. Estimadores da diferença, do quociente e de regressão linear. Comparação dos diferentes estimadores e sua eficiência relativamente à média empírica. Pós-estratificação. Média e variância do estimador pós-estratificado do total. Eficiência relativamente ao estimador estratificado com afetação proporcional.

5. Planos de amostragem com probabilidades desiguais
Planos de amostragem com reposição. O estimador de Hansen-Hurvitz (HH). Média, variância e estimação da variância de estimador de HH. Utilização de informação auxiliar na definição do plano de amostragem com reposição. Planos de amostragem PPS (Probability Proportional to Size). Planos de amostragem sem reposição. O estimador de Narain-Horvitz-Thompson (NHT). Média e variância do estimador de NHT. Estimação de formas quadráticas. Estimação da variânica do estimador de NHT. O plano de Poisson. Definição de planos IPPS (Inclusion Probabilities Proportional to Size) de Poisson que minimizam o tamanho médio da amostra ou que minimizam a variância do estimador de NHT. Planos de amostragem sem reposição de tamanho fixo. Expressão de Sen-Yates-Grundy (SYG) para a variância do estimador de NHT e estimador de SYG. Condições de SYG. Utilização de informação auxiliar na definição do plano de amostragem sem reposição. Exemplos de planos IPPS de tamanho fixo: plano de Lahiri-Midzuno, plano sistemático com probabilidades desiguais, plano de Rao-Sampford. Centricidade do estimador dum quociente no caso dum plano de Lahiri-Midzuno. Referência breve às aproximações propostas por Hájek (1964) e Berger (1998) para a variância do estimador de NHT que dependem exclusivamente das probabilidades de inclusão de primeira ordem do plano de amostragem.

6. Optimalidade e admissibilidade
Eficiência dos planos com e sem reposição. O Teorema de Basu e Ghosh. O caso do plano simples com reposição e conservação das unidades distintas. Noção de estimador óptimo e Teorema de Godambe e Joshi sobre a não existência de estimadores ótimos na classe dos estimadores cêntricos de um parâmetro de interesse. Noção de estimador admissível. Admissibilidade do estimador de NHT na classe dos estimadores cêntricos do total.

7. Amostragem por grupos a uma e a duas etapas
Amostragem por grupos a uma etapa. Seleção dos grupos com probabilidades iguais e eficiência relativamente ao plano SSR. Seleção dos grupos com probabilidades proporcionais ao seu tamanho. Amostragem sistemática. Amostragem por grupos a duas etapas. Seleção dos grupos com probabilidades iguais e com probabilidades desiguais.

8. Tratamento da não-resposta
O problema da não resposta: níveis, causas e tipos. Métodos de reponderação e de imputação para o tratamento da não resposta total e parcial, respetivamente. Efeito da não-resposta na precisão dos estimadores. Análise do estimador usual da média no caso do mecanismo de resposta ser determinístico. Utilização dum plano de amostragem em duas fases para tratamento da não-resposta. Tratamento da não-resposta por reponderação dos respondentes num plano de amostragem com probabilidades desiguais. Os casos dos modelos aleatórios de resposta homogéneo e homogéneo por classes.


Bibliografia

Bibliografia principal

Lohr, S.L., Sampling: design and analysis, Duxbury Press, 1999 (Cota: 62D/LOH), 2010 (2.ª edição)

Tillé, Y., Théorie des sondages: échantillonnage et estimation en populations finies, Dunod, 2001 (Cota: 62D/TIL).

Tenreiro, C., Notas do curso de Amostragem e Sondagens, Coimbra, 2023.

Bibliografia complementar

Barnett, V., Sample survey: principles and methods, London : Arnold, 2002 (Cota: 62D/BAR).

Cochran, W.G., Sampling techniques, New York : John Wiley, 1977 (Cota: 62D/COC).

Gentle, J.E., Random number generation and Monte Carlo methods, New York : Springer, 1998 (Cota: 65C/GEN).

Hedayat, A.S., Sinha, B.K., Design and inference in finite population sampling, New York : John Wiley, 1991 (Cota: 62D/HED).

Levy, P.S., Lemeshow, S., Sampling of populations: methods and applications, New York : John Wiley, 1999 (Cota: 62D/LEV).

Thompson, S.K., Sampling, New York : John Wiley, 2002 (Cota: 62D/THO).

Tillé, Y., Sampling Algorithms, New York : Springer, 2006 (Cota: 62D/TIL.Sam).


R-Sampling

The R Project for Statistical Computing
An Introduction to R
The R Commander: A Basic-Statistics GUI for R
An R Introduction to Statistics | R Tutorial
Quick-R
Package "Sampling"
Manual do "Sampling"

Instalação do R
Para descarregar e instalar o programa estatístico R (gratuito) seguir os passos seguintes:
- Ver a página http://www.r-project.org/
- Na coluna da esquerda clicar em "CRAN".
- Escolher um servidor.
- Escolher o sistema operativo: Windows, Linux, Mac. Tendo escolhido Windows, seleccionar "base".
- Clicar em "Download R 4.1.2 for Windows" e instalar o programa escolhendo as opções por defeito.
- A partir da janela R, e após selecionar um servidor, pode instalar a package "sampling".