Amostragem e Sondagens
2024/25
Mestrado em Matemática
*
Informações Gerais
Programa
Bibliografia
R-Sampling
Informações
Gerais
Apresentação
Nesta disciplina estudam-se as bases teóricas que suportam os
procedimentos utilizados na inferência estatística em populações
finitas.
Docente
Carlos Tenreiro
Gabinete 5.8, DMUC
URL: https://www.mat.uc.pt/~tenreiro/
E-mail: tenreiro{at}mat{dot}uc{dot}pt
Horário
Quarta e Sexta-feira, 11h-13h
Conhecimentos de base recomendados
Esta disciplina utiliza conhecimentos básicos de Probabilidades e de Estatística.
Sumários, folhas de exercícios e formulário
Disponíveis na página da disciplina na plataforma UC Student.
Calendário escolar
Programa
Introdução
Breve resenha histórica sobre a teoria da amostragem. Amostragem aleatória e não-aleatória. Erros de amostragem. Outras fontes de enviesamento. Amostragem aleatória simples com e sem reposição. Principais métodos clássicos de amostragem aleatória. A teoria estatística das sondagens: amostragem e estimação.
1. Amostragem: conceitos básicos
População e parâmetros. Amostra e plano de amostragem. Tamanho da
amostra. Plano de tamanho fixo. Plano sem reposição e plano sem
reposição. Planos de amostragem simples com e sem reposição. Função de
redução. Plano de amostragem reduzido. Versão reduzida de um plano de
amostragem. Versão reduzida do plano de amostragem simples sem
reposição. Plano de amostragem de Bernoulli. Média, variância e erro
quadrático médio de um estimador. Viés dum estimador. Estimadores
cêntricos. Comparação de sistemas de amostragem. Intervalos de
confiança. O tamanho da amostra.
2. Amostragem aleatória simples
Amostragem simples com reposição (SCR) e sem reposição (SSR). Estimação
cêntrica da média e variância do estimador. Estimação
cêntrica da variância. Intervalos de confiança e tamanho da amostra.
Comparação da eficiência dos planos SCR e SSR. Estimação de outros
parâmetros de interesse. Estimação dum total. Estimação duma proporção.
Estimação dum rácio. Aproximações para o viés e erro quadrático médio
dum estimador de tipo rácio. Estimação num domínio.
3. Amostragem estratificada
Definição do plano de amostragem estratificada simples. Decomposições da
média e da variância. Estimação da média. Tamanho da amostra: afectação
proporcional. Eficiência da amostragem estratificada com afetação
proporcional relativamente ao plano SSR. Afetação de Neyman. Afetação e
custo.
4. Estimação com informação auxiliar em planos simples
Utilização de informação auxiliar na fase de estimação. Estimadores da
diferença, do quociente e de regressão linear. Comparação dos diferentes
estimadores e sua eficiência relativamente à média empírica.
Pós-estratificação. Média e variância do estimador pós-estratificado do
total. Eficiência relativamente ao estimador estratificado com afetação
proporcional.
5. Planos de amostragem com probabilidades desiguais
Planos de amostragem com reposição. O estimador de Hansen-Hurvitz (HH). Média, variância e estimação da variância de estimador de HH. Utilização de informação auxiliar na definição do plano de amostragem com reposição. Planos de amostragem PPS (Probability Proportional to Size). Planos de amostragem sem reposição. O estimador de Narain-Horvitz-Thompson (NHT). Média e variância do estimador de NHT. Estimação de formas quadráticas. Estimação da variânica do estimador de NHT. O plano de Poisson. Definição de planos IPPS (Inclusion Probabilities Proportional to Size) de Poisson que minimizam o tamanho médio da amostra ou que minimizam a variância do estimador de NHT. Planos de amostragem sem reposição de tamanho fixo. Expressão de Sen-Yates-Grundy (SYG) para a variância do estimador de NHT e estimador de SYG. Condições de SYG. Utilização de informação auxiliar na definição do plano de amostragem sem reposição. Exemplos de planos IPPS de tamanho fixo: plano de Lahiri-Midzuno, plano sistemático com probabilidades desiguais, plano de Rao-Sampford. Centricidade do estimador dum quociente no caso dum plano de Lahiri-Midzuno. Referência breve às aproximações propostas por Hájek (1964) e Berger (1998) para a variância do estimador de NHT que dependem exclusivamente das probabilidades de inclusão de primeira ordem do plano de amostragem.
6. Optimalidade e admissibilidade
Eficiência dos planos com e sem reposição. O Teorema de Basu e Ghosh. O
caso do plano simples com reposição e conservação das unidades
distintas. Noção de estimador óptimo e Teorema de Godambe e Joshi sobre a
não existência de estimadores ótimos na classe dos estimadores
cêntricos de um parâmetro de interesse. Noção de estimador admissível.
Admissibilidade do estimador de NHT na classe dos estimadores cêntricos
do total.
7. Amostragem por grupos a uma e a duas etapas
Amostragem por grupos a uma etapa. Seleção dos grupos com
probabilidades iguais e eficiência relativamente ao plano SSR.
Seleção dos grupos com probabilidades proporcionais ao seu tamanho.
Amostragem sistemática. Amostragem por grupos a duas etapas. Seleção
dos grupos com probabilidades iguais e com
probabilidades desiguais.
8. Tratamento da não-resposta
O problema da não resposta: níveis, causas e tipos. Métodos de
reponderação e de imputação para o tratamento da não resposta total e
parcial, respetivamente. Efeito da não-resposta na precisão dos
estimadores. Análise do estimador usual da média no caso do
mecanismo de resposta ser determinístico. Utilização dum plano de amostragem
em duas fases para tratamento da não-resposta.
Tratamento da não-resposta por reponderação dos respondentes num plano de amostragem com
probabilidades desiguais. Os casos dos modelos aleatórios de resposta homogéneo e homogéneo por classes.
Bibliografia
Bibliografia principal
Lohr, S.L., Sampling: design and analysis, Duxbury Press, 1999 (Cota: 62D/LOH), 2010 (2.ª edição)
Tillé, Y., Théorie des sondages: échantillonnage et estimation en populations finies, Dunod, 2001 (Cota: 62D/TIL).
Tenreiro, C., Notas do curso de Amostragem e Sondagens, Coimbra, 2023.
Bibliografia complementar
Barnett, V., Sample survey: principles and methods, London : Arnold, 2002 (Cota: 62D/BAR).
Cochran, W.G., Sampling techniques, New York : John Wiley, 1977 (Cota: 62D/COC).
Gentle, J.E., Random number generation and Monte Carlo methods, New York : Springer, 1998 (Cota: 65C/GEN).
Hedayat, A.S., Sinha, B.K., Design and inference in finite population sampling, New York : John Wiley, 1991 (Cota: 62D/HED).
Levy, P.S., Lemeshow, S., Sampling of populations: methods and applications, New York : John Wiley, 1999 (Cota: 62D/LEV).
Thompson, S.K., Sampling, New York : John Wiley, 2002 (Cota: 62D/THO).
Tillé, Y., Sampling Algorithms, New York : Springer, 2006 (Cota: 62D/TIL.Sam).
R-Sampling
The R Project for Statistical Computing
An Introduction to R
The R Commander: A Basic-Statistics GUI for R
An R Introduction to Statistics | R Tutorial
Quick-R
Package "Sampling"
Manual do "Sampling"
Instalação do R
Para descarregar e instalar o programa estatístico R (gratuito) seguir os passos seguintes:
- Ver a página http://www.r-project.org/
- Na coluna da esquerda clicar em "CRAN".
- Escolher um servidor.
- Escolher o sistema operativo: Windows, Linux, Mac. Tendo escolhido Windows, selecionar "base".
- Clicar em "Download R-4.4.1 for Windows" e instalar o programa escolhendo as opções por defeito.
- A partir da janela R, e após selecionar um servidor, pode instalar a package "sampling".
|