Tratamento Estatístico de Dados
2024/25
Licenciatura em Engenharia e Gestão Industrial
*
Informações Gerais
Programa
Bibliografia
R Commander
Ficheiros de dados
Informações
Gerais
Apresentação
A disciplina de Tratamento Estatístico de Dados tem como principal objetivo dar a conhecer ao estudante os princípios, métodos e técnicas da Estatística nas vertentes descritiva e inferencial. O desenvolvimento da capacidade de interpretar os resultados e de avaliar criticamente os métodos utilizados são outros dos objetivos da disciplina. A análise de exemplos práticos receberá uma atenção considerável.
Docente
Carlos Tenreiro
Gabinete 5.8, DMUC
URL: http://www.mat.uc.pt/~tenreiro/
E-mail: tenreiro{at}mat{dot}uc{dot}pt
Horário
T: Terça-feira, 9h30-12h30, Anfiteatro A, EC
TP1: Quinta-feira, 9h-11h, Sala 3.3, DEM
TP2: Quinta-feira, 11h-13h, Sala 3.3, DEM
Conhecimentos de base recomendados
Análise Matemática I, Análise Matemática II.
Sumários, folhas de exercícios, tabelas e formulário
Disponíveis na página da disciplina nas plataformas InforEstudante e UC Student.
Regulamento de Atividades Académicas da FCTUC
Regulamento Académico da UC
Calendário escolar
Programa
Introdução à Estatística
Estatística descritiva e Estatística inferencial. Os objetivos e métodos da estatística. Apresentação e discussão sucinta de vários exemplos de estudos estatísticos. O software estatístico R e a package RCommander.
Análise exploratória de dados
Indivíduos e variáveis. Variáveis qualitativas e quantitativas. Distribuição duma variável. Frequências absoluta, relativa e percentual. Tabela de frequências, gráfico de barras e gráfico circular. Representação gráfica de variáveis quantitativas: o histograma. Comparação de distribuições usando histogramas paralelos. Caraterísticas gráficas mais relevantes duma distribuição: centro, dispersão e forma. Caraterísticas numéricas duma distribuição. Medidas de localização do centro da amostra. Média e mediana. Grande sensibilidade da média à presença de valores extremos nos dados. Robustez da mediana. Medidas de dispersão ou variabilidade. Noção de variância, desvio-padrão e coeficiente de variação dum conjunto de dados. Noção de amplitude e análise da robustez respetiva. Noção de quantil de ordem p. Cálculos dos quartis. Amplitude interquartil como medida de dispersão e análise da robustez respetiva. Observações discordantes e regra numérica para a sua identificação. Construção e interpretação de gráficos de extremos-e-quartis. Utilização de gráficos de extremos-e-quartis na comparação de vários conjuntos de dados. Alteração da unidade de medida.
Introdução à Probabilidade
Experiência aleatória e acontecimentos aleatórios. A probabilidade como medida da possibilidade de ocorrência de um acontecimento aleatório. Acontecimentos e conjuntos. Atribuição de probabilidade a acontecimentos de uma experiência aleatória. Definição clássica de probabilidade. Probabilidade e frequência relativa. Definição frequencista de probabilidade. Exemplos de utilização de ambas as definições na atribuição de probabilidade a acontecimentos de uma experiência aleatória. Definição geral de probabilidade (Kolmogorov). Propriedades da probabilidade. Lei dos grandes números de Bernoulli e definição frequencista de probabilidade. Noção de probabilidade condicionada. Regra da multiplicação das probabilidades. Acontecimentos independentes. Teorema da probabilidade total. Teorema de Bayes.
Distribuições de probabilidade e Lei dos grandes números
Noção de distribuição de probabilidade duma variável aleatória. Distribuição de probabilidade e distribuição de frequência. Variáveis aleatórias discretas. Suporte da distribuição. Função de probabilidade e função de distribuição. Principais propriedades. Variáveis aleatórias contínuas. Função de probabilidade e função de distribuição. Principais propriedades. Obtenção da função e da densidade de probabilidade a partir da respetiva função de distribuição. Esperança ou média duma variável. Propriedades. Variância duma variável. Propriedades. Densidade de probabilidade de uma função da variável de interesse. Lei dos grandes números e suas consequências.
Modelos de probabilidade e Teorema do limite central
Modelos de Bernoulli, binomial e de Poisson. Modelos uniforme e exponencial. Modelo normal. Densidade normal e densidade normal standard. Utilização da tabela da distribuição normal standard. Redução de um problema sobre uma distribuição normal qualquer a um problema sobre a distribuição normal standard. Regra 68-95-99.7. Quantis de uma distribuição contínua. Gráficos de quantis normais. Aproximação normal para a distribuição binomial. Correção de continuidade. Distribuição da média amostral: o caso da distribuição da amostra ser de Bernoulli; o caso da distribuição da amostra ser normal. O teorema do limite central.
Intervalos de confiança
Noção de intervalo de confiança. Distribuição da proporção amostral e aproximação normal. Intervalo de confiança de Wald para uma proporção. Estimativa pontual e margem de erro de um intervalo de confiança. Interpretação frequencista da noção de nível de confiança. Nível de confiança e probabilidade de cobertura de um intervalo de confiança. Intervalo de confiança de Wilson para uma proporção. A escolha do tamanho da amostra em intervalos de confiança para uma proporção. Intervalos de confiança para uma média. A distribuição de Student. A escolha do tamanho da amostra. Intervalos de confiança para a variância duma população normal. A distribuição do qui-quadrado.
Testes de hipóteses
Generalidades sobre testes de hipóteses. Hipóteses nula e alternativa. O caso do teste de hipóteses para uma proporção. Noção de nível de significância. A estatística de teste como medida da compatibilidade entre a hipótese nula e as observações realizadas. Regiões de rejeição (região crítica) e de aceitação da hipótese nula. Estatística de teste e p-valor associado a um conjunto de observações. Testes de hipóteses para uma proporção: correção de continuidade e teste binomial. Erros associados a um problema de testes de hipótese. Nível de significância e a sua relação com o controlo da probabilidade do erro de 1.ª espécie. Erro de 2.ª espécie e potência dum teste. Testes de hipóteses para uma média. Teste de hipóteses para a variância duma população normal. Testes para comparação de duas proporções para amostras independentes (teste de Wald) e para amostras emparelhadas (teste de McNemar). Testes para comparação de duas médias em amostras independentes (teste de Welch) e em amostras emparelhadas. Intervalos de confiança para a diferença de duas proporções e de duas médias. Escolha do tamanho da amostra.
Bibliografia
Murteira, B., Ribeiro, C.S., Silva, J.A., Pimenta, C.,
Introdução à estatística,
Lisboa: McGraw-Hill, 2007.
Devore, J.L.,
Probability and statistics for engineering and the sciences,
Australia: Cengage Learning, 2017.
Moore, D.S., McCabe, G.P., Craig, B.A.,
Introduction to the practice of statistics,
New York: W.H. Freeman, 2017.
Montgomery, D.C., Runger, G.C.,
Applied statistics and probability for engineers,
Hoboken: Wiley, 2014.
Vicente, M.A.F.,
R: Estatística descritiva e inferencial via Package RCommander: um manual de iniciação,
Coimbra: DMUC, 2021.
R Commander
The R Project for Statistical Computing
The R Commander: A Basic-Statistics GUI for R
An R Introduction to Statistics | R Tutorial
Quick-R
Package "R Commander (Rcmdr)"
Manual do "R Commander (Rcmdr)"
Instalação do R
Para descarregar e instalar o programa estatístico R (gratuito) seguir os passos seguintes:
- Ver a página http://www.r-project.org/
- Na coluna da esquerda clicar em "CRAN".
- Escolher um servidor. Por exemplo: http://cran.dcc.fc.up.pt/
- Escolher o sistema operativo: Windows, Linux, Mac. Tendo escolhido Windows, selecionar "base".
- Clicar em "Download R-4.4.1 for Windows" e instalar o programa escolhendo as opções por defeito.
Instalação da livraria R-Commander (Rcmdr)
A livraria Rcmdr permite trabalhar em R não só usando comandos como também usando janelas.
- Para a instalar, a partir da janela R selecionar um servidor. Por exemplo: Packages -- Install package(s)... -- France (Toulouse).
- Selecionar a package "Rcmdr".
- Cada vez que se pretenda usar "Rcmdr" é necessário carregá-la. Pode usar a instrução "library(Rcmdr)".
Ficheiros de dados
Exercício 01 : Excel
Exercício 02 : Excel
Exercício 04 : Excel
Exercício 06 : Excel
Exercício 07 : Excel
Exercício 08 : Excel
Exercício 09 : Excel
Exercício 10 : Excel
Exercício 11 : Excel
Exercício 12 : Excel
Exercício 13 : Excel
Exercício 61 : Excel
Exercício 67 : Excel
Exercício 68 : Excel
Exercício 69 : Excel
Exercício 70 : Excel
Exercício 71 : Excel
Exercício 72 : Excel
Exercício 73 : Excel
Exercício 75 : Excel
Exercício 76 : Excel
Exercício 78 : Excel
Exercício 79 : Excel
Exercício 81 : Excel
Exercício 81 : Excel
Exercício 83 : Excel
|