| | Informações Gerais | | Programa | | Bibliografia | | R Commander | | Ficheiros de dados | |
Apresentação
A disciplina de Bioestatística tem como principal objectivo dar a conhecer ao estudante os princípios, métodos e técnicas da Estatística nas vertentes descritiva e inferencial. O desenvolvimento da capacidade de interpretar os resultados e de avaliar criticamente os métodos utilizados são outros dos objectivos da disciplina. Complexidades de índole matemático serão reduzidas ao mínimo e a análise de exemplos práticos receberá uma atenção considerável.
Docente
Carlos Tenreiro
Gabinete 6.5, DMUC
URL: http://www.mat.uc.pt/~tenreiro/
E-mail: tenreiro@mat.uc.pt
Horário de atendimento
Segunda-feira, 14h30-16h00
Quarta-feira, 14h30-16h00
Conhecimentos de base recomendados
Esta disciplina utiliza conhecimentos de Biomatemática.
Avaliação contínua
O aluno de Bioestatística realizará 2 testes, com a duração de 60 a 90 minutos.
1.º Teste: 27 de Março de 2012
2.º Teste: 24 de Maio de 2012 (quinta-feira, 16h30, Sala Gomes Teixeira (3º piso), DMUC)
Matéria para o 2.º teste de avaliação: capítulos 6 a 10 (ver sumários das aulas 8 à 13). Apesar de mencionadas nas aulas (mas não desenvolvidas), não serão sujeitas a avaliação as matérias referidas nos exercícios 62.(e), 63.(e), 64.(d), 72 e 73 das folhas práticas.
A classificação da avaliação contínua, expressa numa escala de 0 a 20 valores, é a média aritmética, arredondada às unidades, das classificações obtidas nos testes.
Considera-se aprovado o aluno que obtenha na avaliação contínua uma classificação igual ou superior a 10 valores, desde que em nenhum dos testes obtenha uma classificação inferior a 7 valores e não tenha faltado a mais de 1/3 das aulas leccionadas.
Sumários, folhas de exercícios, tabelas e formulário
Disponíveis na página da disciplina na plataforma NÓNIO.
1. A recolha dos dados
Indivíduos e variáveis. Variáveis qualitativas e quantitativas. Planeamento de estudos experimentais. Variável resposta, factores, níveis e tratamentos. Aleatorização na constituição de grupos numa experiência. Tabela de números aleatórios. Emparelhamento, constituição de blocos, experiências simplesmente cega e duplamente cega. Estudos observacionais. Estudos transversais, prospectivos e retrospectivos (caso-coorte e caso-controlo). Estudos experimentais vs. estudos observacionais. Estudos observacionais por amostragem. Descrição de alguns métodos clássicos de amostragem aleatória.
2. Análise exploratória de dados
Distribuição duma variável. Frequências absoluta, relativa e percentual. Tabela de frequências, gráfico de barras e gráfico circular. Representação gráfica de variáveis quantitativas. Histograma e gráfico de caule-e-folhas. Comparação de distribuições usando histogramas paralelos. Características gráficas mais relevantes duma distribuição. Centro, dispersão e forma. Comparação de distribuições usando histogramas paralelos. Características numéricas duma distribuição. Medidas de localização do centro da amostra. Média e mediana. Grande sensibilidade da média à presença de valores extremos nos dados. Robustez da mediana. Medidas de dispersão ou variabilidade. Noção de variância e de desvio-padrão dum conjunto de dados. Pouca robustez do desvio-padrão. Noção de amplitude e de amplitude interquartil e análise da robustez respectiva. Coeficiente de variação. Noção de quantil de ordem p. Cálculos dos quartis e da amplitude interquartil. Observações discordantes e regra numérica para a sua identificação. Construção e interpretação de gráficos de extremos-e-quartis. Utilização de gráficos de extremos-e-quartis na comparação de vários conjuntos de dados.
3. Introdução à Probabilidade
Experiência aleatória e acontecimentos aleatórios. Definições clássica e frequencista de probabilidade. Exemplos de utilização de ambas as definições na atribuição de probabilidade a acontecimentos de uma experiência aleatória. Acontecimentos e conjuntos. Acontecimentos incompatíveis. Propriedades da probabilidade. Noção de probabilidade condicionada. Regra da multiplicação das probabilidades. Acontecimentos independentes. Teorema da probabilidade total e Teorema de Bayes. Sensibilidade e especificidade de um teste de diagnóstico. Valores preditivos positivo e negativo de um teste de diagnóstico. Discussão sobre a interpretação de tais testes no caso de doenças com baixa prevalência.
4. Distribuições de probabilidade: os modelos normal e binomial
Distribuição de probabilidade de uma variável discreta e de uma variável contínua. Densidade de probabilidade. Atribuição de probabilidade via curvas densidade. Média de uma variável aleatória. Variável de Bernoulli. Relação entre a média amostral e a média de uma variável. Lei dos grandes números (LGN). Consequências da LGN para a estimação de médias e de proporções populacionais. Variância e desvio-padrão de uma variável aleatória. Relação entre a variância amostral e a variância de uma variável. Identificação gráfica de algumas das medidas de localização duma curva densidade. O modelo normal. Curvas normais e distribuições normais. Regra 68-95-99.7. Utilização da tabela da distribuição normal standard. Redução dum problema sobre uma distribuição normal qualquer a um problema sobre a distribuição normal standard. Distribuições derivadas da distribuição normal: Student, Qui-quadrado e Fisher. O modelo binomial. Distribuição binomial. Média e variância da variável binomial. Aproximação normal e correcção de continuidade.
5. Intervalos de confiança para proporções e médias
Noção de intervalo de confiança. Distribuição da proporção amostral e aproximação normal. Intervalo de confiança de Wald para uma proporção. Margem de erro e nível de confiança. Interpretação frequencista da noção de nível de confiança. O intervalo de confiança de Wilson. Distribuição da média amostral. O Teorema do Limite Central. Intervalos de confiança para uma média. A distribuição de Student. A escolha do tamanho da amostra.
6. Testes de hipóteses para proporções e médias
Generalidades sobre testes de hipóteses. Hipóteses nula e alternativa. Estatística de teste e p-valor associado a um conjunto de observações. Erros associados a um problema de testes de hipótese. Nível de significância e a sua relação com o controlo da probabilidade do erro de 1.ª espécie. Testes de hipóteses para uma proporção: correcção de continuidade e teste binomial. Testes de hipóteses para uma média. Erro de 2.ª espécie e potência dum teste. Análise da potência e sua aplicação ao problema da escolha do tamanho da amostra.
7. Comparando proporções e médias de duas populações
Testes para comparação de duas proporções para amostras independentes (teste de Wald) e para amostras emparelhadas (teste de McNemar). Testes para comparação de duas médias em amostras independentes (teste de Welch) e em amostras emparelhadas. Intervalos de confiança para a diferença de duas proporções e de duas médias. Escolha do tamanho da amostra. Testes não-paramétricos de Wilcoxon para amostras independentes e emparelhadas.
8. Análise de frequências: testes do qui-quadrado
Estatística do qui-quadrado. A distribuição do qui-quadrado. Testes de homogeneidade e independência. Teste para comparação de duas ou mais proporções para amostras independentes. Testes de ajustamento a uma distribuição fixa. Breve referência ao teste do qui-quadrado para testar a normalidade das observações.
9. Análise da variância
O teste ANOVA para comparação de duas ou mais médias para amostras independentes. Hipóteses subjacentes. A distribuição de Fisher. Comparações múltiplas: métodos de Tukey e de Dunnett. Teste não-paramétrico de Kruskal-Wallis.
10. Regressão linear simples
Noção de associação entre duas variáveis. Gráfico de dispersão e sua interpretação. Associação positiva, associação negativa e ausência de associação. Associação linear e não-linear. Definição e interpretação do coeficiente de correlação linear. Não robustez do coeficiente de correlação linear. Modelo de regressão linear simples. Recta de regressão. Distribuições amostrais dos estimadores dos mínimos quadrados. Utilização da recta de regressão para estimar o valor da variável dependente a partir dum valor assumido pela variável independente. Observações discordantes influentes e não influentes. Coeficiente de determinação como medida da qualidade da regressão. Resíduos e avaliação da sua normalidade. Testes de Student sobre a nulidade dos coeficientes da recta de regressão. Intervalos de previsão.
Tenreiro, C., Estatística: notas de apoio às aulas, Coimbra, 2009. ( Documento em formato PDF )
Moore, D.S., McCabe, G.P., Introduction to the practice of Statistics, Freeman and Company, 2003.
[ Chapter 14 - Nonparametric tests ]
Dawson, B., Trapp, R.G., Basic & clinical Biostatistics, McGraw-Hill, 2001.
Instalação do R
Para descarregar e instalar o programa estatístico R (gratuito) seguir os passos seguintes:
- Ver a página http://www.r-project.org/
- Na coluna da esquerda clicar em "CRAN".
- Escolher um servidor. Por exemplo: http://cran.cict.fr/
- Escolher o sistema operativo: Windows, Linux, Mac. Tendo escolhido Windows, seleccionar "base".
- Clicar em "Download R 2.14.1 for Windows" e instalar o programa escolhendo as opções por defeito.
Instalação da livraria R-Commander (Rcmdr)
A livraria Rcmdr permite trabalhar em R não só usando comandos como também usando janelas.
- Para a instalar, a partir da janela R seleccionar um servidor. Por exemplo: Packages -- Install package(s)... -- France (Toulouse)}.
- Seleccionar a package "Rcmdr".
- Cada vez que se pretenda usar "Rcmdr" é necessário carregá-la. Pode usar a instrução "library(Rcmdr)".
- Da primeira vez, o carregamento pode demorar alguns minutos.
Exercício 1 : Excel SPSS
Exercício 10 : Excel SPSS
Exercício 11 : Excel SPSS
Exercício 12 : Excel SPSS
Exercício 16 : Excel SPSS
Exercício 17 : Excel SPSS
Exercício 18 : Excel SPSS
Exercício 20 : Excel SPSS
Exercício 21 : Excel SPSS
Exercício 63 : Excel SPSS
Exercício 64 : Excel SPSS
Exercício 73 : Excel SPSS
Exercício 74 : Excel SPSS
Exercício 75 : Excel SPSS
Exercício 76 : Excel SPSS
Exercício 77 : Excel SPSS
Exercício 79 : Excel SPSS
Exercício 80 : Excel SPSS
Exercício 81 : Excel SPSS