Bioestatística

Bioestatística

2021/22

1º Ciclo de Estudos em Farmácia Biomédica

* Informações Gerais Programa Bibliografia R Commander Ficheiros de dados

Informações Gerais

Apresentação
A disciplina de Bioestatística tem como principal objetivo dar a conhecer ao estudante os princípios, métodos e técnicas da Estatística nas vertentes descritiva e inferencial. O desenvolvimento da capacidade de interpretar os resultados e de avaliar criticamente os métodos utilizados são outros dos objetivos da disciplina. Complexidades de índole matemático serão reduzidas ao mínimo e a análise de exemplos práticos receberá uma atenção considerável.

Docente
Carlos Tenreiro
Gabinete 5.8, DMUC
URL: http://www.mat.uc.pt/~tenreiro/
E-mail: tenreiro{at}mat{dot}uc{dot}pt

Horário
Quarta-feira, 9h-12h, Sala S-1E05, FFUC

Conhecimentos de base recomendados
Esta disciplina utiliza conhecimentos de Biomatemática.

Sumários, folhas de exercícios, tabelas e formulário
Disponíveis na página da disciplina na plataforma UC Student.

Regulamento Pedagógico da FFUC

Calendário de exames

Calendário escolar

Programa

Introdução à Bioestatística
Estatística e Bioestatística. Estatística descritiva e Estatística inferencial. Os objetivos e métodos da estatística. População, indivíduos, parâmetros, amostra, estatísticas. Estudos observacionais e estudos experimentais. Apresentação e discussão de vários exemplos de estudos estatísticos. A Estatística na literatura farmacêutica. O software estatístico R.

1. Análise exploratória de dados
Indivíduos e variáveis. Variáveis qualitativas e quantitativas. Distribuição duma variável. Frequências absoluta, relativa e percentual. Tabela de frequências, gráfico de barras e gráfico circular. Representação gráfica de variáveis quantitativas. Histograma e gráfico de caule-e-folhas. Comparação de distribuições usando histogramas paralelos. Caraterísticas gráficas mais relevantes duma distribuição. Centro, dispersão e forma. Comparação de distribuições usando histogramas paralelos. Caraterísticas numéricas duma distribuição. Medidas de localização do centro da amostra. Média e mediana. Grande sensibilidade da média à presença de valores extremos nos dados. Robustez da mediana. Medidas de dispersão ou variabilidade. Noção de variância e de desvio-padrão dum conjunto de dados. Pouca robustez do desvio-padrão. Noção de amplitude e de amplitude interquartil e análise da robustez respetiva. Coeficiente de variação. Noção de quantil de ordem p. Cálculos dos quartis e da amplitude interquartil. Observações discordantes e regra numérica para a sua identificação. Construção e interpretação de gráficos de extremos-e-quartis. Utilização de gráficos de extremos-e-quartis na comparação de vários conjuntos de dados.

2. A recolha dos dados
Planeamento de estudos experimentais. Variável resposta, fatores, níveis e tratamentos. Aleatorização na constituição de grupos numa experiência. Tabela de números aleatórios. Emparelhamento, constituição de blocos, experiências simplesmente cega e duplamente cega. Estudos observacionais. Estudos transversais, prospetivos e retrospetivos (caso-coorte e caso-controlo). Estudos experimentais vs. estudos observacionais. Estudos observacionais por amostragem. Descrição de alguns métodos clássicos de amostragem aleatória.

3. Introdução à Probabilidade
Experiência aleatória e acontecimentos aleatórios. Definições clássica e frequencista de probabilidade. Exemplos de utilização de ambas as definições na atribuição de probabilidade a acontecimentos de uma experiência aleatória. Acontecimentos e conjuntos. Acontecimentos incompatíveis. Propriedades da probabilidade. Noção de probabilidade condicionada. Regra da multiplicação das probabilidades. Acontecimentos independentes. Teorema da probabilidade total e Teorema de Bayes. Sensibilidade e especificidade de um teste de diagnóstico. Valores preditivos positivo e negativo de um teste de diagnóstico. Discussão sobre a interpretação de tais testes no caso de doenças com baixa prevalência.

4. Distribuições de probabilidade: os modelos normal e binomial
Distribuição de probabilidade de uma variável discreta e de uma variável contínua. Densidade de probabilidade. Atribuição de probabilidade via curvas densidade. Média de uma variável aleatória. Variável de Bernoulli. Relação entre a média amostral e a média de uma variável. Lei dos grandes números (LGN). Consequências da LGN para a estimação de médias e de proporções populacionais. Variância e desvio-padrão de uma variável aleatória. Relação entre a variância amostral e a variância de uma variável. Identificação gráfica de algumas das medidas de localização duma curva densidade. O modelo normal. Curvas normais e distribuições normais. Utilização da tabela da distribuição normal standard. Redução dum problema sobre uma distribuição normal qualquer a um problema sobre a distribuição normal standard. Regra 68-95-99.7. Gráfico de quantis normais. O modelo binomial. Distribuição binomial. Média e variância da variável binomial. Aproximação normal e correção de continuidade.

5. Intervalos de confiança para proporções e médias
Noção de intervalo de confiança. Distribuição da proporção amostral e aproximação normal. Intervalo de confiança de Wald para uma proporção. Margem de erro e nível de confiança. Interpretação frequencista da noção de nível de confiança. O intervalo de confiança de Wilson. Distribuição da média amostral. O Teorema do Limite Central. Intervalos de confiança para uma média. A distribuição de Student. A escolha do tamanho da amostra.

6. Testes de hipóteses para proporções e médias
Generalidades sobre testes de hipóteses. Hipóteses nula e alternativa. Estatística de teste e p-valor associado a um conjunto de observações. Erros associados a um problema de testes de hipótese. Nível de significância e a sua relação com o controlo da probabilidade do erro de 1.ª espécie. Testes de hipóteses para uma proporção: correção de continuidade e teste binomial. Testes de hipóteses para uma média. Erro de 2.ª espécie e potência dum teste. Análise da potência e sua aplicação ao problema da escolha do tamanho da amostra.

7. Comparando proporções e médias de duas populações
Testes para comparação de duas proporções para amostras independentes (teste de Wald) e para amostras emparelhadas (teste de McNemar). Testes para comparação de duas médias em amostras independentes (teste de Welch) e em amostras emparelhadas. Intervalos de confiança para a diferença de duas proporções e de duas médias. Escolha do tamanho da amostra. Testes não-paramétricos de Wilcoxon para amostras independentes e emparelhadas.

8. Análise de frequências: testes do qui-quadrado
Estatística do qui-quadrado. A distribuição do qui-quadrado. Testes de homogeneidade e independência. Teste para comparação de duas ou mais proporções para amostras independentes. Testes de ajustamento a uma distribuição fixa. Breve referência ao teste do qui-quadrado para testar a normalidade das observações.

9. Análise da variância
O teste ANOVA para comparação de duas ou mais médias para amostras independentes. Hipóteses subjacentes. A distribuição de Fisher. Comparações múltiplas: métodos de Tukey e de Dunnett.

10. Regressão linear simples
Noção de associação entre duas variáveis. Gráfico de dispersão e sua interpretação. Associação positiva, associação negativa e ausência de associação. Associação linear e não-linear. Definição e interpretação do coeficiente de correlação linear. Não robustez do coeficiente de correlação linear. Modelo de regressão linear simples. Reta de regressão. Distribuições amostrais dos estimadores dos mínimos quadrados. Utilização da reta de regressão para estimar o valor da variável dependente a partir dum valor assumido pela variável independente. Observações discordantes influentes e não influentes. Coeficiente de determinação como medida da qualidade da regressão. Resíduos e avaliação da sua normalidade. Testes de Student sobre a nulidade dos coeficientes da reta de regressão. Intervalos de previsão.

11. Testes não-paramétricos
Testes paramétricos versus testes não-paramétricos. Testes de Wilcoxon-Mann-Whitney para amostras independentes e de Wilcoxon para amostras emparelhadas. Teste não-paramétrico de Kruskal-Wallis.

Bibliografia

Daniel, W.W., Cross, C.L. Biostatistics: a foundation for analysis in the health sciences, Wiley, 2013 (10.ª edição).

Tenreiro, C., Notas de Estatística, Coimbra, 2018.

Moore, D.S., McCabe, G.P., Craig, B.A. Introduction to the practice of Statistics, W.H. Freeman, 2016 (9.ª edição).

Dawson, B., Trapp, R.G., Basic & clinical Biostatistics, McGraw-Hill, 2004 (4.ª edição).

R Commander

The R Project for Statistical Computing
The R Commander: A Basic-Statistics GUI for R
An R Introduction to Statistics | R Tutorial
Quick-R
Package "R Commander (Rcmdr)"
Manual do "R Commander (Rcmdr)"

Instalação do R
Para descarregar e instalar o programa estatístico R (gratuito) seguir os passos seguintes:
- Ver a página http://www.r-project.org/
- Na coluna da esquerda clicar em "CRAN".
- Escolher um servidor. Por exemplo: http://cran.dcc.fc.up.pt/
- Escolher o sistema operativo: Windows, Linux, Mac. Tendo escolhido Windows, seleccionar "base".
- Clicar em "Download R 4.1.2 for Windows" e instalar o programa escolhendo as opções por defeito.

Instalação da livraria R-Commander (Rcmdr)
A livraria Rcmdr permite trabalhar em R não só usando comandos como também usando janelas.
- Para a instalar, a partir da janela R selecionar um servidor. Por exemplo: Packages -- Install package(s)... -- France (Toulouse).
- Seleccionar a package "Rcmdr".
- Cada vez que se pretenda usar "Rcmdr" é necessário carregá-la. Pode usar a instrução "library(Rcmdr)".