Skip to main content

1 - Introdução às Tabelas de Contingência

As tabelas de contingência como dito anteriormente, é usado para avaliar, analisar sobre o relacionamento das categorias com respeito aos grupos segundo dois modos, independência ou homogeneidade. Nesta seção, vamos mostrar algumas construções destas tabelas. Por exemplo, na tabela 1.1 temos uma amostra de 5375 mortes por tuberculose classificadas de acordo com duas variáveis qualitativas, são eles o sexo e o tipo de tuberculose que provocou a morte.

  Tuberculose do Sistema Respiratório Outras formas de tuberculose
Masculino 3534 270
Feminino 1319 252

Tabela 1.1: Mortes por tuberculose.

Esta é uma tabela de contingência 2x2 (os membros da amostra foram classificados segundo dois critérios dicotômicos). Se algum dos critérios possuir mais do que duas classes, teremos tabelas com mais do que 4 células. As entradas nas células são frequências absolutas ou simplesmente frequências. Com dois critérios de classificação temos uma tabela de contingência bidimensional, se possuirmos mais do que dois critérios de classificação, teremos uma tabela de contingência multidimensional.

Para tabelas com mais de dois critérios de classificação, temos uma aplicação feita em um hospital, que descrevemos com detalhes na seção Homogeneidade das populações. Neste hospital, avaliamos o nível de compreensão de um prontuário pelos diversos profissionais que a usam, ver tabela 1.2, dividimos o nível de comprensão de um prontuário nas categorias Totalmente, Parcialmente e Não entendeu, e nela selecionamos sete populações de profissionais e são elas

  1. Enfermeiro;
  2. Fisioterapêuta;
  3. Fonoaudiólogo;
  4. Médico;
  5. Nutricionista;
  6. Psicólogo;
  7. Terapêuta Ocupacional.

Nesse exemplo, temos uma tabela de contingência multidimensional.

Profissional  Compreensão do Prontuário
Não entendeu Parcialmente Totalmente
Enfermeiro 4 47 125
Fisio 7 50 119
Fono 32 38 106
Médico 14 60 102
Nutri 6 80 90
Psicologia 62 52 62
TO 39 28 109

Tabela 1.2: Compreensão do prontuário.

A forma geral da tabela de contingência, na qual uma amostra de n observações é classificada relativamente a duas variáveis qualitativas, uma com r grupos ou populações no caso de teste de homogeneidade e outra com c categorias. Estas são denominadas tabela de contingência r x c e a frequência observada ou contagem no grupo i da variável linha e na categoria j da variável coluna, é representada por nij . O total de observações no grupo i da variável linha é ni. e o total de observações na categoria j da variável coluna é n.j. Estes são chamados totais marginais, e em termos das frequências das células, nij , são expressos por:

  Categoria 1 Categoria 2 $ \dots $ Categoria c Total
Grupo 1 $ O_{11} $ $ O_{12} $ $ \dots $ $ O_{1c} $ $ n_{1.} $
Grupo 2 $ O_{21} $ $ O_{22} $ $ \dots $ $ O_{2c} $ $ n_{2.} $
$ \vdots $  $ \vdots $ $ \vdots $ $ \ddots $ $ \vdots $ $ \vdots $
Grupo r $ O_{r1} $ $ O_{r2} $ $ \dots $ $ O_{rc} $ $ n_{r.} $
Total $ n_{.1} $ $ n_{.2} $ $ \dots $ $ n_{.c} $ $ n_{..} $

em que,

$$n_{i.} = \sum^{c}_{j=1}O_{ij},~~~~~~~~~~i=1,\dots,r$$

$$n_{.j} = \sum^{r}_{i=1}O_{ij},~~~~~~~~~~j=1,\dots,c$$

$$n_{..}=\sum^{r}_{i=1}\sum^{c}_{j=1}O_{ij} = \sum^{c}_{i=1}n_{i.} = \sum^{r}_{j=1}n_{.j}$$

A seguir, apresentamos o primeiro teste para tabelas de contingência, que é o teste de independência.