Skip to main content

1 - Introdução às Tabelas de Contingência

As tabelas de contingência, como dito anteriormente, são usadas para avaliar o relacionamento das categorias com respeito aos grupos segundo dois modos, independência ou homogeneidade. Nesta seção, vamos mostrar algumas construções destas tabelas.

A aplicação de tabela de contingência 2x2 é dada quando n elementos selecionados aleatóriamente de uma população são classificados em duas categorias. Depois dos elementos serem classificados um tratamento é aplicado e alguns elementos são examinados novamente e classificados nas duas categorias. O que queremos saber é: O tratamento alterou significativamente a proporção de objetos em cada uma das duas categorias? 

Por exemplo, na tabela 1.1 temos uma amostra de 5375 mortes por tuberculose classificadas de acordo com duas variáveis qualitativas, sexo e tipo de tuberculose que provocou a morte.

  Tuberculose do Sistema Respiratório Outras formas de tuberculose
Masculino 3534 270
Feminino 1319 252

Tabela 1.1: Mortes por tuberculose.

Esta é uma tabela de contingência 2x2 (os membros da amostra foram classificados segundo dois critérios dicotômicos), ou seja, uma tabela de contingência bidimensional, pois temos dois critérios de classificação. O objetivo deste exemplo é verificar se há dependência ou associação entre as variáveis sexo e tipo de tuberculose que provocou a morte.

Como uma generalização imdediata da tabela de contingência 2 x 2, temos uma tabela de contingência com r linhas e c colunas, chamada tabela de contingência r x c. Este tipo de tabela pode ser usado para apresentar dados contidos em várias amostras ou em uma amostra simples, onde cada elemento da amostra pode ser classificado em r diferentes categorias de acordo com um critério ou podem ser classificados em uma ou c categorias diferentes ao mesmo tempo de acordo com um segundo critério. 

Para exemplificar tabelas com mais de dois critérios de classificação, temos uma aplicação feita em um hospital, que descrevemos com detalhes na seção Homogeneidade das populações. Neste hospital, avaliamos o nível de compreensão de um prontuário pelos diversos profissionais que o utilizam, ver tabela 1.2, dividimos o nível de comprensão do prontuário nas categorias Totalmente, Parcialmente e Não entendeu, e selecionamos sete populações de profissionais:

  1. Enfermeiro;
  2. Fisioterapêuta;
  3. Fonoaudiólogo;
  4. Médico;
  5. Nutricionista;
  6. Psicólogo;
  7. Terapêuta Ocupacional.

Nesse exemplo, temos uma tabela de contingência multidimensional.

Profissional  Compreensão do Prontuário
Não entendeu Parcialmente Totalmente
Enfermeiro 4 47 125
Fisio 7 50 119
Fono 32 38 106
Médico 14 60 102
Nutri 6 80 90
Psicologia 62 52 62
TO 39 28 109

Tabela 1.2: Compreensão do prontuário.

Esta é uma tabela de contingência rxc, ou seja, uma tabela de contingência multidimensional, pois temos mais de dois critérios de classificação, ou seja, temos uma tabela com mais que 4 células. O objetivo deste exemplo é verificar se os dados associados as categorias se comportam de modo similar ou homogêneo nas diversas classes definidas pelas categorias da outra variável.

A forma geral da tabela de contingência, na qual uma amostra de n observações é classificada relativamente a duas variáveis qualitativas, uma com r categorias ou populações no caso de teste de homogeneidade e outra com c categorias. Estas são denominadas tabela de contingência r x c e a frequência observada ou contagem das categorias i da variável linha e das categorias da variável coluna, é representada por Oij . O total de observações na categoria da variável linha é ni. e o total de observações na categoria da variável coluna é n.j. Estes são chamados totais marginais e em termos das frequências das células, nij , são expressos por:

  Categoria 1 Categoria 2 $ \dots $ Categoria c Total
Categoria 1 $ O_{11} $ $ O_{12} $ $ \dots $ $ O_{1c} $ $ n_{1.} $
Categoria 2 $ O_{21} $ $ O_{22} $ $ \dots $ $ O_{2c} $ $ n_{2.} $
$ \vdots $  $ \vdots $ $ \vdots $ $ \ddots $ $ \vdots $ $ \vdots $
Categoria r $ O_{r1} $ $ O_{r2} $ $ \dots $ $ O_{rc} $ $ n_{r.} $
Total $ n_{.1} $ $ n_{.2} $ $ \dots $ $ n_{.c} $ $ n $

em que,

$$n_{i.} = \sum^{c}_{j=1}O_{ij},~~~~~~~~~~i=1,\dots,r$$

$$n_{.j} = \sum^{r}_{i=1}O_{ij},~~~~~~~~~~j=1,\dots,c$$

$$n=\sum^{r}_{i=1}\sum^{c}_{j=1}O_{ij} = \sum^{c}_{i=1}n_{i.} = \sum^{r}_{j=1}n_{.j}$$

A seguir, apresentamos o primeiro teste para tabelas de contingência, o teste de independência.