Skip to main content

O método do Kernel é um método não paramétrico para estimação de curvas de densidades onde cada observação é ponderada pela distância em relação a um valor central, o núcleo. A idéia é centrar cada observação x onde se queira estimar a densidade, uma janela b que define a vizinhança de x e os pontos que pertencem à estimação.

 

Estimação de densidade

A probabilidade de que um vetor x, retirado de uma função de densidade desconhecida p(x), cair dentro de uma região R é dada por

$$\widehat{P} = \int_{R}p(x')dx'$$

Considerando que R seja contínua e pequena de forma que p(x) não varia, teremos

$$\widehat{P} = \int_{R}p(x')dx' = p(x) \ast V$$

onde V é o volume de R.

Se retiramos n pontos de maneira independente de p(x) então a probabilidade de que k deles caiam na região R é dada pela lei binomial

$$P_{k}= \left(\begin{matrix}n \cr k \end{matrix}\right) P^{k}(1-P)^{n-k}$$

Temos também que o número médio de pontos caindo em R é dado pela esperança matemática de k, ou seja, E[k] = nP. Considerando n grande, temos

$$\widehat{P} = p(x) \ast V~~~~~\mbox{e}~~~~~\widehat{P} = \dfrac{k}{n}$$

Então,

$$\widehat{p}(x) \ast V = \dfrac{k}{n}$$

Logo, a estimação da densidade p(x) é dada por

$$\widehat{p}(x) \approx \dfrac{k/n}{V}$$

Se as regiões Ri não tem intersecção, temos um histograma como abaixo.

Em problemas reais existem duas alternativas para estimação da densidade:

  • Escolher um valor fixo de k e determinar o volume V a partir dos dados,
  • Fixar o volume V e determinar k a partir dos dados (Janela de Parzen).

 

Janela de Parzen

Nesta abordagem fixamos o tamanho da região R para estimar a densidade, fixamos o volume V e determinamos o correspondente k a partir dos dados de aprendizagem e assumimos que a região R é um hipercubo de tamanho h cujo volume é hd.

Para estimar a densidade no ponto x simplesmente centramos R em x, contamos o número de observações em R e substituímos na equação

$$p(x) \approx \dfrac{k/n}{V}$$

Por exemplo,

Podemos definir uma expressão para encontrar a quantidade de pontos que caem em R, a qual é definida como função de Kernel ou Parzen window.

Considerando que temos os exemplos x1, x2, ..., xn, então

Exemplo 4.3.1.1: Janela de Parzen em 1D.

Suponha que temos 7 observações D = {2, 3, 4, 8, 10, 11, 12} e o tamanho da janela é h = 3. Vamos estimar a densidade em x = 1.

Para ver o formato da função podemos estimar todas as densidades.

A janela é usada na realidade para interpolação, cada observação xi contribui para o resultado da densidade em x, se x está perto bastante de xi.

 

Janela de Parzen: kernel Gaussiano

Uma alternativa a janela quadrada usada até então é a janela Gaussiana. Nesse caso, os pontos que estão próximos a xi recebem um peso maior. A estimação da densidade é então suavizada

Exemplo 4.3.1.2: Voltando ao Exemplo 4.3.1.1, em que D = {2, 3, 4, 8, 10, 11, 12}. Se considerarmos agora h = 1, teremos

Janelas de Parzen N(0, 1)

Figura 4.3.1.1: Poucas observações e h pequeno.


Figura 4.3.1.2: Muitas observações e h pequeno.

 

Outros kernels utilizados

Apesar do kernel Gaussiano ser mais frequentemente utilizado há várias escolhas entre kernels como mostrado na tabela abaixo.

Tabela 4.3.1.1: Diferentes tipos de funções de densidade φ(u).

Kernel $ \varphi(u) $
Uniforme $ \dfrac{1}{2}I(\mid u\mid \leq 1) $
Triangular $ (1-\mid u\mid)(\mid u\mid\leq 1) $
Epanechnikov $ \dfrac{3}{4}(1-u^{2})^{2}I(\mid u\mid \leq 1) $
Quadrático $ \dfrac{15}{16}(1-u^{2})^{2}I(\mid u\mid\leq 1) $
Triweight $ \dfrac{35}{32}(1-u^{2})^{3}I(\mid u\mid\leq 1) $
Cosseno $ \dfrac{\pi}{4}cos\left(\dfrac{\pi}{2}u\right)I(\mid u\mid\leq 1) $

 

Exemplo 4.3.1.3: Medições do diâmetro de um pino feitas com súbito, pegando 3 peças a cada 20 produzidas. Vamos analisar a estabilidade e a capacidade do processo considerando as seguintes especificações: LSE = 40 e LIE = 30.

Tabela 4.3.1.2: Medições do diâmetro do pino.

Amostra Medições Média
1 33,633 34,276 35,265 34,39
2 39,815 34,24 34,5 36,18
3 34,333 33,682 35,5 34,5
4 35,13 33,667 34,946 34,58
5 33,827 33,893 35,407 34,37
6 33,543 33,8 34,8 34,05
7 34,615 34,607 34,667 34,63
8 34,208 34,265 35,087 34,52
9 33,839 35,761 35,5 35,03
10 33,047 35 34,889 34,31
11 35,4 34,519 34,633 34,85
12 34,81 34,471 35,31 34,86
13 33,742 35,032 35,174 34,65
14 33,686 35,083 35,071 34,61
15 33,357 35,345 35,2 34,63
16 36,278 35,556 35,25 35,69

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Para esse exemplo temos

  • m = Número de Amostras = 16
  • n = Tamanho das Amostras = 3

Observando o papel de probabilidade a seguir vemos que os dados não seguem nenhuma distribuição conhecida testada.


Figura 4.3.1.3: Papel de probabilidade.

Portanto, vamos utilizar o método do núcleo (Kernel) para fazer uma análise de performance do processo.

A seguir temos os resultados obtidos pelo Software Action para esse exemplo.

 

Figura 4.3.1.4: Gráfico da análise de performance do processo - Método do núcleo.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.