Metodologia de Superfície de Resposta Marília Canabarro Zordan Sabrina Letícia Couto da Silva MAT...

Post on 17-Apr-2015

105 views 0 download

Transcript of Metodologia de Superfície de Resposta Marília Canabarro Zordan Sabrina Letícia Couto da Silva MAT...

Metodologia de Superfície de RespostaMetodologia de Superfície de Resposta

Marília Canabarro Zordan

Sabrina Letícia Couto da Silva

MAT 02014 - Planejamento de Experimentos II

MÉTODOS DE SUPERFÍCIE DE RESPOSTA

-Conjunto de técnicas estatísticas usadas para analisar problemas com variáveis independentes contínuas em relação a variável aleatória.

- O objetivo é buscar a combinação dos fatores que otimizam a resposta.

-É usado quando:

• Fixa-se um fator A e varia-se o outro B.

• Fixa-se B onde a resposta é máxima e varia-se A.

• Variando os dois fatores conjuntamente.

- A modelagem é usada para estabelecer a relação entre a variável resposta e a(s) variável (is) independente(s), pois em geral esta não é conhecida e precisa de aproximação.

O procedimento seqüencial na MSR é encontrar os resultados da ANOVA e verificar se:

* São distante do ótimo, com pouca curvatura → Modelo de 1ª ordem

Leva de forma rápida e eficiente até a vizinhança do valor ótimo.

* A região ótima é encontrada → Modelo de 2ª ordem e análise do ótimo

Função e Representação Gráfica

• y é a resposta (variável dependente, p.e, produção de um objeto)

• x1 e x2 são os fatores (p.e, temperatura e pressão)

• y = f(x1,x2) + erro

• E(y) = η → η = f(x1,x2) = Superfície de Resposta

• y = η + erro

Uma possível representação gráfica para a SR seria:

x1 e x2 aparecem no plano

y aparece no eixo perpendicular

Um representação alternativa é o gráfico de contornos.

Desenham-se linhas de igual resposta de um gráfico cujas coordenadas representam os níveis dos fatores:

Para três ou mais fatores é mais comum a representação gráfica da superfície através do gráfico de contornos no espaço bidimensional, fixando um ou mais fatores no nível ótimo.

Exemplo:

Y = produção de uma reação química

A = Tempo de Reação (60,90,120,150,180 min)

B = Temperatura (210,220,230,240,250°C)

Procedimento Clássico

• Fixando B = 225°C → 130 min e 75g

• Fixando A = 130min → 225°C e 75g

E como os fatores se comportam conjuntamente?

É preciso conduzir o experimento variando ambos os fatores simultaneamente e então para representação gráfica usar um gráfico de contornos.

Continuando o exemplo...

A = 65 minutos

B = 225°C

Y = 91g

Conclusão do Exemplo: O procedimento de investigar uma variável independente (fator) de cada vez falha, pois ele assume que o máximo valor produzido por um fator é independente do máximo produzido pelo outro fator, o que nem sempre acontece.

Aproximações

Como nem sempre a relação entre fatores e resposta é conhecida, o primeiro passo em MSR é encontrar uma aproximação adequada para a relação entre eles, dentro de uma faixa limitada do “espaço de fatores”.

Se a resposta é bem modelada por uma função linear das var. independentes:

y = β0 + β1x1 + ... + βkxk + ε

A análise da SR é então feita em termos da SR ajustada.

Modelos de Primeira OrdemMétodo da Máxima Inclinação Ascendente

1 - Delineamentos Exploratórios de Tratamentos

2 – Fatoriais da série 2k

Onde,

K = n° de fatores completos ou fracionados

2 = n° de níveis

3 – Verificar se há acréscimo (decréscimo) na resposta ou não, com a presença dos fatores

• Condições iniciais estão afastadas daquelas que otimizam a resposta → Modelo de 1ª Ordem

• O objetivo é mover o experimento rapidamente para a vizinhança geral do ótimo utilizando um procedimento experimental simples, rápido, econômico e eficiente.

• MMIA procura a MÁXIMA inclinação ascendente

• MMID procura a MÍNIMA inclinação descendente

• O gráfico de contornos da SR de 1ª ordem são uma série de linhas paralelas. A direção da MIA é a direção na qual y estimado cresce mais rapidamente.

X1

X2

Usualmente, toma-se como caminho da MIA a linha a partir do centro da região de interesse e os “passos” ao longo do caminho são determinados pela experiência do pesquisador.

Utiliza-se um conjunto de tratamentos em torno do ponto inicial e estima-se por Mínimos Quadrados as inclinações βi. A partir das magnitudes e sinais destas inclinações, calcula-se a direção da MIA.

• Experimentos são conduzidos ao longo do caminho da MIA até que nenhum incremento na resposta seja observado. E repetir a seqüência novamente.

•Eventualmente chega-se a vizinhança do valor ótimo e isto será indicado pela falta de ajuste do modelo de 1ª ordem.

• A aproximação por um plano se torna insatisfatória pelo fato dos efeitos de ordens mais elevadas, particularmente os de 2ª ordem (quadrático e de interação linear), se tornarem relativamente mais importantes. Nesse caso usa-se Modelo Quadráticos.

EXEMPLO (produção do reagente):

O processo normal é operado com um tempo de 35min e uma temperatura de 155°F, que resulta numa produção de 40%.

Como a região ótima é desconhecida ajusta-se um modelo de 1ª ordem por MMIA.

A região experimental será (30,40) min para o tempo de reação e (150,160)°F para temperatura.

As variáveis independentes podem ser recodificadas para (-1,1) para simplificar os cálculos.

Se ξ1 e ξ2 representam as variáveis naturais para tempo e temperatura respectivamente, os valores são codificados:

5x

5x 1551

2351

1

“Tamanho do Passo”

Média do Intervalo

O delineamento a ser utilizado nesse experimento consiste de um Fatorial 22 aumentado por CINCO PONTOS (Tratamentos) CENTRAIS.

Com a utilização dos pontos centrais é possível estimar o erro experimental e testar a adequabilidade (“lack of fit”) do modelo de 1ª ordem. Além disso, nesse caso, o tratamento central representa as condições de operação normalmente empregadas.

Deve-se ajustar aos dados um modelo de primeira ordem, ou seja, a equação de regressão

2211o xˆxˆˆy

Dados

Variáveis Naturais Variáveis Codificadas Resposta

ξ1 ξ2 x1 x2 y

30 150 -1 -1 39,3

30 160 -1 1 40,0

40 150 1 -1 40,9

40 160 1 1 41,5

35 155 0 0 40,3

35 155 0 0 40,5

35 155 0 0 40,7

35 155 0 0 40,2

35 155 0 0 40,6

A equação de regressão encontrada é:

21 x325,0x775,044,40y

A SQTotal é encontrada da mesma forma de qualquer outra análise, mas é particionada em SQRegressão e SQResíduos. A SQErro com 4GL também é obtida de forma tradicional, porém só com os valores dos pontos centrais.

Assim, o modelo de primeira ordem assume que os fatores possuem um efeito aditivo sobre a resposta.

A interação entre os fatores pode ser obtida adicionando o termo x1x2 e é medida pelo coeficiente β12. A estimativa é obtida (considerando as variáveis codificadas) por:

)yxyxyxyx(tratden

1ˆ4232211112

tratden

)yy(SQInt

2meioextremos

Para o exemplo...

025,055,41*1)9,40*1()40*1(3,39*14

1ˆ12

0025,04

)]5,4040()5,413,39[(SQInt

2

A estatística da falta de ajuste é:

058,0043,0

0025,0

QME

SQIntF F(1,4)=7,71 a 5%

Logo, NS.

1 GL

Outra verificação da adequabilidade do modelo é obtida pela comparação da resposta média dos quatro pontos do fatorial (40,425), com a resposta média do centro do delineamento (40,46).

Se β11 e β22 são os coeficientes dos termos

quadráticos , então a diferença das médias

é uma estimativa de β11+ β22.

22

21 xex

035,046,40425,40yyˆˆ211211

0027,054

)035,0)(5*4(

nn

)yy(nnSQQuad

2

cf

221cf

0663,00430,0

0027,0

QME

coSQQuadrátiF

Efeito quadrático NS a 5% de significância.

Causas da Variação SQ GL QM F

Regressão 2,8250 2 1,4125 47,83*

Resíduo 0,1772 6 0,0295

Interação 0,0025 1 0,0025 0,058

Quadr. Puro 0,0027 1 0,027 0,063

Erro 0,1720 4 0,0430

Total 3,0022 8

* Significante a 1%

Assim, não existe nenhuma razão para questionar o modelo de primeira ordem. Os próximos passos da MIA devem seguir.

Os fatores devem variar nas proporções das estimativas dos Betas, ou seja, para cada 0,775 unidades acrescidas em x1, x2 deve aumentar 0,325 unidades. Destransformando-a, direção da MIA é definida por:

5x0,775 = 3,875 minutos → 5x0,325=1,625°

O caminho principal a partir da origem (0,0) nesta direção pode ser obtido por um incremento conveniente a um dos fatores (p.e, 5 minutos para tempo). As mudanças proporcionais do outro fator:

0,325/0,775=0,42.

Assim, estas quantidades devem ser acrescidas aos níveis base dando origem ao caminho da MIA.

O engenheiro realizou os ensaios de acordo com esse caminho e observou a produção nesses pontos até que um decréscimo na resposta foi notado.

Os resultados estão na tabela a seguir:

i

Variáveis Codificadas Variáveis Naturais Resposta

X1 X2 ξ1 ξ2 y

Nível Base 0 0 35 155

Unidade 5 5

Unidade* 3,875 1,625

Variação do Nível 1,00 0,42 5 2

Ensaio 1 1 0,42 40 157 41,0

Ensaio 2 2 0,84 45 159 42,9

Ensaio 3 3 1,26 50 151 47,1

Ensaio 4 4 1,68 55 163 49,7

Ensaio 5 5 2,10 60 165 53,8

Ensaio 6 6 2,52 65 167 59,9

Ensaio 7 7 2,96 70 169 65,0

Ensaio 8 8 3,36 75 171 70,4

Ensaio 9 9 3,78 80 173 77,6

Ensaio 10 10 4,20 85 175 80,3

Ensaio 11 11 4,62 90 177 76,2

Ensaio 12 12 5,04 95 179 75,1

Incrementos na resposta são observados até o 10° passo; depois há um decréscimo na produção.

Portanto, outro modelo de primeira ordem pode ser ajustado em torno do ponto (85,175). A região de exploração para tempo seria (80,90) e de temperatura (170,180).

Codificam-se os níveis das variáveis tempo e temperatura novamente como (-1,1) e um delineamento fatorial 22 acrescido de 5 pts centrais será utilizado.

Assim repete-se todo o processo e os resultados são analisados a seguir:

Variáveis Naturais

Variáveis Codificadas

Resposta

1 2 X1 X2 y

80 170 -1 -1 76.5

80 180 -1 1 77.0

90 170 1 -1 78.0

90 180 1 1 79.5

85 175 0 0 79.9

85 175 0 0 80.3

85 175 0 0 80.0

85 175 0 0 79.7

85 175 0 0 79.8

Dados para ajuste do segundo modelo de 1ª Ordem:

x e x 21 5

175

5

85 21

O modelo de 1ª Ordem ajustado aos dados codificados é dado por:

Ŷ = 78.97 + 1.00 X1 + 0.50 X2

Causas da Variação SQ GL QM F

Regressão 5,0000 2 2,5000 47,17*

Resíduo 11,1200 6

Interação 0,2500 1 0,2500 4,72

Quadr. Puro 10,6580 1 10,6580 201,09 *

Erro Puro 0,2120 4 0,0530

Total 16,1200 8

* Significativo a 1%

- Pela tabela de ANOVA, o componente do termo quadrático puro foi significativo, isso implica que o modelo de 1ª Ordem não é uma aproximação adequada;

- Essa curvatura na real superfície pode indicar que se está próximo do ótimo. Assim, análises adicionais devem ser feitas para localizar o ótimo com mais precisão.

Algoritmo geral para determinar as coordenadas de um ponto no caminho da máxima inclinação ascendente:

- assumir que o ponto x1=0, x2=0, ...,xk=0 é a base ou origem.

1. Escolha um tamanho para uma das variáveis independentes,

por exemplo, xj. Geralmente, selecionamos a variável que

temos maior conhecimento, ou aquela que tem maior

coeficiente de regressão em módulo .

2. O passo nas demais variáveis é:

|ˆ| j

ji k;1,2,...,i xjj

i

xi /ˆ

ˆ

3. Converter xi das variáveis codificadas para as variáveis naturais.

- Quando o pesquisador está próximo da região de ótimo, um modelo que incorpora o efeito de curvatura é indicado.

O modelo de 2ª Ordem é dado por:

Análise de Modelos de Segunda OrdemAnálise de Modelos de Segunda Ordem

jiij

k

iiii

k

iii xxxxy

1

2

10

• Como encontrar o ponto ótimo (estacionário)?

• Qual a natureza da superfície de reposta?

Localização do ponto estacionário

Desejamos encontrar os níveis de x1, x2, ...,xk, que maximizam a resposta estimada (predita).

Este ponto, se existir, será um conjunto de x1, x2, ...,xk para o qual as derivadas parciais são iguais a zero:

.0/ˆ..../ˆ/ˆ 21 kxyxyxy

Esse ponto, x1.S, x2.S, ...,xk.S é o dito PONTO ESTACIONÁRIOPONTO ESTACIONÁRIO.

Este ponto pode representar um MÁXIMO, MÍNIMO ou PONTO DE SELA.

Ponto de máximo (xS)

x1

x2

8070

60

x1

x2

6070

80

Ponto de mínimo (xS)

Determinação do ponto estacionário:

Solução matemática geral. O modelo de 2ª Ordem escrito na forma matricial fica:

Bxxbxy 'ˆˆ ' 0

kk

2k22

1k1211

k

2

1

k sim.

..

B

.

.

.b

x

x

x

x

ˆ.

.

.

2/ˆ.ˆ2/ˆ...,2/ˆˆ

ˆ

ˆ

ˆ

.

.

.2

1

Onde: b é um vetor (k x 1) dos coeficientes de regressão de 1ª ordem e B é uma matriz simétrica (k x k) onde na diagonal têm-se os coeficientes de regressão de 2ª ordem e fora da diagonal os coeficientes de interação.

As derivadas parciais dos valores preditos da resposta ( y chapéu) com relação aos elementos de x e colocadas iguais a zero são dadas por:

0Bxbx 2y

O ponto estacionário é a solução da equação anterior, ou seja,

bBx 1 21

s

O valor predito da variável resposta no ponto estacionário é:

bx '21

0ˆˆ ssy

Demonstração:

bx2

1y

bBb2

1y

bIBb4

1bBb

2

1y

bBBBb4

1bBb

2

1y

Bxxbxy

0

10

110

1110

0

'

'

''

''

'

ˆˆ

ˆˆ

ˆˆ

ˆˆ

'ˆˆ

Natureza da superfície de resposta

Desejamos saber se o ponto estacionário é um ponto de máximo, mínimo ou ponto de cela.

-Forma mais direta: gráfico de contorno do modelo de regressão ajustado aos dados.

-Mesmo com poucas variáveis independentes, uma análise mais formal, denominada de Análise Canônica, pode ser útil.

Análise Canônica (Facilita a interpretação dos resultados!!!)

Considere uma translação (novo sistema de coordenadas) da superfície de resposta da origem (x1, x2,...,xk)=(0, 0,...,0) para o ponto estacionário xS e então rotacione os eixos desse sistema até que eles fiquem paralelos aos eixos principais da superfície de resposta ajustada.

Na figura no próximo slide isso pode ser visualizado...

x1

x2

x1,S

x1,S

w2

w1

A função de resposta em termos das novas variáveis w1, w2,...,wk (forma canônica) é dada por:

2222

211 ...ˆˆ kks wwwyy

Onde os wi são as variáveis indep. transformadas e os i são constantes. O ŷs é a resposta estimada no ponto estacionário xS. Os i são os autovalores ou raízes características da matriz B.

FORMA CANÔNICA DO MODELO

Estudo da natureza da Superfície de RespostaEstudo da natureza da Superfície de Resposta

- Este estudo pode ser feito considerando o ponto estacionário e os sinais e magnitudes dos (i).

- Suponha que o ponto estacionário esteja dentro da região na qual foi ajustado o modelo de 2ª ordem.

- Se todos os valores de (i) são positivos, então, xs é um ponto de resposta mínima; se os (i) são todos negativos, então, xs é um ponto de resposta máxima; se os valores de (i) tem sinais positivos e negativos, então, xs é um ponto de sela.

- Além disso, a superfície tem inclinação na direção de wi para o qual o valor de |i| é maior.

- Por exemplo, na figura anterior, xs é um ponto de máximo (todos os (i) são negativos) e |1| > |2|.

Exemplo 2:Exemplo 2: vamos continuar com a análise do processo químico do ex 1 (2ª fase do estudo).

Para ajustar um modelo de 2ª ordem, o pesquisador decide aumentar o delineamento com pontos adicionais (o engenheiro usou 4 OBS adicionais mais ou menos no mesmo tempo em que executou os 9 tratamentos anteriores).

Os 4 tratamentos adicionais foram:

(x1=0; x2=± 1,414)

(x1=± 1,414; x2=0)

Este delineamento denomina-se de DELINEAMENTO CENTRAL COMPOSTO.

Delineamento central compostoVariáveis naturais Variáveis codificadas Respostas

1

2 x1 x2 y1

(produção)y2

(viscosidade)y3

(peso molecular)80 170 -1 -1 76.5 62 294080 180 -1 1 77.0 60 347090 170 1 -1 78.0 66 368090 180 1 1 79.5 59 389085 175 0 0 79.9 72 348085 175 0 0 80.3 69 320085 175 0 0 80.0 68 341085 175 0 0 79.7 70 329085 175 0 0 79.8 71 3500

92,07 175 1,414 0 78.4 68 336077,93 175 -1,414 0 75.6 71 3020

85 182,07 0 1,414 78.5 58 363085 167,93 0 -1,414 77.0 57 3150

VARIÁVEL RESPOSTA

•(0,0)

(-1,1)

(-1,-1)

(1,1)

(1,-1)

x1

x2

• •

(1,414,0)

(0,-1,414)

(0,1,414)

(-1,414,0)

Delineamento Central Composto para o exemplo 1 (processo químico)

Response Surface for Variable PRODUCAO

Response Mean 78.476923 Root MSE 0.266290 R-Square 0.9827 Coef. of Variation 0.3393

Degrees of Type I Sum Regression Freedom of Squares R-Square F-Ratio Prob > F

Linear 2 10.042955 0.3494 70.814 0.0000 Quadratic 2 17.953749 0.6246 126.6 0.0000**

Crossproduct 1 0.250000 0.0087 3.526 0.1025 NS

Total Regress 5 28.246703 0.9827 79.669 0.0000

Degrees of Sum of Residual Freedom Squares Mean Square F-Ratio Prob > F

Lack of Fit 3 0.284373 0.094791 1.789 0.2886 NS

Pure Error 4 0.212000 0.053000 Total Error 7 0.496373 0.070910

Análise no DOE do SAS 8.0:

EfeitoQuadrático

significativo a 1%.O modelo de 2ª

Ordem será ajustado!

Gráfico de ContornoGráfico de Contorno

Pelo gráfico de contornos, observa-se que o processo é mais sensível (levemente) à mudanças no tempo de reação do que para mudanças na temperatura.

Superfície de RespostaSuperfície de Resposta

Observa-se que o ótimo está próximo de 175oF e 85 min e que a resposta neste ponto é um ponto de máximo.

Ponto Ótimo (85 min; 175º F)

Determinação da localização do ponto estacionário (máximo).

Temos que:

001,11250,0

1250,03761

5150

9950 ,

,

,Bb

O ponto estacionário é dado por:X1,s

.306,0

389,0

515,0

995,0

0096,10917,0

0917,07345,021

21

s

-

bBx 1

X2,s

Em termos das variáveis naturais, o ponto estacionário é dado por:

51763060

8795863890

25175

1585

2

1

,,

,,

O valor da resposta estimada no ponto estacionário é:

.21,80515,0

995,0306,0389,0ˆ

ˆˆ '21

0

21

s

s

79.94y

y bxs

ANÁLISE CANÔNICA - Objetivo: caracterizar a superfície de resposta

Vamos expressar o modelo ajustado na forma canônica. 1º precisamos encontrar os autovalores, 1 e 2. Os autovalores são as raízes do determinante da equação:

00013112500

1250037701

0IB

,,

,,

A equação fica: 02 71.362663932.377786As raízes desta equação de segundo grau são: 1=-0,9635 e 2=-1,4143. A forma canônica do modelo ajustado fica:

22

21 w41431w963502180y ,,,ˆ

Ponto de máximoAmbos negativos