Post on 17-Apr-2015
MÉTODOS QUANTITATIVOS
APLICADOS ÀS CIÊNCIAS
CONTÁBEIS
4º MÓDULO
TEMA:
Regressão de Mínimos Quadrados.
META:
Obter modelos matemáticos que se ajuste a dados da vida real, e estes modelos devem ser simultaneamente tão simples e tão precisos quanto possível.
PROB:
Suponhamos que os dados observados consistem em pares (X1,y1) (X2,y2) ... (Xn,yn) sejam conhecidos, e que a meta seja encontrar uma função y=f(x) que melhor se ajuste a estes valores.
Para tanto, podemos nos basear
da seguinte maneira:
PASSO 1:
Decidir que tipo de função.
TESTAR:
A - Isto pode ser feito através de uma análise teórica da situação prática subjacente, ou
B – pela inspeção do gráfico dos pontos citados.
PASSO 2:
Determinar a função específica.
DICA:
Uma vez escolhido o tipo de função, o próximo passo é determinar a função específica desse tipo de gráfico que está “o mais próximo” do conjunto de dados de pontos.
EM RESUMO:
Queremos encontrar uma função y=f(x) que melhor se ajuste a estes valores.
GRAFICAMENTE, TEMOS:
y1
y2
y3
y4
y
x
P4
E4
E3
P3
P2
E2
E1
P1
Neste que, uma forma conveniente de medir quão próximo uma curva, y=f(x), está de um determinado conjunto de pontos é calcular a soma dos quadrados das distâncias verticais dos pontos até a curva. No caso acima temos:
E2 = E2+E2+...+E2 1 2 n
Onde:
Ei = é a distância vertical do ponto Pi até a curva y=f(x).
CONCLUSÃO:
Quanto mais próximo da curva estiverem os pontos, melhor será esta soma, e a curva para qual esta soma é mínima é a “melhor” aproximação das observações da vida real. Isto é matematicamente provado de acordo com critério dos mínimos quadrados.
No caso polinomial do 1º grau (caso estatística linear), temos:
f(x)=ax+b
E2 = (y1-ax1-b)2+(y2-ax2-b)2+...(yn-axn-b)2
Queremos a e b em termos das observações reais tais que:
E2 = min [(y1-ax1+b)2+...(yn-axn+b)2]min
Então pelo MMR segue-se:
a= M
n xiyi - xi yiM
M
M
n xi – ( xi) M
2 2
&
b= 1n
( M
yi - a xi)M
ou
b=
M
n xi – ( xi) M
2 2
xiM
2 M
yi - xiM
xiM
yi
Aprofundando a Análise do processo de Regressão Linear:
A regressão polinomial do 1º grau ou modelo estatístico de regressão linear, é utilizado para explicar o prever de determinados eventos, baseando-se em fatores que podem ser qualitativos ou quantitativos, mais que sejam relacionáveis entre si. Por exemplo, consumo de cigarros e mortes devido a câncer de pulmão ou para um dado país , ano e renda familiar.
Considere um conjunto de dados advindo de observações da vida
real: (x1,y1),...(xn,yn) o modelo
matemático “linear mais propício para exprimir estas duas variáveis é o seguinte:
yi = axi+b+Ei ^
Onde:
yi = é a y observado yi = “ “ y estimado
^
ATENÇÃO - 1 :
A pesar de terem sido estimados os valores dos parâmetros de um modelo matemático e mesmo sabendo que a soma dos erros, ao quadrado, é a mínima, não se pode afirmar que esta reta representa bem os dados empíricos.
Como a reta de regressão é um resumo útil da tendência das observações, surge a seguinte questão:
Qual útil é a reta de regressão de mínimos quadrados ?
A resposta é baseada em duas medições estatísticas importantes:
O Erro Padrão da Estimativa
O coeficiente de determinação
Variância da amostra Se com (n-2)
2
S2e=
M (yi – yi)2^
(n-2)
O valor de Se representa a parte não-explicada da regressão.
O desvio padrão Se é dado por:
Se=
M (yi – yi)2^
(n-2)
Onde:
Se- desvio padrão é conhecido como erro padrão da estimativa, que mede a dispersão dos desvios ao redor da reta regressão.
ATENÇÃO - 2 :
Sendo realizado o processo de regressão linear, se espera que aproximadamente 95%
dos dados observados y se encontrem dentro do intervalo:
y-2Se≤y≤2Se
De seus respectivos valores projetados pela
reta de regressão y.^
^+y^_ _
COEFICIENTE DE DETERMINAÇÃO :
M N
i=1 (yi – yi)2^
r = 2
M N
i=1 (yi – yi)
2
Onde y representa a média aritmética de y.
DEFINIÇÃO :
O coeficiente de correção r mede o grau de associação linear de duas variáveis de um mesmo experimento.
Suponhamos que escolhemos como modelo de regressão a reta horizontal y=y(*) isto é, a equação (*) representa a média de y. Neste caso a=0, isto mostra que o valor da variância é zero e, conseqüentemente, o coeficiente de correção é nulo. Na verdade, a reta média não explica nada mais é um ponto interessante de partida.
^
GRAFICAMENTE :
x xi
b
y
yi
yi
^
Variação Explicada
Variação não- explicada
Ø
y= ax+b^
TEMOS :
a = tg =
Ø yi – y^
xi – x
Variação Total =
Variação Explicada =
Variação Não-Explicada =
M
(yi – y)2
M
(yi – y)2^
M
(yi – yi)2^
Variação Total = Var.Não-Exp. + Var.Exp.
r = 2 Variação Explicada
Variação Total
r = 2 M
(yi – y)2^
M
(yi – y)2