Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA
Transcript of Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA
UNIVERSIDAD NACIONAL DE TRUJILLO
FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS
ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS
UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN
INFORME FINAL DE PRÁCTICA PRE-PROFESIONAL
PARA OPTAR EL TÍTULO DE LICENCIADO EN MATEMÁTICAS
AUTOR:
LUIS ALBERTO BLAS BALTODANO
ASESOR:
Dr. MILTÓN CORTÉZ GUTIÉRREZ
TRUJILLO - PERÚ
2015
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
UNIVERSIDAD NACIONAL DE TRUJILLO
FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS
ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS
UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN
INFORME FINAL DE PRÁCTICA PRE-PROFESIONAL
PARA OPTAR EL TÍTULO DE LICENCIADO EN MATEMÁTICAS
AUTOR:
LUIS ALBERTO BLAS BALTODANO
ASESOR:
Dr. MILTÓN CORTÉZ GUTIÉRREZ
TRUJILLO - PERÚ
2015
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Jurado
Dr. ULISES ZAVALETA CALDERÓN
Presidente
Dr. NELSON OMAR ARAGONÉS SALAZAR
Secretario
Ms. JORGE LUIS HORNA MERCEDES
Vocal
iii
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Dedicatoria
A mi madre:YOLANDA BALTODANO Y.
que con mucho amor y constante apoyo
y sacrificio supo guiarme
para lograr alcanzar mi sueño.
A mis Abuelitos: Segundo y Angelica
Que ya no están conmigo, pero que
este sueño era compartido por ellos
mi profundo agradecimiento
por su constante apoyo
y cariño que me supieron dar
en los momentos adversos.
iv
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Agradecimiento
Es propicia la oportunidad para expresar mi agradecimiento a todos los profesores
de la Escuela de Matemáticas que con su aporte intelectual me guiarón por el camino
del estudio y superación, en especial a la Dra. Jenny Rojas, por su valiosa orientación
y apoyo en la culminación del presente trabajo.
v
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Presentación
Señores miembros del jurado:
En cumplimiento a lo prescrito por el reglamento de grados de la Facultad de Ciencias
Físicas y Matemáticas de la Escuela de Matemáticas de la Universidad Nacional de
Trujillo, me es honroso presentar a vuestra consideración el presente trabajo titulado:
UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN;
para optar el Título de Licenciado en Ciencias Matemáticas. Con la consideración de
que el presente trabajo pueda estar incompleto, acepto muy honestamente todas sus
apreciaciones y sugerencias que tengan a bien formular, lo cual me servirá para mejorarlo
en el futuro.
El Autor
vi
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Lista de Símbolos
conv(S) — Envolvente convexa de S.
epi(f) — Epígrafo de la función convexa f .
vii
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Resumen
En este trabajo identificamos las técnicas que estudia la optimización convexa y su
importancia en aplicaciones de ingeniería, en telecomunicaciones, proceso de señales,
economía, etc. pues permite identificar la estructura de la solución óptima, debido a
que cualquier solución local es también una solución global y además existe una teoría
de dualidad asociada al problema de optimización convexa y unas condiciones de punto
optimal que permiten verificar si la solución hallada es la exacta o la mejor aproximación
a ella.
En los últimos años se han producido avances significativos en la utilización de técnicas
de optimización convexa en las diversas áreas de aplicación, como las mencionadas en el
párrafo anterior y en problemas como: localización de sensores; optimización de potencia
en redes de tipo malla; tratamiento de imágenes, producción, etc. sobre todo hallando
la solución de manera eficiente a problemas que originalmente eran intratables.
Por lo tanto en este trabajo se presenta las diferentes técnicas matemáticas para la res-
olución de problemas de optimización convexa y donde se encuentra la solución óptima
del problema.
Debido a las diversas aplicaciones de la optimización convexa, aqui tambien resolvemos
el problema de optimizar una función convexa f : Rn → R, bajo restricciones de regiones
también convexas planteándonos como objetivos principales, el análisis de la solución del
problema, la caracterización de la solución de un problema convexo, y la aplicación de
esta teoría en problemas de economía o ingeniería.
viii
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Abstract
In this paper we identify techniques that studies the convex optimization and its im-
portance in engineering applications, telecommunications, signal processing, economics,
etc. then identifies the structure of the optimal solution, because any local solution is
also a global solution and also there is associated duality theory of convex optimization
problem and optimal conditions point that show whether the exact solution is found or
best approximation to it.
In recent years there have been significant advances in the use of convex optimiza-
tion techniques in various application areas, such as those mentioned in the preceding
paragraph and problems such as: location of sensors; Power optimization in mesh-like
networks; image processing, production, etc. especially finding efficient solution to in-
tractable problems that were originally manner.
Therefore in this paper the mathematical models for solving convex optimization prob-
lems and where the optimal solution is found techniques is presented. In this paper the
mathematical models for solving convex optimization problems and where the optimal
solution is presented techniques.
Due to the various applications of convex optimization, in this paper we solve the prob-
lem of optimizing a convex function f : Rn → R, under restrictions by posing convex
regions also main objectives, analysis of the solution of the problem, the characterization
of the solution of a convex problem and the application of this theory in economics or
engineering problems.
ix
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Introducción
La optimización es una herramienta esencial para la formulación de muchos proble-
mas, estudia el cómo hacer la mejor elección cuando se tiene un conjunto limitado de re-
querimientos y una función definida sobre ellos, la cual debe minimizarse o maximizarse.
La Optimización, como línea de investigación, surgió a mediados del siglo anterior y en
todo este tiempo se ha usado en diversas aplicaciones de diferentes áreas. En un inicio, el
trabajo de Lions y Stampacchia[6] sobre desigualdades variacionales, motivaron el estu-
dio de la convergencia de la solución del problema de aproximación, que posteriormente
fue usada por Attouch[1], para establecer la convergencia de la aproximación de Yoshida
para la solución de la resolvente de ecuaciones tipo evolución. Similares interrogantes sur-
gen en problemas de optimización, Wysman[15] fue el primero en aplicar estos resultados
a problemas de la teoría de Decisión y Van Cutsem aplicó estos resultados a problemas
de optimización estocástica. En el presente trabajo revisamos las características sobre-
salientes de la teoría de convergencia de funciones convexas. La optimización convexa
estudia de manera concreta la minimización de funciones convexas reales definidas para
variables que se encuentran en un subconjunto convexo de un espacio vectorial.
El problema de optimización puede ser expresado, sin perder generalidad, como:
Min{f(x) : g(x) = 0},
donde f : Rn → R y g : Rm → Rn, donde x es la variable a determinar. Las técnicas
que estudia la optimización convexa son importantes en aplicaciones de ingeniería, en
telecomunicaciones, proceso de señales, economía, etc. pues permite identificar la estruc-
tura de la solución óptima, debido a que cualquier solución local es también una solución
global y además existe una teoría de dualidad asociada al problema de optimización con-
x
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
vexa y unas condiciones de punto optimal que permiten verificar si la solución hallada
es la exacta o la mejor aproximación a ella. Por otro lado esta teoría también permite el
diseño de algoritmos numéricos muy potentes que resuelven este tipo de problemas de
forma bastante eficiente[2]. En los últimos años se han producido avances significativos
en la utilización de técnicas de optimización convexa en las diversas áreas de aplicación,
como las mencionadas en el párrafo anterior y en problemas como: localización de sen-
sores; optimización de potencia en redes de tipo malla; tratamiento de imágenes[12],
producción, etc. sobre todo hallando la solución de manera eficiente a problemas que
originalmente eran intratables.
Debido a las diversas aplicaciones de la optimización convexa, en el presente trabajo
resolvemos el problema de ¿Cómo utilizar una función convexa f : Rn → R, bajo re-
stricciones de regiones también convexas?, planteándonos como objetivos principales, el
análisis de la solución del problema, la caracterización de la solución de un problema
convexo, y la aplicación de esta teoría en problemas de economía.
El trabajo se ha organizado en los siguientes capítulos: En el primer capítulo, presen-
tamos los conceptos y propiedades básicas de conjuntos, funciones convexas y convergen-
cia de funciones convexas así como también los principios básicos de dualidad necesarios
en el estudio de las condiciones de optimalidad en los problemas de optimización y se
definen algunos símbolos y notaciones necesarios para un buen entendimiento del tra-
bajo. En el segundo capítulo presentamos el problema de optimización convexa, sus
propiedades, equivalencias y algunos métodos de resolución para este tipo de problemas
de optimización. En el tercer capítulo, presentamos la formulación y resolución de prob-
lemas de optimización convexa, relacionados a la economía. Finalmente presentamos las
conclusiones del trabajo.
xi
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Índice general
Jurado iii
Dedicatoria iv
Agradecimiento v
Lista de Símbolos vii
Resumen viii
Abstract ix
Introducción x
1. Preliminares 2
1.1. Conjuntos y Funciones Convexas . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1. Separación y Soporte de Conjuntos . . . . . . . . . . . . . . . . . 3
1.1.2. Conjuntos Poliédricos - Puntos Extremos . . . . . . . . . . . . . . 9
1.1.3. Funciones Convexas. . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2. Generalización de una Función Convexa . . . . . . . . . . . . . . . . . . 14
1.2.1. Función Cuasi-Convexa . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.2. Funciones Cuasi-Convexas Diferenciables . . . . . . . . . . . . . . 16
1.2.3. Funciones Estrictamente Cuasi - Convexas . . . . . . . . . . . . . 19
1.3. Convergencia de Funciones Convexas . . . . . . . . . . . . . . . . . . . . 20
1.4. Dualidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.4.1. Función Dual de Lagrange . . . . . . . . . . . . . . . . . . . . . . 23
1
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4.2. Problema Dual Lagrangiano . . . . . . . . . . . . . . . . . . . . . 25
1.4.3. Interpretación Geométrica del Problema Dual Lagrangiano . . . . 25
1.4.4. Condición de Slater . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.5. Condiciones de Optimalidad . . . . . . . . . . . . . . . . . . . . . 29
2. Optimización Convexa 33
2.1. Formulación Estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2. Óptimo Local y Global . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3. Problemas Convexos Equivalentes . . . . . . . . . . . . . . . . . . . . . . 40
2.3.1. Eliminando las Restricciones de Igualdad. . . . . . . . . . . . . . 40
2.3.2. Agregando Restricciones de Igualdad. . . . . . . . . . . . . . . . . 40
2.3.3. Variables de Holgura. . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.3.4. Problema de la Forma Epígrafo. . . . . . . . . . . . . . . . . . . . 41
2.3.5. Minimización Sobre Algunas Variables. . . . . . . . . . . . . . . . 41
2.4. Optimización Cuasi-Convexa. . . . . . . . . . . . . . . . . . . . . . . . . 42
2.4.1. Condiciones de Optimalidad y Solución Óptima Local . . . . . . . 42
2.4.2. Optimización Cuasi-Convexa vía Problemas de Factibilidad Con-
vexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.4.3. Método de Bisección para Optimización Cuasi-Convexa . . . . . . 45
2.5. Clasificación de Problemas de Optimización Convexa . . . . . . . . . . . 46
2.5.1. Problemas de Optimización Lineal . . . . . . . . . . . . . . . . . 46
2.5.2. Problemas de Optimización Cuadráticas . . . . . . . . . . . . . . 50
2.5.3. Programación Cónica de Segundo Orden . . . . . . . . . . . . . . 51
2.5.4. Programación con Desigualdades Generalizadas . . . . . . . . . . 51
2.5.5. Programación Geométrica . . . . . . . . . . . . . . . . . . . . . . 53
3. Aplicación de Optimización Convexa: Aproximación y Ajuste 56
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2. Aproximación de Norma . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1. Problema Básico de Aproximación de Norma . . . . . . . . . . . . 57
3.2.2. Aproximación mediante una función de Penalización . . . . . . . . 78
2
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Conclusiones 82
Bibliografía 83
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Capítulo 1
Preliminares
1.1. Conjuntos y Funciones Convexas
En esta sección se presentan definiciones y propiedades básicas sobre conjuntos y
funciones convexas.
Definición 1.1. Un conjunto S ⊂ Rn se dice que es convexo si para cada x1, x2 ∈ S,
entonces λx1 + (1− λ)x2 ∈ S, ∀ λ ∈ [0, 1].
La forma λx1 + (1− λ)x2, λ ∈ [0, 1] se llama combinación convexa de x1 y x2.
Por inducción se prueba la generalización
λ1x1 + λ2x2 + . . .+ λnxn =k∑
j=1
λjxj . . .
l∑j=1
λjxj
Definición 1.2. Sea S ⊂ Rn, la envolvente convexa de S, denotado por conv(S) es
el conjunto de todas las combinaciones convexas de S.
Es decir:
x ∈ conv(S) =⇒ x =k∑
j=1
λjxj ;k∑
j=1
λj = 1
Definición 1.3. S se llama cono convexo ⇔ ∀x1, x2 ∈ S, ∀λ ∈ (0, 1) se tiene
λx1 + (1− λ)x2 ∈ S.
Definición 1.4. S se llama cono con vértice en 0 ⇔ ∀x ∈ S, ∀λ > 0 se tiene λx ∈ S
2
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
1.1.1. Separación y Soporte de Conjuntos
En optimización, las nociones de hiperplanos soporte y separación de conjuntos con-
vexos disjuntos, son muy importantes. Casi todas las condiciones de optimalidad y las
relaciones de dualidad usan los conceptos y propiedades de separación y soporte de con-
juntos convexos.
Los resultados de esta sección se basan en el siguiente hecho geométrico: dado S un
conjunto convexo y cerrado y un punto y /∈ S existe un único punto x ∈ S con distancia
minima a y y un hiperplano que separa y y S.
Teorema 1.5. Sea S un conjunto convexo cerrado no vacío en Rn y sea y /∈ S. Entonces
existe un único x ∈ S con distancia minima a y. Además, x es el punto minimizante si
y solo si (y − x)t(x− x) ≤ 0 ∀x ∈ S.
Prueba. ver [Bazaraa]
Observación.
S
αt
( x − x ) = 0
y
xx
Figura 1.1:
El ángulo entre los vectores (y−x) y (x−x) para cualquier x ∈ S es mayor o igual a 90◦,
por lo tanto (y− x)t.(x− x) ≤ 0, ∀x ∈ S los que nos dice que el conjunto S queda en el
semi espacio αt(x− x) = 0 que pasa a través de x y tiene una normal α = (y− x). Esta
característica no necesariamente se cumple en conjuntos no-convexos, como se observa
en el siguiente gráfico:
3 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
S
x
y
Figura 1.2:
Definición 1.6. Un hiperplano H en Rn esta formado por:
H = {x ∈ Rn : ptx = α}
donde p ∈ Rn no-nulo y α es un escalar.
El vector p se llama normal del hiperplano H. Un hiperplano H define dos semi espacios
cerrados
H+ = {x ∈ Rn : ptx ≥ α}
y
H− = {x ∈ Rn : ptx ≤ α}
Y dos semi espacios abiertos
H+ = {x ∈ Rn : ptx > α}
y
H− = {x ∈ Rn : ptx < α}
Observación.
◦ Cualquier punto en Rn cae en H+, en H− o en ambos.
◦ Un hiperplano H y el correspondiente semiespacio pueden escribirse en referencia
a un punto fijo.
4 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
◦ Si x ∈ H, entonces ptx = α y cualquier x ∈ H debe satisfacer
ptx− ptx = α− α
ptx− ptx = 0
pt(x− x) = 0
Ejemplo.
Sea H = {x ∈ R4 : x1 + x2 − x3 + 2x4 = 4}, el vector normal p =
1
1
−1
2
. Luego
el hiperplano H puede escribirse tomando como referencia cualquier punto x ∈ H, por
ejemplo x =(
0, 6, 0, −1)t
,
en este caso
H = {x ∈ R4 : pt(x− x) = 0}
= {x ∈ R4 : (1, 1,−1, 2).(x1, x2 − 6, x3, x4 + 1) = 0}
= {x ∈ R4 : x1 + x2 − 6− x3 + 2(x4 + 1) = 0}
Geométricamente:
H+
−Η
p
x
Figura 1.3:
5 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
Definición 1.7. Sean S1 y S2 conjuntos no vacíos en Rn. Un hiperplano
H = {x ∈ Rn : ptx = α} se dice que separa S1 y S2 si ptx ≥ α, ∀x ∈ S1 y ptx ≤
α, ∀x ∈ S2.
Si además S1 ∪ S2 ⊂ H entonces H separa de manera propia a S1 y S2.
Si ptx > α ∀x ∈ S1 y ptx < α, ∀x ∈ S2 se dice que H separa de manera estricta S1 y
S2.
Si ptx ≥ α + ϵ ∀x ∈ S1 y ptx ≤ α ∀x ∈ S2 para ϵ > 0 escalar, se dice que H separa
fuertemente S1 y S2.
En la siguiente gráfica se muestra las diferentes tipos de separaciones:
S
S
2
1
S
S
1
2
S
S
H
1
2
H
S
S
1
2
Figura 1.4:
El siguiente teorema es uno de los mas importantes teoremas de separación, que es
la base de condiciones de optimalidad en optimización.
Teorema 1.8. Sea S un conjunto convexo cerrado y no vacío en Rn y sea y ∈ S entonces
existe un vector p ∈ Rn no nulo y un escalar α tal que pty > α y ptx ≤ α, ∀x ∈ S.
Prueba.
Sea S ⊂ Rn no vacío cerrado y convexo, sea y ∈ S, luego por el teorema (1.5), existe
x ∈ S único tal que (x − x)t(y − x) ≤ 0 ∀x ∈ S. como y ∈ S y − x = 0 entonces
considerando p = (y − x) y α = xtp = ptx se tiene que
(x− x)tp ≤ 0 ∀x ∈ S
pt(x− x) ≤ 0
ptx− ptx ≤ 0
6 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
ptx ≤ ptx
ptx ≤ α ∀x ∈ S
mientras que
pty − α = pty − ptx
= pt(y − x)
= (y − x)t(y − x) > 0
= ∥y − x∥2 > 0. �
Una consecuencia conocida de este teorema que se usa para tener condiciones de
optimalidad tanto de problemas de optimización lineal como no lineal como el teorema
de Farkas que establece lo siguiente: Sea Am×n y c un n-vector, entonces exactamente
uno de los siguientes sistemas tiene solución:
Sistema 1:
Ax ≤ 0 y ctx > 0 , x ∈ Rn
Sistema 2:
Aty = c y y ≥ 0 , y ∈ Rm
Prueba.(ver Bazaraa)
Definición 1.9. Sea S ⊂ Rn no vacio y sea x ∈ ∂S(frontera de S).Un hiperplano
H = {x ∈ Rn : pt(x − x) = 0} se llama hiperplano soporte de S en x si S ⊆ H+, es
decir que pt(x− x) ≥ 0 ∀x ∈ S o S ⊆ H−, es decir pt(x− x) ≤ 0 ∀x ∈ S.
Si además S ⊂ H, H es un hiperplano de separación propio de S en x.
Observación.
La definición es equivalente a decir que H = {x ∈ Rn : pt(x− x) = 0} es un hiperplano
soporte de S en x ∈ ∂S si
ptx = ınf{ptx : x ∈ S}
7 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
de lo contrario
ptx = sup{ptx : x ∈ S}
Geométricamente, se tiene:
S
x
H
Hiperplano soporte Único
S
x−
H
Infinitos hiperplanos soporte
H
x
x
1
−
−
2
Hiperplano soporte
en más de un punto
H
S
x−
Hiperplano soporte impropio
Figura 1.5:
En el siguiente teorema se establece que un conjunto convexo en cada punto frontera
tiene un hiperplano soporte.
Teorema 1.10. Sea S ⊂ Rn convexo y no-vacío y sea x ∈ ∂S, entonces existe un
hiperplano soporte de S en x.Es decir existe p ∈ Rn tal que pt(x − x) ≤ 0 ∀x ∈ S
(clausura de S).
Prueba.ver(Bazaraa).
La minimización de una función convexa sobre alguna de las variables preserva la
convexidad del problema.
Definición 1.11. (Epígrafo de una función convexa)
Sea S ⊂ Rn no-vacío y sea f : S → R. El epígrafo de f denotado por epi(f) es un
subconjunto de Rn+1 definido como
epi(f) = {(x, y) : x ∈ S, y ∈ Rn y ≥ f(x)}
Definición 1.12. (Hipógrafo de una función convexa)
Sea S ⊂ Rn no-vacío y sea f : S → R. El Hipógrafo denotado por hyp(f) es un subcon-
junto de Rn+1 tal que
hyp(f) = {(x, y), x ∈ S, y ∈ Rn; y ≤ f(x)}.
8 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
hyp ( f )hyp ( f )
hyp ( f )
epi ( f )epi ( f )
epi ( f )f
f
f
Figura 1.6:
Geométricamente
Teorema 1.13. Sea S ⊂ Rn no-vacío y convexo y sea f : S → R.Entonces f es convexa
si y sólo si epi(f) es un conjunto convexo.
Prueba.
⇒] Supongamos que f es convexa, demostraremos que epi(f) es un conjunto convexo.
Sea (x1, y1), (x2, y2) ∈ epi(f), es decir x1, x2 ∈ S tal que y1 ≥ f(x1) y tal que y2 ≥ f(x2).
Sea λ ∈ (0, 1), entonces λy1 + (1− λ)y2 ≥ λf(x1) + (1− λ)f(x2) ≥ f(λx1 + (1− λ)x2)
pues f es convexa. Además λx1+(1−λ)x2 ∈ S, [λx1+(1−λ)x2, λy1+(1−λ)y2] ∈ epi(f)
y por lo tanto epi(f) es convexo.
⇐] Supongamos que epi(f) es convexa, y sean x1, x2 ∈ S entonces [x1, f(x1)] y [x2, f(x2)] ∈
epi(f) es convexo se tiene [λx1+(1−λ)x2, λf(x1)+(1−λ)f(x2)] ∈ epi(f), para λ ∈ (0, 1)
es decir λf(x1) + (1− λ)f(x2) ≥ f(λx1 + (1− λ)x2) para λ ∈< 0, 1 > por lo tanto f
es convexa. �
1.1.2. Conjuntos Poliédricos - Puntos Extremos
Los conjuntos poliédricos representan un caso especial de conjuntos convexos.
Definición 1.14. S ⊂ Rn se llama conjunto poliédrico si es la intersección de un numero
finito de semi espacios cerrados. Es decir
S = {x : ptix ≤ αi , i = 1, 2 . . .m}
9 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
donde pi ∈ Rn, αi es un escalar para i = 1 . . .m.
Observación.
Un conjunto poliédrico es un conjunto convexo.
Como una función puede ser representada por dos inecuaciones, un conjunto polié-
drico puede ser representado por un numero finito de inecuaciones y/o ecuaciones.
Ejemplos.
S = {x ∈ R2 : −x1 + x2 ≤ 2 , x2 ≤ 4 , x1 ≥ 0 , x2 ≥ 0} es un conjunto poliédrico.
x
x
2
4 )(
2)( 0
2
S
1
Figura 1.7:
Definición 1.15. Sea S ⊂ Rn un conjunto convexo no- vacío. Un punto x ∈ S se llama
"punto extremo"de S si x = λx1 + (1 − λ)x2 con x1, x2 ∈ S y λ ∈< 0, 1 > implica que
x = x1 = x2.
Ejemplos.
1. S = {(x1, x2) : x21 + x2
2 ≤ 1} sus puntos extremos es el conjunto
E = {(x1, x2) : x21 + x2
2 = 1}
2. S = {(x1, x2) ∈ R2 : x21+x2
2 ≤ 2 ; −x21+2x2
2 ≤ 1 , x1, x2 ≥ 0} sus puntos extremos
son:
E = {(0, 0), (0, 1)(23, 43), (2, 0)}
10 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
E
Figura 1.8:
(
(
(
(
)
)
)
)
0
,
,
,
,
1
2
2
4 33 //
00
0
Figura 1.9:
3. S = gen{(0, 0), (1, 1), (1, 3), (−2, 4), (0, 2)}, sus puntos extremos son:
E = {(0, 0), (1, 1), (1, 3), (−2, 4)}
(
(
(
)
)
)
(
(
)
)
− 2 4
0
00
3
1
1
1
,
,
,
2
Figura 1.10:
Observación.
Cualquier punto del poliedro S puede representarse como una combinación convexa
de sus puntos extremos.
En conjuntos convexos no acotados no es posible la representación de cada punto
del conjunto como combinación convexa de sus puntos extremos, por ejemplo
11 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
S = {(x1, x2) : x2 ≥ |x1|} es convexo y cerrado pero no es acotado, tiene un solo
punto extremo, el origen y obviamente S no es la combinación convexa de sus
puntos extremos. Esto hace necesario el concepto de dirección extrema.
Definición 1.16. Sea S conjunto convexo cerrado, no vacío en Rn, un vector no nulo
d en Rn se llama una dirección de S si para cada x ∈ S , x+ λd ∈ S , ∀λ ≥ 0. d1 y d2
son direcciones distintas de S si d1 = αd2 para α > 0.
Una dirección d de S se llama "dirección de extremo"si no puede ser escrita como
combinación lineal positiva de dos direcciones distintas, es decir:
Si d = λ1d1 + λ2d2 , λ1, λ2 > 0 entonces d1 = αd2 para algún α > 0.
Ejemplo.
S = {(x1, x2) : x2 ≥ |x1|} Las direcciones de S son los vectores no nulos que forman un
S
d d2 1
Figura 1.11:
ángulo menor o igual a 45◦ con el vector (0, 1). Por ejemplo d1 = (1, 1) y d2 = (−1, 1)
son dos direcciones extremas de S, cualquier otra dirección de S puede ser representada
como combinación lineal positiva de d1 y d2.
Teorema de Representación.
Sea S = {x ∈ Rn : Ax = b , x ≥ 0} un conjunto poliedrico no-vacio en Rn, donde Am×n
es una matriz de rango m. Sean x1, x2, . . . , xk los puntos extremos de S y d1, d2, . . . , dl
las direcciones extremas de S, entonces x ∈ S si y sólo si
x =k∑
j=1
λjxj +l∑
j=1
µjdj
12 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.1. CONJUNTOS Y FUNCIONES CONVEXAS
k∑j=1
λj = 1
λj ≥ 0 ; j = 1, 2, . . . , k
µj ≥ 0 ; j = 1, 2, . . . , l
Este teorema permite representar a cada punto de un poliedro como la combinación
lineal no negativa de sus direcciones extremas mas una combinación convexa de sus
puntos extremos. Si el poliedro es acotado no tiene direcciones extremas, por lo tanto
cada punto del poliedro se representara como la combinación convexa de sus puntos
extremos.
1.1.3. Funciones Convexas.
Definición 1.17. Sea f : S → R, S ⊆ Rn no-vacío y convexo. La función f se dice que
es convexa sobre S si
f(λx1 + (1− λ)x2) ≤ λf(x1) + (1− λ)f(x2) ∀x1, x2 ∈ S y λ ∈< 0, 1 >
f se llama ”estrictamente convexa” en S si
(λx1 + (1− λ)x2) < λf(x1) + (1− λ)f(x2) ∀x1, x2 ∈ S y λ ∈< 0, 1 >
f se llama cóncava (estrictamente cóncava) sobre S si −f es convexa(estrictamente
convexa) sobre S.
Ejemplos.
f : R2 → R : f(x1, x2) = 2x21+x2
2−2x1x2, es una función convexa pues, sea x = (x1, x1),
y = (y1, y2) entonces:
λx+ (1− λ)y = λ(x1, x2) + (1− λ(y1, y2))
= (λx1, λx2) + ((1− λ)y1, (1− λ)y2)
= (λx1 + (1− λ)y1, λx2 + (1− λ)y2)
13 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA
luego
f(λx+ (1− λ)y) = f(λx1 + (1− λ)y1, λx2 + (1− λ)y2)
= 2f(λx1 + (1− λ)y1)2 + (λx2 + (1− λ)y2)
2−
2(λx1 + (1− λ)y1)(λx2 + (1− λ)y2)
1.2. Generalización de una Función Convexa
Existen varios tipos de funciones similares a las funciones convexas de las cuales se
usan solamente algunas de sus propiedades. En esta sección presentamos algunas de
estos tipos de funciones.
1.2.1. Función Cuasi-Convexa
Definición 1.18. Sea f : S ⊂ Rn → R, S conjunto convexo no-vacío de Rn, f es una
función cuasi-convexa, si para cada x1 , x2 ∈ S se cumple que
f [λx1 + (1− λ)x2] ≤ max{f(x1), f(x2))}.
f se dice que es cuasi-convexa si −f es cuasi-cóncava.
Observación.
De la definición de la función cuasi-convexa, toda función convexa es también cuasi-
convexa.
El siguiente teorema caracteriza una función cuasi-convexa por la convexidad de sus
curvas de nivel.
Teorema 1.19. Sea f : S → R, S un conjunto convexo no vacío de Rn, f es una función
cuasi-convexa si y sólo si
Sα = {x ∈ S : f(x) ≤ α}
es convexo ∀α ∈ R
14 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA
Prueba.
⇒] f es cuasi-convexa y sean x1, x2 ∈ Sα. Luego x1, x2 ∈ S y max{f(x1), f(x2)} ≤ α y
sea x = λx1+(1−λ)x2. Por la convexidad de S, x ∈ S. Además por la cuasi-convexidad
de f , f(x) ≤ max{f(x1), f(x2)} ≤ α por lo tanto x ∈ Sα y además Sα es convexo.
⇐] Supongamos que Sα es convexa para cada α ∈ R. Sean x1, x2 ∈ S. Además , sea
λ ∈ (0, 1) y x = λx1 + (1 − λ)x2 luego para x1, x2 ∈ Sα para α = max{f(x1), f(x2)}.
Como Sα es convexo x ∈ Sα. Además
f(x) = f(λx1 + (1− λ)x2) ≤ α = max{f(x1), f(x2)}
por lo tanto f es cuasi-convexa. �
Observación.
◦ Sα definida como en el teorema se llama “ Conjunto nivel inferior” de f .
◦ El “conjunto nivel superior” de f es {x ∈ S : f(x) ≥ α} el cual es convexo ∀ α ∈ R
si y sólo si f es cuasi-convexa.
◦ La superficie de nivel: {x ∈ S : f(x) ≥ α} caracteriza a una función f cuasi-
monótona si y solo si este conjunto es convexo ∀ α ∈ Rn.
El siguiente teorema, nos permite analizar el máximo de una función cuasi-convexa
sobre un conjunto poliédrico compacto.
Teorema 1.20. Sea S un conjunto poliédrico y compacto en Rn, sea f : S → R cuasi-
convexa y continua sobre S. si se considera el problema de max f(x) tal que x ∈ S,
entonces existe una solución óptima x para el problema, donde x es un punto extremo
de S.
Prueba.
Sea f continua sobre S y, por lo tanto tiene máximo x′, pues S es un conjunto acotado.
Si hay un punto extremo xe tal que f(xe) = f(x′) entonces se cumple el teorema.
En otro caso, sean x1 . . . xk puntos extremos de S y considerando que f(x′) > f(xj);
15 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA
j = 1, 2 . . . k y como el punto x′ puede representarse en términos de los puntos extremos
xj, j = 1, 2 . . . k
x′ =k∑
j=1
λjxj
k∑j=1
λj = 1
λj > 0; j = 1, 2 . . . k
Como f(x′) > f(xj) para cada j = 1 . . .m; entonces
f(x′) > max1≤j≤k
f(xj) = α (1.1)
Luego sea Sα = {x : f(x) ≤ α}. xj ∈ xα para j = 1 . . . n y como f es cuasi-convexa,
Sα es convexa. Por lo tanto x′ =k∑
j=1
λjxj ∈ Sα. Esto significa que f(x′) ≤ α lo que
contradice (1.1). Por lo tanto f(x′) = f(xj) para algún xj punto extremo.
1.2.2. Funciones Cuasi-Convexas Diferenciables
El siguiente teorema proporciona una caracterización necesaria y suficiente de una
función cuasi-convexa diferenciable.
Teorema 1.21. Sea S ⊂ Rn un conjunto abierto convexo y no-vacío y sea f : S → R
una función diferenciable sobre S, entonces f es cuasi-convexa si y solo si una de las
siguientes afirmaciones se cumple:
1. Si x1, x2 ∈ S y f(x1) ≤ f(x2) entonces ∇f(x2)T (x1 − x2) ≤ 0.
2. Si x1, x2 ∈ S y ∇f(x2)T (x1 − x2) > 0, entonces f(x1) > f(x2).
Prueba.
Las afirmaciones (1) y (2) son equivalentes, se probará la afirmación (1).
⇒] Sea f cuasi-convexa y x1, x2 ∈ S tal que
f(x1) ≤ f(x2).
Como f es diferenciable en x2 y para λ ∈ (0, 1)
f(λx1 + (1− λ)x2)− f(x2) = λ∇f(x2)T (x1 − x2) + λ∥x1 − x2∥α(x2 : λ(x1 − x2))
16 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA
donde α(x2;λ(x1 − x2)) → 0 cuando λ → 0. Por la cuasi-convexidad de f , se tiene
f(λx1 + (1− λ)x2) ≤ f(x2) y por lo tanto la ecuación anterior implica que
λ∇f(x2)T (x1 − x2) + λ∥x1 − x2∥α(x2 : λ(x1 − x2)) ≤ 0
dividiendo entre λ
∇f(x2)T (x1 − x2) + ∥x1 − x2∥α(x2 : λ(x1 − x2)) ≤ 0
Si λ → 0 se tiene
∇f(x2)T (x1 − x2) ≤ 0
⇐] Suponga que x1, x2 ∈ S y que f(x1) ≤ f(x2), se necesita demostrar que dado (1),
se tiene f(λx1+(1−λ)x2) ≤ f(x2) , ∀λ ∈ (0, 1) esto se hará mostrando que el conjunto
L = {x : x = λx1 + (1− λ)x2, λ ∈ (0, 1), f(x1) > f(x2)}
es vacío. Por contradicción, supongamos que L no es vacío y que x′ ∈ L, por lo tanto
x′ = λx1 + (1− λ)x2 para algún λ ∈ (0, 1) y f(x′) > f(x2), como f es diferenciable f es
continua y existe un δ ∈ (0, 1) tal que
f(µx′ + (1− µ)x2) > f(x2) ∀µ ∈ [δ, 1] (1.2)
y f(x′) > f [δx′ + (1− δ)x2], luego de esta desigualdad y del teorema del valor medio
se tiene:
0 < f(x′)− f [δx′ + (1− δ)x2] = (1− δ)∇f(x)T (x′ − x2) (1.3)
donde x = µx′ + (1− µ)x2 para µ ∈ (δ, 1). De 1.2 se tiene
f(x) > f(x2)
dividiendo (1.3) entre 1− δ > 0 se tiene
∇f(x)T (x′ − x2) > 0
y a su vez implica que:
∇f(x)T (x1 − x2) > 0 (1.4)
17 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA
pero por otro lado, f(x) > f(x2) ≥ f(x1) y x es una combinación convexa de x1 y x2,
es decir
x = λx1 + (1− λ)x2 , λ ∈ (0, 1)
por hipótesis del teorema se tiene ∇f(x)T (x1 − x) ≤ 0 y tenemos que
∇f(x)T (x1 − λx1 − (1− λ)x2) ≤ 0
⇒ ∇f(x)T ((1− λ)x1 − (1− λ)x2) ≤ 0
⇒ (1− λ)∇f(x)T (x1 − x2) ≤ 0
que dividiendo entre 1− λ se tiene
∇f(x)T (x1 − x2) ≤ 0 (1.5)
lo que contradice (1.4). Por lo tanto, L es un conjunto vacío.
Ejemplo.
Para ilustrar el teorema:
Sea f : R2 → R : f(x, y) = x3 + y3. y
Sea x =
(2
−2
)y y =
(1
0
)Luego f(x) = 0 y f(y) = 1,luego f(x) < f(y). Por otro lado:
∇f(x, y) = 3x2 + 3y2
luego
∇f(y)(x− y) = (3, 0).(1,−2) = 3,
por la parte necesaria del teorema f no es cuasi-convexa.
Con este ejemplo también se muestra que la suma de dos funciones cuasi-convexas no
necesariamente es cuasi-convexa.
18 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA
1.2.3. Funciones Estrictamente Cuasi - Convexas
Estas funciones son importantes en la programación no-lineal, aseguran que el mínimo
local sobre un conjunto convexo son mínimo y máximo global respectivamente.
Definición 1.22. Sea f : S ⊂ Rn → R, donde S es un conjunto no-vacío convexo en Rn,
f se dice que es estrictamente cuasi convexa, si para cada x1, x2 ∈ S con f(x1) = f(x2),
se tiene
f(λx1 + (1− λ)x2) < max{f(x1), f(x2)} , λ ∈ (0, 1).
f se llama estrictamente cuasi cóncava si −f es estrictamente cuasi convexa.
ESTRICTAMENTE CUASI CONVEXASESTRICTA
CUASI−CÓNCAVANI UNO NI OTRO
Figura 1.12:
Observación.
Toda función convexa es estrictamente cuasi convexa.
Teorema 1.23. Sea f : Rn → R estrictamente cuasi-convexa. Sea el problema de
mın f(x) donde S conjunto convexo no-vacío en Rn. Sujeto a x ∈ S.
Si x es una solución optimal. Entonces x es también un óptimo global.
Prueba.
Por contradicción, suponga que f(x) < f(x) por la convexidad de S, λx+(1−λ)x ∈ S,
λ ∈ (0, 1). Como x es un mínimo local, entonces f(x) ≤ f(λx+ (1− λ)x) , ∀λ ∈ (0, δ)
para algun δ ∈ (0, 1). Como f es estrictamente cuasi-convexa y f(x) < f(x) luego
f(x) ≤ f(λx + (1 − λ)x) < f(x) , λ ∈ (0, 1) ⇒⇐ esto contradice la hipótesis de
optimalidad local de x por lo tanto x es una solución optima global.
19 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.3. CONVERGENCIA DE FUNCIONES CONVEXAS
Observación.
Toda función estrictamente cuasi convexa no es una función cuasi convexa, por ejemplo
f(x) =
1, si x = 0
0, si x = 0
f es estrictamente cuasi convexa pero no es cuasi-convexa pues para x1 = 1 y x2 = −1
f(x1) = f(x2) = 0 pero f(12x1 +
12x2) = f(0) = 1 > f(x2).
Lema 1.24. Sea S un conjunto convexo no-vacío en Rn y sea f : S → R estrictamente
cuasi-convexa y semi continua inferior, entonces f es cuasi-convexa.
Definición 1.25. Sea S un conjunto convexo no-vacio en Rn y sea f : S → R se dice
que es suedo-convexa si ∀x, y ∈ S : ∇f(x)(y − x) ≥ se tiene f(y) ≥ f(x).
1.3. Convergencia de Funciones Convexas
En esta sección presentamos algunas generalizaciones sobre la convergencia de las
soluciones de problemas de aproximación, especialmente en problemas de optimización,
en particular cuando se busca las soluciones numéricas de problemas de dimension in-
finita.
Se presenta las características sobresalientes de la teoría de la convergencia de funciones
convexas. Los resultados se muestran para funciones convexas sobre Rn.
Sean f , fv , v ∈ N funciones convexas cerradas con dominio en Rn y rango en Rn∪+∞,
el domino efectivo de una función convexa f denotado por D(f) es:
D(f) = {x ∈ Rn ; f(x) < +∞}
el epígrafo de f es:
E(f) = {(x, α) ∈ Rn × R ; f(x) < α}
20 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.3. CONVERGENCIA DE FUNCIONES CONVEXAS
Definición 1.26. Una función convexa f se dice que es cerrada si es semicontinua
inferior (l.s.c) y D(f) = ϕ.
En particular, esto implica que el epígrafo, E(f) de f es un sub conjunto cerrado
propio de Rn × R que no contiene ninguna recta paralela a la recta x = 0.
Las sucesiones de funciones convexas cerradas presentan dos tipos de convergencia
que son muy importantes en la convergencia de las soluciones para problemas de opti-
mización: convergencia puntual llamado ρ-convergencia Y la convergencia en términos
de los epígrafo llamada e-convergencia.
Definición 1.27. La sucesión {fv(x)}v∈N se dice que converge según la convergencia
ρ-convergencia, denotado por
fv−→ρ f
si ∀x ∈ Rn
lımv
fv(x) = f(x)
donde se permite como valor de limite a +∞ y también como elemento de la sucesión.
Este tipo de convergencia se presenta en la mayoría de los esquemas que involucran
aproximaciones directas de la función f .
Una sucesión de subconjuntos cerrados {Cv}, v ∈ N de Rn se dice que converge al
conjunto cerrado C si
lım supv
Cv = C = lım infv
Cv
y se escribe
Cv = C
donde
lım supv
Cv = {x = lımxµ : xµ ∈ Cµ , µ ∈ M ⊂ N}
lım infv
Cv = {x = lımxv : xv ∈ Cv , v ∈ N ⊂ N}
21 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
Definición 1.28. Una sucesión de funciones convexas se dice que es ϵ-convergente y se
escribe como
fv−→ϵ f
Si el epígrafo de fv converge al epígrafo de f , esto significa :
lım supE(fv) = E(f) = lım inf E(fv)
Este tipo de convergencia se necesita para tener la convergencia de la solución de prob-
lemas de optimización.
Observación.
La convergencia de una sucesión de conjuntos convexos y cerrados en Rn se obtiene
considerando la distancia de un punto x aun conjunto D tal que d(x, y) es una métrica
definida en Rn(métrica euclidiana).
1.4. Dualidad
En esta sección se verá una formulación que permite resolver problemas convexos.
Se verá la forma de conseguir problemas de optimización convexa a partir de cualquier
problema de optimización. Para esto es necesario definir la función lagrangiana y los
multiplicadores de Lagrange, que permiten reincorporar las restricciones a las función
objetivo para luego generar un nuevo problema de optimización conocido como el prob-
lema dual lagrangiano. Si el problema inicial también llamado problema primal, es no-
convexo el problema dual Lagrangiano asociado, si es convexo y por lo tanto es posible
resolverlo generando un límite (o cota) inferior para el valor óptimo del problema primal
de la forma (2.1).
Si el problema inicial es convexo y bajo algunas condiciones, entonces el límite se
ajusta al valor óptimo del problema original y para que esto ocurra se estudian las
condiciones de Karush-Khun-Tucker (KKT) que sirven de base a los algoritmos de res-
olución.
En algunos casos hay aplicaciones en que la solución es más eficiente resolviendo el
problema dual lagrangiano.
22 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
1.4.1. Función Dual de Lagrange
Sea el problema de optimización en forma estándar
mın f(x)
s.a : gi(x) ≤ 0, i = 1, 2 . . . ,m (1.6)
hj(x) = 0, j = 1, 2 . . . , p
x ∈ D ⊆ Rn
donde D = dom f∩ m∩
i=1
dom gi∩ p∩
j=1
dom hj.
Se define la función lagrangiana.
L : Rn × Rm × Rp → R (1.7)
asociada como
L(x, λ, µ) = f(x) +m∑i=1
λigi(x) +
p∑j=1
µjhj(x)
λi es el i-ésimo multiplicador de Lagrange asociado a la desigualdad gi(x) ≤ 0. µj es el
j-ésimo multiplicador de Lagrange asociado a la ecuación hj(x) = 0 de forma vectorial se
considera a λ y µ las variables duales o vectores multiplicadores de Lagrange, la función
dual de Lagrange es:
θ(λ, µ) = ınfx∈D
L(x, λ, µ)
La función θ puede tomar o asumir −∞ para algún vector (λ, µ). La función L es afín
respecto a λ y µ y por tanto la función dual será el ínfimo puntual de una familia de
funciones afines de (λ, µ) es decir θ es una función cóncava independientemente de si el
problema primal (2.5) es o no convexo.
Teorema 1.29. Dualidad Débil. Sea x un punto factible de (2.5), es decir g(x) ≤ 0
y h(x) = 0 , x ∈ D y sea (λ, µ) tal que λ ≥ 0, entonces
θ(λ, µ) ≤ L(x, λ, µ) ≤ f(x)
Prueba.
Como gi ≤ 0, λi ≥ 0, i = 1 . . .m entonces λi.gi(x) ≤ 0, ∀i = 1 . . .m, es decirm∑i=1
λigi(x) ≤ 0
23 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
análogamente hj(x) = 0 y µj es libre de signo, luego
µjhj(x) = 0 ∀i = 1 . . . p
es decirm∑j=1
µjhj(x) = 0
luego se cumple que
m∑λigi(x) +
m∑µjhj(x) ≤ 0 siλ ≥ 0
sumando f(x):
f(x) +m∑
λigi(x) +m∑
µjhj(x)︸ ︷︷ ︸ ≤ f(x)
L(x, λ, µ) ≤ f(x) (1.8)
como
θ(λ, µ) = ınfx∈D
L(x, λ, µ) ≤ L(x, λ, µ) (1.9)
de (1.8) y (1.9) se tiene
θ(λ, µ) ≤ L(x, λ, µ) ≤ f(x) �
Observación.
Del teorema anterior, como θ(λ, µ) ≤ f(x) para cualquier x factible, también se cumplirá
en el punto óptimo x∗ es decir
θ(λ, µ) ≤ f(x∗) = z∗
lo que significa que la función dual genera una cota inferior para el valor óptimo z∗.
Este límite no será útil si θ(λ, µ) = −∞, por lo que se dirá de (λ, µ) el par dual factible
cuando λ ≥ 0 y (λ, µ) ∈ dom(θ).
24 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
1.4.2. Problema Dual Lagrangiano
Como se ha visto que si λ ≥ 0, el par (λ, µ) genera una cota inferior para el valor
óptimo z∗ del problema primal. El problema dual Lagrangiano consiste en buscar la
mejor de estas cotas, es decir:
(DP ) max θ(λ, µ) (1.10)
λ ≥ 0
1.4.3. Interpretación Geométrica del Problema Dual Lagrangiano
Por efectos de simplicidad consideraremos el problema de optimización con solo una
restricción de desigualdad y sin restricciones de igualdad, es decir el problema primal es:
mın f(x)
g(x) ≤ 0 (1.11)
x ∈ D ⊂ Rn
En el plano (y, z) sea el conjunto G = {(y, z) : y = g(x), z = f(x), x ∈ D}, entonces G
es la imagen de D bajo la aplicación (g, f). El problema primal consiste en encontrar un
punto en G tal que y ≤ 0 con valor mínimo en la ordenada. Este punto obviamente es
(y, z) en la figura.
.
Z
B
Y
D
x
G
(g(x),f(x)).
(y,z)− −
ϕ ( λλ λ) αz+ =m=− λ
−
(g, γ )
y
Figura 1.13:
25 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
El problema dual Lagrangiano es:
max φ(λ)
λ ≥ 0
Supongamos que λ ≥ 0 es dado. Para determinar φ(λ) es necesario minimizar f(x) +
λg(x), para x ∈ D. Considerando y = g(x) y z = f(x) para x ∈ D, es necesario
minimizar z + λy sobre los puntos de G. Se observa que z + λy = α es la ecuación de
una recta con pendiente −λ y con intersección en α en el eje z. Para minimizar z + λy
sobre G es necesario reemplazar la recta z+λy = α en movimientos paralelos así mismo
tanto como sea posible manteniéndola en contacto con G y en dirección de su gradiente
negativo. Es decir la recta z + λy = α se desplaza hasta que sea soporte inferior de G,
entonces el intercepto de dicha recta soporte con el eje Z genera a φ(λ) como se observa
en la figura (1.13).
Por lo tanto el problema dual Lagrangiano equivale ha hallar la pendiente del hiperplano
soporte tal que su intercepto con el eje Z sea maximal.
En la gráfica se observa que la solución del problema dual se obtiene en el hiperplano
soporte de pendiente m = −λ (cualquier otro hiperplano soporte de pendiente negativa
genera cotas inferiores para el valor óptimo del problema primal), la solución del proble-
ma dual es λ y el valor objetivo óptimo del problema dual es z. Pero como z = f(x) en
este caso se tiene que z también es el valor óptimo de la función objetivo del problema
primal.
Ejemplo.
Sea el problema primal:
mın x21 + x2
2
s.a −x1 − x2 + 4 ≤ 0
x1, x2 ≥ 0
Se observa que el óptimo se encuentra en (2, 2) y f ∗(2, 2) = 8.
Considerando g(x) = −x1 − x2 + 4 y D = {(x1, x2) : x1, x2 ≥ 0} la función dual de
26 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
lagrange es
φ(λ) = ınf{x21 + x2
2 + λ(−x1 − x2 + 4);x1, x2 ≥ 0}
= ınf{x21 − λx1 : x1 ≥ 0}+ ınf{x2
2 − λx2 : x2 ≥ 0 + 4λ}
luego el ínfimo de φ(λ) cuando λ ≥ 0 es alcanzado en x1 = x2 = λ/2 y cuando λ < 0 el
ínfimo es alcanzado en x1 = x2 = 0 por lo tanto:
φ(λ) =
−1
2λ2 + 4λ ; λ ≥ 0
4λ ; λ < 0
x2
x1
(4,0)
1 2( x , x ) = ( 2,2 )
(4 , 0)
Figura 1.14:
es la función dual lagrangiana. φ es una función cóncava y el problema dual la-
grangiano es (D)
max φ(λ)
s.a λ ≥ 0
La solución del problema dual lagrangiano es en λ = 4 con φ(4) = 8. Observe que
d∗ = φ(λ) = 8 = f((2, 2)) = 8 es decir los valores óptimos de las funciones objetivos
primal y dual son iguales.
27 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
ϕ λλ
λ
( )
4 , 8( )
4321
Figura 1.15:
Observación.
La diferencia z∗ − d∗ es la distancia óptima de dualidades o “hueco de dualidad”. En
algunos casos se utiliza este valor como cota inferior para el valor óptimo del problema
primal cuando este es difícil de resolver, ya que el problema dual siempre es convexo.
1.4.4. Condición de Slater
Cuando la distancia óptima de dualidad es cero se dice que hay “dualidad fuerte” y
significa que
d∗ = z∗,
para esto se cumpla se debe tener ciertas condiciones conocidas como condiciones de
cualificación. Unas de estas condiciones es la condición de Slater:
∃ x ∈ int(D) : gi(x) < 0; i = 1 . . .m
Ax = b
es decir que tiene que existir un punto x estrictamente factible, es decir que las restric-
ciones de desigualdades se cumplen de forma estricta. Sin embargo si algunas de las
restricciones de desigualdad son afines no es necesario que la desigualdad sea estricta
puede ser (≤).
Además, la condición de Slater también garantiza que si se cumple se puede encontrar
una solución para el problema dual.
28 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
1.4.5. Condiciones de Optimalidad
Si es posible hallar un punto dual factible (λ, µ), servirá como prueba para garantizar
que z∗ ≥ φ(λ, µ).
Estos puntos permiten conocer en que medida es sub óptimo un punto x que sea factible,
sin necesidad de conocer el valor exacto de z∗
f(x)− z∗ ≤ f(x)− φ(λ, µ)
1.4.5.1. Holgura Complementaria
Supongamos que el problema primal y dual presentan dualidad fuerte es decir que
los valores objetivos de ambos problemas son iguales. Si x∗ es el óptimo del problema
primal y (λ∗, µ∗) del problema dual,
f(x∗) = φ(λ∗, µ∗)
= ınfx(f(x) +
m∑i
λ∗i gi(x) +
m∑i
µ∗ihi(x))
≤ f(x∗) +m∑i=1
λ∗i gi(x
∗)︸ ︷︷ ︸+m∑i
µ∗i hi(x
∗)︸ ︷︷ ︸≤ 0 = 0
≤ f(x∗)
esto indica que las desigualdades se tienen que cumplir como igualdades. Es decirm∑i=1
λ∗i gi(x) = 0
como los términos de esta sumatoria son negativos o cero, se llega a la condición de
holgura complementaria
λ∗i gi(x
∗) = 0 i = 1 . . .m
que se cumple siempre que hay dualidad fuerte.
Equivalentemente
λ∗i > 0 ⇒ gi(x
∗) = 0 i = 1 . . .m
gi(x∗) < 0 ⇒ λ∗
i = 0
cuando una restricción de desigualdad i, se cumple como igualdad se dice que es “activa”
y esto ocurre cuando λi > 0. En otro caso no está activa y el multiplicador es cero.
29 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
1.4.5.2. Condiciones de Karush-Khun-Tucker (KKT)
Supongamos que las funciones f , gi, hi son diferenciables y no requerimos ninguna
condición en cuanto a convexidad. Supongamos también que en los puntos x∗ y (λ∗, µ∗) la
distancia de dualidad es cero. Como x∗ minimiza la función dual lagrangiana L(x, λ∗, µ∗)
su gradiente en x∗ tiene que hacerse cero, es decir:
∇f(x∗) +m∑i=1
λ∗∇gi(x) +
p∑i=1
µ∗∇hi(x) = 0
Por lo tanto para que un problema con funciones objetivo y restricciones diferenciables
tenga dualidad fuerte x∗ y (λ∗, µ∗) tienen que cumplir las siguientes condiciones llamadas
de Karush-Kuhun-Tucker (KKT)
gi(x∗) ≤ 0 , i = 1 . . .m
hi(x∗) = 0 , i = 1 . . . p
λi ≥ 0 , i = 1 . . .m
λ∗i gi(x
∗) ≤ 0 , i = 1 . . .m
∇f(x∗) +m∑i=1
λ∗∇gi(x) +
p∑i=1
µ∗∇hi(x) = 0
En el siguiente teorema se da las condiciones suficientes para optimalidad según Karush-
Kuhun-Tucker.
Teorema 1.30. Sea D ⊂ Rn abierto y no-vacío y sea f : Rn → R, gi : Rn → R para
i = 1 . . .m y hi : Rn → R para i = 1 . . . p sea el problema
(P ) mın f(x)
s.a gi(x) ≤ 0 i = 1 . . .m
hi(x) = 0 i = 1 . . . p
x ∈ D
Sea x una solución factible y sea I = {i : gi(x) = 0} suponga x es un punto KKT, es
decir que ∃λi ≥ 0 para i ∈ I y µi para i = 1 . . . p tal que
30 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
∇f(x) +∑i∈I
λi∇gi(x) +
p∑i=1
µi∇hi(x) = 0 (1.12)
Sea J = {i : µi > 0} y K = {i : µi < 0}, además suponga que f es seudo convexa en
x, gi es cuasi convexa en i ∈ I, hi es cuasi convexa en x para i ∈ J , y hi cuasi cóncava
en x para i ∈ K. Entonces x es una solución óptima global para el problema (P).
En particular si las suposiciones de convexidad generalizada sobre la función objetivo
y las restricciones se restringen al dominio Nϵ(x) para algún ϵ > 0, entonces x es un
mínimo local para el problema (P).
Prueba.
Sea x una solución factible para (P), entonces para i ∈ I, gi(x) ≤ gi(x) pues gi(x) ≤ 0
y gi(x) = 0.
Por la cuasi convexidad de gi en x se tiene que
gi(x+ α(x− x)) = gi(αx+ (1− α)x) ≤ max{gi(x), gi(x)} ≤ gi(x)
para α ∈ (0, 1). Esto implica que gi no crece cuando x se mueve a lo largo de la dirección
x− x.
Además se tiene
∇gi(x)T (x− x) ≤ 0 i ∈ I (1.13)
Similarmente, como hi es cuasi convexa en x para i ∈ J y hi es cuasi cóncava en x para
i ∈ K, se tiene
∇hi(x)T (x− x) ≤ 0 i ∈ J (1.14)
∇hi(x)(x− x) ≥ 0 i ∈ K (1.15)
multiplicando (1.13), (1.14) y (1.15) por λi ≥ 0 , µi > 0 y µi < 0 respectivamente y
sumando las expresiones se tiene
31 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
1.4. DUALIDAD
[∑i∈I
λi∇gi(x) +∑
i∈J∪K
µi∇hi(x) = 0
]T(x− x) ≤ 0 (1.16)
multiplicando (1.12) por (x− x) y considerando que µi = 0 para i ∈ J ∪K entonces
(1.16) implica que
∇f(x)T (x− x) ≥ 0
como f es seudo convexa en x, se tiene que
f(x) ≥ f(x) , x ∈ D
con lo que queda demostrado que x es un óptimo global para (P). �
Observaciones.
Cuando se produce dualidad fuerte, las variables duales óptimas proporcionan informa-
ción útil sobre la sensibilidad que tiene el valor óptimo frente a perturbaciones en las
restricciones, es decir si:
mın f(x)
gi(x) ≤ bi i = 1 . . .m
hi(x) = di i = 1 . . . p
es el problema perturbado. Sea p∗(b, d) el valor óptimo del problema perturbado en
función de (b, d), si p∗(b, d) es diferenciable en b = 0 , d = 0 y hay dualidad fuerte,
entonces las variables duales óptimas λ∗ y µ∗ se relacionan con el gradiente de p∗(b, d)
en b = 0 y d = 0 como
λ∗i =
∂p∗(0, 0)
∂bi, µ∗
i =∂p∗(0, 0)
∂di
es decir los multiplicadores óptimos de Lagrange son exactamente las sensibilidades del
valor óptimo con respecto a las perturbaciones. Estas medidas valen cerca al punto
óptimo y dan una idea cuantitativa de lo activo que es una restricción en el punto
óptimo.
32 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Capítulo 2
Optimización Convexa
En este capítulo presentamos la formulación de un problema de optimización convexa,
sus características, criterios de optimalidad, equivalencia entre problemas convexos, así
como también presentamos algunos problemas de optimización que pueden transformarse
en problemas de optimización convexa y aprovechar así las características de un problema
de optimización convexa para su resolución.
2.1. Formulación Estándar
La formulación estándar de un problema de optimización convexa es de la forma
mın f(x)
s.a : gi(x) ≤ 0, i = 1, 2 . . . ,m (2.1)
hj(x) = 0, j = 1, 2 . . . , p
donde f y g para i = 1 . . .m son funciones convexas definidas de Rn → R y
hj(x) = atjx− bj, j = 1, . . . p, es decir son funciones afines.
Observación.
◦ De la formulación se tiene que el conjunto factible de un problema convexo es un
conjunto convexo.
◦ Si atj = 0 y bj = 0 para algún j, entonces la j-ésima restricción puede eliminarse del
33
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.1. FORMULACIÓN ESTÁNDAR
conjunto de restricciones. Si atj = 0 y bj = 0 la j-ésima restricción es inconsistente
y por tanto este problema es infactible.
◦ Se busca minimizar una función convexa sobre un conjunto convexo.
◦ Como los conjuntos de subniveles de una función convexa son convexos,se tiene
que para un problema de optimización convexa o cuasi-convexa los conjuntos ε-sub
optimales son convexos.
Ejemplo 2.1.
mın x21 + x2
2
x1
1 + x22
≤ 0
(x1 + x2)2 = 0
Este problema no es uno de optimización convexa en forma estándar, pues la función de
la restricción de igualdad no es afín y la función de restricción de la desigualdad no es
convexo.
Ejemplo 2.2.
mın f(x) = x21 + x2
2
x1 ≤ 0
x1 + x2 = 0
Este problema si es un problema de optimización convexa en forma estándar.
Observar que en los ejemplos (2.1) y (2.2) la región factible es
{x ∈ R2 : x1 ≤ 0; x1+x2 = 0} que es un conjunto convexo, es decir en ambos problemas
se tiene que minimizar una función convexa f(x1, x2) = x21 + x2
2 sobre un conjunto
factible convexo. En el presente trabajo solo consideraremos problemas de optimización
convexa formulados en forma estándar como el ejemplo (2.2). La minimización de una
función convexa sobre un conjunto convexo, como la del ejemplo (2.1), se conoce como
“problemas de optimización convexa abstractas”.
34 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.2. ÓPTIMO LOCAL Y GLOBAL
2.2. Óptimo Local y Global
Teorema 2.3. En un problema de optimización convexa, cualquier punto óptimo local,
también es óptimo global.
Prueba.
Supongamos que, x es un óptimo local de un problema de optimización convexa (2.1),
es decir x es factible en
f(x) = ınf{f(y) : y factible, ∥y − x∥2 ≤ ϵ} para algún ϵ > 0 (2.2)
Por contradicción, supongamos ahora que x no es óptimo global de 2.1, es decir existe
un z factible tal que f(z) < f(x), evidentemente ∥z − x∥2 > ϵ.
Sea y tal que
y = (1− λ)x+ λz , λ =ϵ
2∥z − x∥2luego
∥y − x∥2 = ∥(1− λ)x+ λz − x∥2
= ∥ − λx+ λz∥2
= |λ|∥z − x∥2
= | ϵ
2∥z − x∥2|∥z − x∥2
=ϵ
2< ϵ
y por la convexidad del conjunto factible y es un punto factible.
Por la convexidad de f se tiene
f(y) ≤ (1− λ)f(x) + λf(z) < (1− λ)f(x) + λf(x) = f(x)
es decir f(y) < f(x), lo que contradice (2.2).
Por lo tanto x es un óptimo global. �
En los problemas de optimización cuasi-convexas el teorema no se cumple.
35 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.2. ÓPTIMO LOCAL Y GLOBAL
En el siguiente teorema se presenta un criterio de optimalidad cuando la función f
de un problema de optimización convexa es diferenciable.
Teorema 2.4. Consideramos que en el problema 2.1 f es diferenciable, entonces x es
optimal si y solo si x ∈ X = {x : gi(x) ≤ 0 i = 1, . . . ,m; hj(0) = 0; j = 1 . . . p} y
∇f(x)t(y − x) ≥ 0 ∀y ∈ X (2.3)
Prueba.
⇐] Supongamos que x ∈ X y satisface (2.3). Luego si y ∈ X es decir es un punto factible
y f diferenciable se tiene:
f(y) ≥ f(x) +∇f(x)T (y − x) ≥ f(x)
pues x satisface (2.3) por lo tanto x es un óptimo de (2.1).
⇒] Supongamos que x es un óptimo de (2.1) pero que (2.3) no se cumple, es decir, para
algun y ∈ X se tiene ∇f(x)T (y − x) < 0.
Sea el punto z(t) = ty + (1 − t)x, t ∈ [0, 1] como z(t) es el segmento que une x e y y
el conjunto factible es convexo, entonces z(t) es factible. Luego para t > 0 pequeño se
tiened
dtf(z(t))|t=0 =
d
dtf(ty + (1− t)x)|t=0
= ∇f(x)T (y − x) < 0
por la diferenciabilidad de f : f(z(t)) ≥ f(x) +∇f(x)T (y − x) por lo tanto para t > 0
pequeño, f(z(t)) < f(x). �
Geométricamente
La condición de optimalidad se puede interpretar como:
36 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.2. ÓPTIMO LOCAL Y GLOBAL
H
X
x
f (x)
Figura 2.1:
X es el conjunto factible, las curvas punteadas son algunas curvas de nivel de la
función f . x es el punto optimal y −∇f(x) define un hiperplano soporte de X en x.
Observación.
1) Para un Problema de Optimización sin Restricciones.
(m = p = 0) la condición (2.3) se reduce a la conocida condición necesaria y
suficiente de optimalidad de una función diferenciable
∇f(x) = 0
para x óptimo.
Ejemplo.
Problema de optimización cuadrática sin restricciones:
mın1
2xtQx+ qtx+ r
donde Qn×m semi-definida positiva.
La condición necesaria y suficiente para que x sea un mínimo de f es
∇f(x) = Qx+ q = 0
De esta ecuación lineal se tiene los siguientes casos:
◦ Si q ∈ ran(Q) entonces la ecuación no tiene solución y f es no acotada
inferiormente.
◦ Si Q no es nula,existe minimizador único x∗ = −Q−1q.
37 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.2. ÓPTIMO LOCAL Y GLOBAL
◦ Si Q es singular pero q ∈ ran(Q) entonces el conjunto de puntos optimales es
el conjunto afín Xopt = −Qt(q) + ker(Q) donde Qt es la seudo-convergencia
de Q.
Ejemplo.
Sea f : Rn → R con f(x) = −m∑i=1
log(bi − aTi x), y Dom(f) = {x : Ax < b} donde
aTi . . . aTm son las filas de A. Se busca:
mınx∈Rn
f(x)
como f es diferenciable, las condiciones necesarias y suficientes para que x sea
óptimo son: Ax < b y ∇f(x) = 0
m∑i=1
1
bi − aia1 = 0 (2.4)
Con la condición Ax < b garantiza a x ∈ dom(f).
Si Ax < b es no-factible, entonces el dom(f) está vacío. Asumiendo Ax < b es
factible, aun así se tiene los siguientes casos:
◦ f es no acotado inferiormente.
◦ No hay soluciones para (2.4) y por tanto no hay puntos óptimos para el
problema.
◦ Existen muchas soluciones de (2.4) ,cuando las soluciones forman un conjunto
afín.
◦ Existe solución única de (2.4),es decir existe un único minimizador de f , esto
es cuando {x ∈ Rn : Ax < b} es no vacío y acotado.
2) Problemas sólo con Restricciones de Igualdad.
Sea
mın f(x)
s.a : Ax = b
38 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.2. ÓPTIMO LOCAL Y GLOBAL
El conjunto factible es un espacio afín y consideramos que es no-vacío,de otra forma
el problema sería no-factible, la condición de optimalidad para un x factible es:
∇f(x)T (y − x) ≥ 0
debe cumplirse ∀ y que satisface la región factible Ax = b. Como x es factible,
cada y factible es de la forma
y = x+ v para algún v ∈ Nucleo (A)
Por lo tanto, la condición de optimalidad puede expresarse como
∇f(x)Tv ≥ 0 ∀v ∈ N(A).
Si una función lineal es no-negativa sobre un subespacio, es porque ∇f(x)T .v = 0
∀v ∈ N(A), es decir
∇f(x)⊥N(A)
Como N(A)⊥ = R(AT ),esta condición de optimalidad puede expresarse como:
∇fT (x) ∈ R(AT )
es decir existe v ∈ Rn tal que
∇f(x0) + ATv = 0
junto con x tal que Ax = b, se tiene las clásicas condiciones de los multiplicadores
de lagrange.
39 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.3. PROBLEMAS CONVEXOS EQUIVALENTES
2.3. Problemas Convexos Equivalentes
En esta sección se muestra cual de las transformaciones descritas en el capítulo 1,
preservan la convexidad.
2.3.1. Eliminando las Restricciones de Igualdad.
En un problema de optimización convexa las restricciones de igualdad son de la forma
Ax = b, estas pueden eliminarse hallando una solución particular x0 de Ax = b y una
matriz F cuyo rango es el del espacio nulo de A, que resulta en el problema de variable
z:
mın f(Fz + x0)
s.a : gi(Fz + x0) ≤ 0 , i = 1, . . .m
con variable z.
Como la composición de una función convexa con una afín es una función convexa, elim-
inando las restricciones de igualdad se preserva la convexidad del problema. Además el
proceso de eliminación de las restricciones de igualdad involucran operaciones elemen-
tales de algebra lineal. Todo esto significa, que debemos de preocuparnos por analizar
problemas de optimización convexa que no tienen restricciones de igualdad. Sin embargo
en muchos casos es mejor mantener estas restricciones pues eliminarlas podría hacer mas
duro su analisis y solución e incluso hasta puede arruinar la eficiencia de algún algoritmo
que resuelva el problema.
2.3.2. Agregando Restricciones de Igualdad.
En un problema de optimización convexa es posible introducir restricciones de igual-
dad y nuevas variables lineales y el problema resultante sigue siendo convexo. Por ejem-
plo si se tiene en la función objetivo o en alguna restricción una función de la forma
fi(Aix + bi) donde Ai ∈ Rki×n, introduciendo una nueva variable yi ∈ Rki y reem-
plazando fi(Aix+ bi) por fi(yi) y agregando en el conjunto de restricciones la restricción
yi = Aix+ bi, se tienen problemas convexos equivalentes.
40 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.3. PROBLEMAS CONVEXOS EQUIVALENTES
2.3.3. Variables de Holgura.
En un problema de optimización convexa con restricciones de desigualdades lineales
de la forma gi(x) ≤ 0 , i = 1 . . .m, es posible introducir variables si ≥ 0 ; i = 1 . . .m tal
que gi(x)+si = 0 y se mantiene la convexidad del problema, además de tener problemas
de optimización equivalentes.
2.3.4. Problema de la Forma Epígrafo.
Este problema es de la forma:
min t
s.a : f(x)− t ≤ 0
gi(x) ≤ 0 i = 1 . . .m (2.5)
aTj x = bj j = 1 . . . p
Como la función objetivo f es convexa la nueva función restricción f(x)− t también
lo es en (x, t) por tanto el problema (2.5) conocido como problema en la forma epígrafo
también es convexo.
Observación.
Este problema equivalente en muchos casos resulta de gran utilidad, por ejemplo en el
caso de P.L los algoritmos de resolución son mas simples.
2.3.5. Minimización Sobre Algunas Variables.
Minimizar una función convexa sobre algunas de sus variables preserva la convexidad.
Por ejemplo si
min fo(x1, x2)
fi(x1) ≤ 0, i = 1 . . .m1
fi(x2) ≤ 0, i = 1 . . .m2
41 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.4. OPTIMIZACIÓN CUASI-CONVEXA.
Es el problema que se obtiene de particionar x = (x1, x2) con x1 ∈ Rn1 , x2 ∈ Rn2
con n1 + n2 = n y donde las restricciones son independientes para x1 y x2 si primero se
minimiza sobre x2. Se define la función fo como:
fo(x1) = ınf{fo(x− 1, z)/fi(z) ≤ 0, i = 1 . . .m2}
luego si fi i = 1 . . .m y fi i = 1 . . .m2 son convexas entonces el problema
min fo(x1)
fi(x1) ≤ 0, i = 1 . . .m
es convexo.
2.4. Optimización Cuasi-Convexa.
En esta sección se mostrará algunas diferencias básicas entre la optimización convexa
y los problemas de optimización cuasi-convexa.Se mostrará también que la solución de
un problema de optimización cuasi-convexa puede reducirse a la solución de una sucesión
de problemas de optimización convexa.
un problema de optimización cuasi-convexo en forma estándar es:
min f(x)
gi(x) ≤ 0 gi = 1 . . .m (2.6)
Ax = b
donde las gi, i = 1 . . .m son funciones convexas y f es cuasi-convexa.
2.4.1. Condiciones de Optimalidad y Solución Óptima Local
La diferencia mas importante entre un problema de optimización cuasi-convexo con
uno convexo es que en el problema de optimización cuasi-convexo se puede tener solu-
ciones óptimas locales que no son óptimos globales.
Este hecho se puede ver en el caso simple de f : R → R (ver figura 2.2) cuasi-convexa
42 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.4. OPTIMIZACIÓN CUASI-CONVEXA.
con un punto óptimo local que no es óptimo global.
(x,f(x))
Figura 2.2:
Sin embargo una variación de la condición de optimalidad para un problema convexo
con f diferenciable en el siguiente sentido:
∇f(x)T (y − x) ≥ 0 ∀y ∈ X (2.7)
considerando X = {x ∈ Rn : gi ≤ 0, i = 1 . . .m,Ax = b} el conjunto factible de (2.6) y
f diferenciable, x es óptimo si x ∈ X y
∇f(x)T (y − x) > 0 ∀y ∈ X − {x} (2.8)
(ver teorema en preliminares).
Las diferencias mas importantes son:
1. La condición (2.8) es sólo una condición de optimalidad suficiente para el prob-
lema (2.6). Mientras que (2.7) es una condición necesaria para el problema de
optimización convexo.
2. La condición (2.8) requiere que el gradiente de f sea no-nulo, mientras que (2.7) no.
Realmente cuando ∇(f(x)) = 0 en el caso convexo. La condición (2.7) se cumple
y x es óptimo.
43 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.4. OPTIMIZACIÓN CUASI-CONVEXA.
2.4.2. Optimización Cuasi-Convexa vía Problemas de Factibili-
dad Convexos
Una aproximación a problemas de optimización cuasi-convexa es mediante la repre-
sentación de los conjuntos subniveles de una función cuasi-convexa mediante una familia
de desigualdades convexas.
Sea φt : Rn → R, t ∈ R, una familia de funciones convexas que satisfacen
f(x) ≤ t ⇔ φt(x) ≤ 0
y también para cada x, φt(x) es una función no creciente es decir φs(x) ≤ φt(x) para
s ≥ t
Sea p∗ el valor óptimo del problema cuasi convexo (2.6), si el problema de factibilidad
convexo:
hallar x
s.a φt(x) ≤ 0
gi(x) ≤ 0 i = 1 . . .m (2.9)
Ax = b
es factible, entonces p∗ ≤ t. Si (2.9) es no factible entonces p∗ ≥ t se llama problema
de factibilidad convexo, debido a que todas las restricciones de inecuaciones son todas
funciones convexas y las de igualdad son lineales.
Del hecho, de que si el problema de factibilidad convexo (2.9) es factible, entonces p∗ ≤ t
y cualquier x factible para el problema cuasi-convexo satisface f(x) ≤ t. Si, el problema
de factibilidad convexa es no factible, entonces p∗ ≥ t.
Esto puede ser usado como base de un algoritmo simple para resolver el problema de
optimización cuasi-convexo usando bisección, procedimiento que en cada paso resuelve
un problema de optimización convexa.
44 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.4. OPTIMIZACIÓN CUASI-CONVEXA.
2.4.3. Método de Bisección para Optimización Cuasi-Convexa
Supongamos que el problema cuasi-convexo es factible y sea el intervalo inicial [l, u]
que contiene p∗ luego se resuelve el problema de factibilidad (2.9) en su punto medio
t = (l+u)2
para determinar el valor óptimo, el cual es una cota media superior o inferior
del intervalo se actualiza el intervalo.
Esto produce un nuevo intervalo que sigue conteniendo el valor óptimo pero ya es la
mitad que el inicial.Este proceso se repite hasta que el intervalo sea lo suficientemente
pequeño.
Algoritmo
Inicio: l ≤ p∗ u ≥ p∗, definir ϵ > 0 tolerancia para el criterio de parada.
paso Iterativo
1. t =(l + u)
2
2. Resolver el problema de factibilidad convexa (2.9)
3. Si (2.9) es factible u = t, si no l = t
Ir a (1) y repetir hasta que u− l ≤ ϵ.
El proceso del algoritmo descrito garantiza que l ≤ p∗ ≤ µ despues de k iteraciones la
longitud del intervalo es 2−k(µ− l) donde µ− l es la longitud del intervalo inicial. Luego
para que el algoritmo finalice son necesarias [log2((µ− l)
ϵ)] iteraciones, en cada paso se
resuelve el problema de factibilidad convexo (2.9).
45 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
2.5. Clasificación de Problemas de Optimización Con-
vexa
En las siguientes secciones se verá distintos tipos de problemas convexos que se
pueden agrupar considerando el siguiente esquema
OPTIMIZACIÓN CONVEXA
PROGRAMACIÓN GEOMÉTRICA PROBLEMA CON DESIGUALDADES
GENERALIZADAS(GP)
PROGRAMACIÓN CÓNICA (CP)
P.C de 2 Ordeno−
(SOCP)
PROGRAMACIÓN
SEMI DEFINIDA
(PSDP)
P. CUADRÁTICA CON RESTRICCIONES
P. CUADRÁTICA (RP)
PROGRAMACIÓN LINEAL (LP)
Figura 2.3:
2.5.1. Problemas de Optimización Lineal
Cuando todas las funciones del problema son afines tanto de la función objetivo como
las restricciones, el problema de optimización se llama lineal (LP)
mın ctx+ d
Gx ≤ h G ∈ Rmxn (2.10)
Ax = b A ∈ Rpxn
46 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
El conjunto factible es un poliedro. Normalmente se omite la constante d porque
no afecta al resultado. Como las funciones afines son convexas y cóncavas, se puede
considerar también al problema de maximización como convexo.
Geométricamente
P *
− c
x
Figura 2.4:
La región factible es un poliedro P y busca minimizar la función afín ct + d sobre P .
Forma Estándar y de Desigualdades de un Problema Lineal:
El formato estándar del problema LP (2.10) es:
mın ctx
Ax = b (2.11)
x ≥ 0
es decir las únicas restricciones de desigualdad son las de no-negatividad de las vari-
ables.
Mientras que el formato de desigualdades de un PL es
mın ctx
Ax ≤ b (2.12)
es decir no tiene restricciones de ecuaciones.
47 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
Observación.
Para pasar un PL (2.10) a la forma estándar se usan variables de holgura si para las
restricciones de desigualdad y la variable x se escribe como la diferencia de 2-variables
no-negativas x+ y x− es decir x = x+ − x− , x+ ≥ 0 x− ≥ 0, con esto se tiene
mın ctx+ − ctx− + d
Gx+ −Gx− + s = h
Ax+ − Ax− = b
x+ ≥ 0 , x− ≥ 0 , s ≥ 0
que es un LP en forma estándar
Ejemplos.
1. Centro de Chebychev de un Poliedro
Se desea hallar la bola euclidiana más grande que queda dentro de un poliedro
descrito por inecuaciones lineales
P = {x ∈ Rn : atix ≤ bi, i = 1 . . .m}
el centro de la bola optimal es llamado centro de chebyshev del poliedro. Sea
B = {xc + µ : ∥µ∥2 ≤ r}
la representación de la bola. La variable del problema es xc ∈ Rn y r ∈ R. Se desea
maximizar r sujeto a que B ⊂ P . Por lo tanto el PL es
max r
atixc + r∥ai∥2 ≤ bi i = 1 . . .m
en las variables r y xc.
2. Función Lineal por Partes
Sea f(x) = maxi
{(atix + b)} una función convexa lineal por partes,se minimiza f .
Este problema puede transformarse en uno de PL
mın t
atix+ rbi ≤ t i = 1 . . .m
48 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
3. Planificación de una Actividad Dinámica
Se desea planificar los niveles de actividad de n actividades o sectores de una
economía, sobre N periodos de tiempo. Sea xj(t) ≥ 0 , t = 1 . . . N , el nivel de
actividad del sector j en el periodo t.
Cada actividad consume y produce bienes o productos en proporción a su nivel de
actividad.
La cantidad del bien i producido por cada unidad de actividad j es aij. Simi-
larmente la cantidad del bien i consumido por unidad de actividad j es bij. La
cantidad total de bienes producidos en un periodo t es Ax(t) ∈ Rm y la cantidad
de bienes consumidos es Bx(t) ∈ Rm.
Los bienes consumidos en su periodo no pueden excederse a aquellos producidos
en el periodo anterior se busca tener Bx(t+1) ≤ Ax(t) para t = 1 . . . N . Se conoce
el vector go ∈ Rm de bienes iniciales tal que las restricciones en el primer periodo
de los niveles de actividad es Bx(1) ≤ go, los excesos de los bienes no consumidos
por las actividades son:
s(0) = go −Bx(1)
s(t) = Ax(t)−Bx(t+ 1) , t = 1 . . . N − 1
s(N) = Ax(N)
el objetivo es maximizar un descuento total de los bienes en exceso
cts(0) + δcts(1) + . . .+ δNcts(N)
donde c ∈ Rm contiene el valor de los bienes y δ > 0 es un factor de descuento.
Luego el PL es:
max cts(0) + δcts(1) + . . .+ δNcts(N)
s.a : x(t) ≥ 0 , t = 1 . . . N
s(t) ≥ 0 , t = 0 . . . N
s(0) = go −Bx(1)
s(t) = Ax(t)−Bx(t+ 1) , t = 1 . . . N − 1
s(N) = Ax(N)
49 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
con variables x(1) . . . x(N) , s(0) . . . s(N).
2.5.2. Problemas de Optimización Cuadráticas
Un problema de optimización convexo se llama de optimización cuadrática (QP) si
la función objetivo es cuadrática y las funciones restricción son afines. Matemáticamente
es de la forma
mın1
2xtQx+ qtx+ r
s.a : Gx ≤ h
Ax = b
donde Q ∈ Rn×m simétrica semi definida positiva G ∈ Rn×m, A ∈ Rp×n.
Observaciones.
Si la función objetivo y las restricciones de desigualdades son funciones cuadráticas, se
tiene un problema cuadrático con restricciones cuadráticas por ejemplo:
mın1
2xtQx+ qtx+ ro
s.a :1
2xtPix+ qtix+ ri ≤ 0 i = 1 . . .m
Ax = b
Q ∈ Rn×n simétrica semi definida positiva P ∈ Rm×n , A ∈ Rp×n
Ejemplo.
Mínimos cuadrados y regresión:
Surge en muchos campos y también se conocen con los nombres : “Análisis de Regresión”
o “Aproximación por mínimos cuadrados”.
El problema consiste en minimizar una función cuadrática convexa, es decir:
mın ∥Ax− b∥2
s.a : l ≤ xc ≤ µ2i i = 1, 2, . . . n
50 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
2.5.3. Programación Cónica de Segundo Orden
Se conoce como programa cónico de 2o orden a un tipo de problema en que cada
desigualdad describe un cono asociado a la norma ∥.∥2, es de la forma
mın fTx
∥Aix+ bi∥ ≤ cTi x+ di Ai ∈ Rni×n
Fx = g F ∈ Rp×n
Las desigualdades ∥Aix + bi∥2 ≤ cTi x + di se llaman restricciones cónicas de 2o orden
porque equivale a que los puntos (Aih+ bi, ctix+ di) pertenezcan al cono definido por la
norma euclidiana l2 cuando ci = 0 i = 1 . . .m el problema de programación cónica de
2o orden equivale al problema de programación cuadrática, lo que justifica la relación
de la fig. 2 · 1
2.5.4. Programación con Desigualdades Generalizadas
Es una generalización de los problemas convexos y se describen del siguiente modo:
mın f(x)
s.a : gi(x) ≤ Oki i = 1 . . .m (2.13)
Ax = b
donde f : Rn → R , Ki ⊆ Rki son conos con vértice en 0 y gi : Rn → Rk−i son ki conos
convexos.
Esta formulación se dice que es de la forma estándar de un problema de optimización
convexa con restricciones de inecuaciones generalizadas. El problema (2.1) es un caso
particular de (2.13) cuando ki = R+ i = 1 . . .m.
Muchos resultados para problemas de optimización convexa se siguen cumpliendo para
problemas de optimización convexa generalizada como por ejemplo:
◦ El conjunto factible, los conjuntos de curvas de nivel, el conjunto optimal siguen
siendo convexos.
51 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
◦ Cualquier punto óptimo local para el problema (2.13) es también óptimo global.
◦ La condición de optimalidad para f diferenciable para un problema convexo tam-
bién se sigue manteniendo.
Problemas en forma cónica.
Un caso sencillo de problema con desigualdades generalizadas son los “problemas de
forma cónica” que tienen una función objetivo lineal y las funciones restricciones afines:
mın ctx
Fx+ g ≤ Ok (2.14)
Ax = b
Cuando k es el octante no negativo el problema (2.14) se reduce a un problema lineal y
también tienen su equivalente en el formato estándar y en el formato de desigualdades.
Programación semidefinida.
Cuando el cono K es el cono de matrices k×k semidefinidas positivas, si Sk+, el problema
de forma cónica es llamado “programas semidefinidos” o SDP y tienen la siguiente forma:
mın ctx
s.a : x1F1 + . . .+ xnFn +G ≤ 0
Ax = b
donde G, F1 . . . Fn ∈ Sk conjunto de matrices simétricas de orden k×k. Y A ∈ Rp×n. La
restricción de desigualdad en este caso se conoce como desigualdades matriciales lineales
(LMI).
Cuando todas las matrices G, F1 . . . Fn son diagonales, el problema se reduce a un
problema lineal (LP) y también se encuentran estos problemas en forma estándar y en
formato de desigualdades.
52 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
2.5.5. Programación Geométrica
En esta sección se describe una familia de problemas de optimización que en su forma
natural no son convexos, pero se pueden convertir a problemas convexos con un cambio
de variable y una transformación en las funciones que lo componen.
Definición 2.5. Sea f : Rn → R con dom(f) = Rn++ tal que
f(x) = cxa11 .xa2
2 .xa33 . . . xan
n c > 0 , ai ∈ R
se llama función monómico o monomial.
Observación.
La suma de funciones monomiales forman una función llamada posinomio o posinomial
y es
f(x) =k∑
k=1
ckxa1k1 .xa2k
2 .xa3k3 . . . xank
n
donde ck > 0.
Las funciones posinomiales son cerradas bajo la adición, multiplicación y el escalamiento
no-negativo. Las monomiales son cerradas bajo la multiplicación y división.
Un problema de programación geométrica (GP) es un problema de optimización de la
forma:
mın f(x)
gi(x) ≤ 1 i = 1 . . .m (2.15)
hj(x) ≤ 1 j = 1 . . . p
donde f, gi i = 1 . . .m son funciones posinomiales y hj j = 1 . . . p son monomiales.
El dominio del problema es D = Rn++, la restricción x ≥ 0 es implícita.
Programación Geométrica en forma Convexa:
Los problemas de programación geométrica no son generalmente problemas de op-
timización convexa, para transformarlos en convexos se hace el cambio de variables
yi = log xi, por lo que xi = eyi . Si f es una función monomial de x es decir:
53 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
f(x) = cxa11 xa2
2 . . . xann
entonces
f(x) = f(ey1 . . . eyn)
= c(ey1)1 . . . (eyn)n
= eaT y+b
donde b = log c. El cambio de variable yi = log xi vuelve a una función monomial en la
exponencial de una función afín.
Similarmente, si f es una función posinomial dada por
f(x) =k∑
k=1
ckxa1k1 .xa2k
2 .xa3k3 . . . xank
n
entonces
f(x) =k∑
k=1
eaTk y+bk
donde ak = (a1k, . . . , ank) y bk = log ck. El cambio de variables hace a la función posino-
mial una función exponencial de funciones afines.
El problema de programación geométrica (2.15) expresados en términos de las nuevas
variables y es:
mınk∑
k=1
eaTk y+bk
s.a :
ji∑j=1
eaTiky+bik ≤ 1 i = 1 . . .m (2.16)
eaTgiy+hi = 1 i = 1 . . . p
donde aik ∈ Rn , i = 0 . . .m contiene los exponentes de la restricción de desigualdad
posinomial y gi ∈ Rn , i = 1 . . . p contiene los exponentes de la restricción de igualdad
monomial.
Ahora considerando el logaritmo de todas las funciones se obtiene el problema geométrico
54 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA
en forma convexa es:
mın log
(k∑
k=1
eaTk y+bk
)
s.a : log
(j∑
j=1
eaTiky+bik
)≤ 0 i = 1 . . .m (2.17)
gTi + hi = 0 i = 1 . . . p
Observación.
La transformación entre el problema de programación geométrica en forma posino-
mial y el problema de programación geométrica en forma convexa no involucra ningún
cálculo, son simples cambios de formas de las funciones objetivo y restricciones.
55 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Capítulo 3
Aplicación de Optimización Convexa:
Aproximación y Ajuste
3.1. Introducción
En el presente capítulo describiremos la aplicación de problemas de optimización
convexa relacionados a la teoría de aproximación y ajuste como son los problemas de
aproximación de normas, problemas de norma minima , interpolación y función de ajuste.
En las siguientes secciones se describe cada uno de los problemas mencionados y se
formulan como uno de optimización convexa.
3.2. Aproximación de Norma
Este tipo de aplicaciones se basa en obtener un elemento aproximado a la solución
óptima deseada usando como elemento de medida una Norma (∥.∥) de Rn y asegura la
mejor aproximación posible.
56
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
3.2.1. Problema Básico de Aproximación de Norma
El problema de aproximación de norma mas simple es un problema de optimización
no-restringido formulado como:
mınx∈Rn
∥Ax− b∥ (3.1)
donde A ∈ Rm×n y b ∈ Rn son los datos del problema y x ∈ Rn es la variable y ∥.∥ es una
norma de Rm. Una solución de este problema se dice que es una solución aproximada de
Ax ≈ b en la norma ∥.∥ de Rm.
El vector
r = Ax− b
se llama vector residual del problema, sus componentes son los residuales individuales
asociados a x.
El problema (3.1) es un problema convexo y siempre tiene una solución optimal. Cuando
el vector b ∈ R(A) el valor óptimo del problema es cero, sin embargo la utilidad de este
problema se presenta cuando b ∈ R(A) y es la razón de su estudio. Además se considera
el caso cuando las columnas de A son L.I y m > n, pues si las columnas de A son L.I
y m = n la solución optimal es dada por x = A−1b.
Interpretación del Problema de Aproximación.
Expresando a Ax como
Ax = x1a1 + . . .+ xnan
donde a1, . . . , an ∈ Rm son las columnas de A, el objetivo del problema de aproximación
mediante una norma es representar al vector b mediante una combinación lineal de las
columnas de la matriz A lo mas proximo posible con una desviación o medida en la
norma ∥.∥.
Observación.
Este problema también se conoce como el "problema de regresión”. En este contex-
to a1, . . . , an se llaman vectores regresores y el vector x1a1 + . . . + xnan donde x =
(x1, . . . , xn) es una solución optimal, se llama regresión de b.
57 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Estimación.
Esta interpretación surge en el problema de calcular un parámetro vectorial basado en
una medida lineal. Sea el modelo de medida lineal
y = Ax+ v
donde y ∈ Rm es un vector de medida, x ∈ Rn es un vector de parámetros que serán
calculados y v ∈ Rm es una medida de error que es desconocida pero se supone es
pequeño en términos de ∥.∥.
Este problema consiste en hacer una conjetura de que tan sensible es x dado y.
Supongamos que x tiene el valor de x, entonces
v = y − Ax
considerando que los valores de v (medidas según ∥.∥) son pequeños, lo mas evidente
para x es
x = argmınz
∥Az − y∥ , z ∈ ran(A)
Geométrico:
Sea A = R(A) ⊂ Rm el subespacio generado por el rango de A y sea b ∈ Rm. Una
proyección de b sobre A en la norma ∥.∥, es cualquier punto en A tal que es lo mas
próximo a b. Es decir es el punto que resuelve el problema
mın ∥u− b∥
s.a : u ∈ A
Parametrizando un elemento arbitrario de R(A) como u = Ax, entonces resolver el
problema de aproximación de norma (3.1) es equivalente a calcular una proyección de b
sobre A.
Observación.
El problema (3.1) también puede interpretarse como un problema de diseño óptimo,
considerando x1, . . . , xn como variables de diseño que serán halladas. El vector y = Ax
es el vector de m-resultados que se supone una función lineal de x; b es un vector de
58 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
marcas o resultados deseados. El objetivo es hallar un vector de diseño que sea tan
proximo como sea posible, al resultado deseado, es decir Ax ≈ b. Considerando el vector
residual r como la desviación del resultado actual (Ax) al resultado deseado (b). Si se
mide la calidad del diseño por la norma de la desviación entre el resultado y el resultado
deseado, entonces el problema (3.1) es el problema de hallar el mejor diseño.
Una extension del problema de aproximación de la norma es el problema:
mın ∥W (Ax− b)∥
llamado "problema de aproximación de la norma parametrizado”, donde W es una ma-
triz m×m, llamada "matriz de parametrización”.
Generalmente W es una matriz diagonal con diferentes parámetros para cada compo-
nente del vector residual r = Ax − b. Considerando A = WA y b = Wb este problema
puede ser resuelto como un problema de aproximación de la norma básica (3.1).
Los problemas mas comunes de aproximación de la norma son:
a. Problema de Mínimos Cuadrados
El sistema Ax = b ; Am×n es inconsistente si y sólo si b ∈ gen{CA}.
Los sistemas inconsistentes aparecen en muchas situaciones.
Se busca modificar el problema tal que no se exiga que la igualdad Ax = b se
satisfaga, se busca x ∈ Rn tal que Ax sea muy cercano a b tanto como sea posible.
Si W = gen{CA} entonces el vector en W más cercano a b es proyW b. Es decir
mın ∥b− w∥ , w ∈ W
se consigue cuando w = proyW b. Luego si hallamos x tal que Ax = proyW b entonces
es seguro que ∥b− w∥ es lo mas pequeña posible.
b− proywb = b−Ax es ortogonal a todo vector de W . Esto implica que b−Ax es
ortogonal a cada columna de A. Es decir que
AT (Ax− b) = 0
equivalentemente
ATAx = AT b (3.2)
59 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
cualquier solución de (3.2) se llama solución por mínimos cuadrados del sistema
Ax = b (en general Ax = b).
(3.2) se llama sistema normal, asociado a Ax = b.
Observación.
Para calcular una solución x por mínimos cuadrados del sistema Ax = b, se procede
de la siguiente forma: si {w1 . . . wm} es una base ortonormal para W ≡ CA entonces
proyW b = (b.w1)w1 + (b.w2)w2 + . . .+ (b.wm)wm
Teorema 3.1. Sea Am×n tal que ran(A) = n, entonces ATA es no singular y el
sistema Ax = b tiene solución única por mínimos cuadrados y es x = (ATA)−1AT b
es decir, el sistema normal tiene solución única.
60 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Procedimiento. Para hallar por mínimos cuadrados x de Ax = b :
a) Formar ATA y AT b
b) Resolver ATAx = AT b en términos de x mediante reducción de Gauss-Jordan.
Ejemplo.
Resolver : Ax = b , donde
A=
1 2 −1 3
2 1 1 2
−2 3 4 1
4 2 1 0
0 2 1 3
1 −1 2 0
; b =
1
5
−2
1
3
5
Solución.
ran(A)
1 2 −1 3
2 1 1 2
−2 3 4 1
4 2 1 0
0 2 1 3
1 −1 2 0
∼
1 2 −1 3
0 −3 3 −4
0 7 2 7
0 −6 5 −12
0 2 1 3
0 −3 3 −3
∼
1 2 −1 3
0 −3 3 −4
0 0 9 −73
0 0 −1 −4
0 0 3 13
0 0 0 1
∼
1 2 −1 3
0 −3 3 −4
0 0 −1 −4
0 0 0 1
0 0 9 −73
0 0 3 13
∼
1 2 −1 3
0 −3 3 −4
0 0 −1 −4
0 0 0 1
0 0 0 −1153
0 0 0 −353
ran(A) = 4, se puede aplicar mínimos cuadrados
61 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
luego se forma el sistema
AtAx = Atb26 5 −1 5
5 23 13 17
−1 13 24 6
5 17 r6 23
x1
x2
x3
x4
=
24
4
10
20
este sistema es cuadrado 4× 4 y tiene solución única por mínimos cuadrados
x =
0,9990
−2,0643
1,1039
1,8902
Si W = gen{CA} entonces proyW b = Ax =
1,4371
4,8181
1,8852
0,9713
2,6459
5,2712
Ajuste por mínimos cuadrados.
En muchas aplicaciones no es fácil llegar a fórmulas que expresen la relación de los
datos del problema como por ejemplo, la relación entre la aceleración debida a la
gravedad, el tiempo que un objeto ha estado cayendo y la altura del objeto, que
es dada por la ley física
s(t) = s0 − v0t−1
2gt2
donde s0 es la altura inicial; v0 es velocidad inicial y g es la gravedad, t es el tiempo.
En muchos casos se tiene datos, que deben ser representados por una curva
que "mejor” se ajusta a ellos.Por ejemplo si:
se tiene n puntos de R2 como datos (x1, y1), (x2, y2), . . . (xn, yn) de algun prob-
lema, estos pueden ser aproximados por diferentes curvas como se muestran
en la siguiente figura:
62 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Figura 3.1:
Aproximación de una Recta.
Se desea hallar una recta de la forma
y = mx+ b
que mejor represente a los n puntos (x1, y1), (x2, y2), . . . (xn, yn) Para hallar y =
y = mx + b
(x , y )1 1
2(x , mx
2 + b )
(x1
, b+mx )
(x2
, x2
)
(x3
, y3
)
(x3
, mx3 + b )
Figura 3.2:
mx+ b que mejor ajuste a los datos, se debe encontrar m y b tal que sea minima
la suma [y1 − (b+mx1)]2 + [y2 − (b+mx2)]
2 + . . .+ [yn − (b+mxn)]2 es decir la
distancia de los datos a los puntos de la recta se minimiza en (m, b).
Esta selección de m y b se llama aproximación lineal de mínimos cuadrados a
los puntos dados.
Para resolver el problema se usa la forma matricial
63 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Si los puntos (x1, x2), . . . , (x1, x2) están todos en la recta y = mx+ b se tiene
y1 = b+mx1
y2 = b+mx2
...
yn = b+mxn
equivalentemente
y = Au ; donde y =
y1
y2...
yn
; A =
1 x1
1 x2
......
1 xn
; u=
b
m
si los puntos no son
colineales, entonces y = Au o y − Au = 0 y entonces se busca un vector u que
minimice
∥y − Au∥
es decir
mınu
∥y − Au∥
Hallar u que minimice a ∥y−Au∥ no se difícil, como An×2 y u2×1, el vector Au ∈ Rn
y además pertenece a la imagen de A. La imagen de A es un subespacio de Rn de
dim ≤ 2.
Sea u el vector minimizante, entonces se ve que y − Au se minimiza cuando es
ortogonal a Im(A). Es decir
Au ⊥ (y − Au)
Au.(y − Au) = 0
(Au)T (y − Au) = 0
ATuT (y − Au) = 0
uT (ATy − ATAu) = 0
64 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Au
y−Au
Figura 3.3:
ATy − ATAu = 0
ATy = ATAu
u = (ATA)−1ATy
Observación.
ATA es no-singular siempre que los n- puntos sean no-colineales.
Ejemplo.
a) Sea los datos (1, 4), (−2, 5), (3,−1) y (4, 1). Hallar la recta que mejor ajuste
los datos dados.
Solución:
A =
1 1
1 −2
1 3
1 4
; y =
4
5
−1
1
;
1 1 1 1
1 −2 3 4
ATA =
1 1 1 1
1 −2 3 4
1 1
1 −2
1 3
1 4
=
4 6
6 30
(ATA)−1 =1
84
30 −6
−6 4
65 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
u = (ATA)−1Aty
=1
84
30 −6
−6 4
1 1 1 1
1 −2 3 4
4
5
−1
1
=1
84
30 −6
−6 4
=
3,57
−0,80
∴ y = 3,57− 0,88x mejor ajuste
b) En la fabricación del producto A, la cantidad de compuesto C1, es controlada
´por la cantidad del compuesto C2 utilizada en el proceso. Se fabrica 1 galón
de A, se registra la cantidad de C1 usada y la cantidad de C2 presente, en la
siguiente tabla:
C1(onzas/galon) 3 4 5 6 7 8 9 10 11 12
C2(onzas/galon) 4.5 5.5 5.7 6.6 7.0 7.7 8.5 8.7 9.5 9.7
Suponga que la relación de C1 usada y la cantidad de C2 presente es da-
da por una ecuación lineal.
a. Determine una ecuación para que la recta de mínimos cuadrados que
mejor ajuste los datos tomados. (estos datos son de naturaleza proba-
bilística, en el sentido que si se repite el experimento se encontrarían
valores de C2 distintos ligeramente para los mismos valores de C1, pues
toda medición esta sujeta a errores experimentales).
b. ¿Cuantas onzas de C2 hay en un galón de A si se usan 30 onzas de C1?
66 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Solución.
1
1 2
2
3
3
4
4
5
5
6
6
7
7
8
8
9
9
10
10
11 12
Figura 3.4:
b =
4,5
5,5
5,7
6,7
7,0
7,7
8,5
8,7
9,5
9,7
, A =
1 3
1 4
1 5
1 6
1 7
1 8
1 9
1 10
1 11
1 12
, x =
b
m
Luego
AT =
1 1 1 1 1 1 1 1 1 1
3 4 5 6 7 8 9 10 11 12
, ATA =
10 75
75 645
,
AT b =
73,4
598,6
67 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Luego se forma el sistema
ATAx = AT b sistema normal.
como este sistema es consistente de solución única se tiene que
x = (ATA)−1AT b
x =1
825
645 −75
−75 10
1 1 1 1 1 1 1 1 1 1
3 4 5 6 7 8 9 10 11 12
4,5
5,5
5,7
6,7
7,0
7,7
8,5
8,7
9,5
9,7
x =
1
825
645 −75
−75 10
73,4
598,6
x =
1
825
47343− 44895
−5505 + 5986
x =
1
825
2448
481
x =
2,967
0,583
∴ y = 0,583x+ 2,967
mejor aproximación a los datos.
Ajuste Polinomial por Mínimos Cuadrados.
Dado un conjunto de n-datos en R2, el mejor ajuste de ellos aun polinomio de
grado m tal que
y = a0 + a1x+ a2x2 + . . .+ am−1x
m−1 + amxm
68 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
como no todos los n-datos están exactamente sobre la gráfica del polinomio desea-
do, se tiene que
y ≈ a0di + a1xi + a2xi + . . .+ amxmi , i = 1, 2, . . . n
Procedimiento.
Dados (x1, y1), (x2, y2), . . . , (xn, yn) y m ≤ n − 1 con al menos m + 1 de los xi
distintos, el ajuste de los datos del polinomio por mínimos cuadrados
y = a0 + a1x+ a2x2 + . . .+ am−1x
m−1 + amxm
a) Formar
b =
y1
y1...
yn
A =
1 x1 x21 . . . xm
1
1 x2 x22 . . . xm
2
1 x3 x23 . . . xm
3
......
......
1 xn x2n . . . xm
n
y x =
a0
a1
a2...
am
b) Resolver en términos de x
ATAx = AT b
sistema normal
Ejemplo.
Hallar el mejor ajuste cuadrático para :
A =
1 1 1
1 −2 4
1 3 9
1 4 16
y b =
4
5
−1
1
69 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Solución.
At =
1 1 1 1
1 −2 3 4
1 4 9 16
⇒ AtA =
4 6 30
6 30 84
30 84 354
y Atb =
9
−5
31
resolver :
ATAx = AT b
x = (ATA)−1AT b =1
4752
3564 396 −396
396 516 −516
−396 −156 84
9
−5
31
=1
4752
17820
−3852
−180
=
3,75
−0,81
−0,04
Figura 3.5:
∴ y = 3,75− 0,81x− 0,04x2 es la mejor aproximación.
70 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Factorización QR
A = QR
Usada en programas para calcular valores propios de una matriz; resolver
sistemas de ecuaciones lineales; determinar aproximaciones para mínimos
cuadrados.
Teorema 3.2. Si Am×n con columnas L.I, entonces A se puede factorizar como
A = QR. donde Q es m × n cuyas columnas forman una base ortonormal para
W = gen{CA} y R es n× n triangular superior no-singular.
Procedimiento.
Para factorizar A en forma QR
a) Sean v1, v2, . . . vn las columnas de A y sea W = gen{v1, v2, . . . vn} ⊂ Rn y con
v1, v2, . . . vn como base.
b) Transforma la base v1, v2, . . . vn en una base ortonormal w1, w2, . . . wn (utilizar
el procedimiento de Gram- Schmidt) y Q = [w1, w2, . . . wn].
c) Calcular R = [rij] y Q = [w1, w2, . . . wn], donde
rij =
vjwi , i ≤ j
0 , i>j.
Ejemplo :
Sea A =
1 −1 −1
1 0 0
1 −1 0
0 1 −1
Hallar su factorización QR
71 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Solución. considerando el procedimiento anterior se tiene:
a)
v1 =
1
1
1
0
, v2 =
−1
0
−1
1
, v3 =
−1
0
0
−1
entonces W = gen{v1, v2, v3} ⊂ R4. Si v1, v2 y v3 son L.I. entonces se tiene una
base de W .
b) Se ortonormaliza la base obtenida con el proceso de Gram-Schmidt
w1 =
1√3
1√3
1√3
0
, w2 =
−1√15
2√15
−1√15
3√15
, w3 =
−4√35
3√35
1√35
−3√35
c) luego
Q =(
w1, w2, w3
), R =
r11 r12 r13
0 r22 r23
0 0 r33
donde :
r11 = u1.w1
=
1
1
1
0
1√3
1√3
1√3
0
=
3√3
r12 = u2.w1
72 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
=
−1
0
−1
0
1√3
1√3
1√3
0
=
−2√3
r13 = u3.w1
=
−1
0
0
1
1√3
1√3
1√3
0
=
−1√3
r21 = u1.w2
=
1
1
1
0
−1√15
2√15
−1√15
3√15
= 0
r22 = u2.w2
=
−1
0
−1
1
−1√15
2√15
−1√15
3√15
=
5√15
r23 = u3.w2
=
−1
0
0
−1
−1√15
2√15
−1√15
3√15
=
−2√15
r31 = u1.w3 = 0
r32 = u2.w3 = 0
73 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
r33 = u3.w3
=
−1
0
0
−1
−4√35
3√35
1√35
−3√35
=
7√35
R =
3√3
−2√3
−1√3
0 5√15
−2√15
0 0 7√35
Observación.(Mínimos Cuadrados)
Sea Ax = b una solución por mínimos cuadrados en x tal que
ATAx = AT b
si A = QR ⇒ AT = (QR)T = RTQT
luego
RTQTQRx = RTQT b
como Q es ortonormal⇒ QTQ = Im, luego
RTRx = RTQT b
como RT es no-singular, pues R lo es, entonces
(RT )−1RT︸ ︷︷ ︸I
Rx = (RT )−1RT︸ ︷︷ ︸I
QT b
Rx = QT b
Como R es triangular superior la solución del sistema se obtiene por sustitución
regresiva.
74 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
ejemplo:
Resuelva
1 2
−1 −2
1 1
x
y
=
1
3
5
solución.
v1 =
1
−1
1
, v2 =
2
−2
1
u1 = v1 =
1
−1
1
u2 = v2 −v2.v1v1.v1
v1 =
2
−2
1
− 5
3
1
−1
1
=
13
−13
−23
luego :
w1 =u1
∥u1∥=
1√3
−1√3
1√3
y w2 =u2
∥u2∥=
√3
3√2
−√3
3√2
−2√3
3√2
⇒
Q =
1√3
√3
3√2
−1√3
−√3
3√2
1√3
−2√3
3√2
75 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
r11 = v1.w1 =
1
−1
1
.
1√3
−1√3
1√3
= 3√3
, r12 = v2.w1 =
2
−2
1
.
1√3
−1√3
1√3
=
5√3
r21 = 0
r22 = v2.w2 =
2
−2
1
.
√3
3√2
−√3
3√2
−2√3
3√2
= 2√3
3√2
∴
3√3
5√3
0 2√3
3√2
Ax = b
QRx = b
Rx = Qtb
3√3
5√3
0 2√3
3√2
x1
x2
=
1√3
−1√3
1√3
√3
3√2
−√3
3√2
−2√3
3√2
1
3
−5
3√
35√3
0 2√3
3√2
x1
x2
=
−7√3
8√3
3√2
x2 =
8√3
3√2
2√3
3√2
= 4
x1 =
−7√3− 5√
3(4)
3√3
x1 =−27
3
x1 = −9
76 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
∴ x =
−9
4
b. Problema de Aproximación de chebychev o Minimax
cuando se usa la norma l∞, el problema de aproximación de la norma es:
mın ∥Ax− b∥∞ ≈ mın{max{|r1|, |r2|, . . . , |rm|}}
y recibe el nombre de "problema de aproximación de Chebychev” o "problema
de aproximación minimax”, este ultimo nombre es debido a que se minimiza el
máximo del valor absoluto del vector residual.
Observación:
Este problema puede ser formulado como uno de programación lineal (LP) como
mın t
s.a : −t1 ≤ Ax− b ≤ t1
con x ∈ Rn y t ∈ R variables.
Ejemplo:
Hallar la función lineal que sea la mejor aproximación de la función exponencial
et en [0, 1] respecto a la norma del max.
Este problema es equivalente a:
mına,b,η
η
s.a : −η ≤ et − a− bt ≤ η,
t ∈ [0, 1]
que es un problema de programación lineal convexo.
c. Aproximación de la Suma Absoluta de Residuales
cuando se usa la norma l1 el problema de aproximación de la norma es:
mın ∥Ax− b∥1 ≈ mın{max{|r1|, |r2|, . . . , |rm|}}
77 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
y se llama "problema de aproximación de la suma absoluta de residuales”. Este
problema puede ser formulado como uno de programación lineal(LP) como:
mın lT t
s.a : −t ≤ Ax− b ≤ t
como x ∈ Rn y t ∈ Rm variables.
3.2.2. Aproximación mediante una función de Penalización
En el problema de aproximación de norma lp, para 1 ≤ p ≤ ∞ la función objetivo
es:
(|r1|p, |r2|p, . . . , |rm|p)1/p
análogo al caso del problema de mínimos cuadrados es posible considerar el problema
equivalente con función objetivo:
|r1|p, |r2|p, . . . , |rm|p
que es una función simétrica y separable de los residuales. En particular, la función
objetivo depende solamente de "la amplitud de la distribución de los residuales”.
El problema de aproximación mediante una función de penalización tiene la forma :
mın ϕ(r1) + . . .+ ϕ(rm) (3.3)
s.a : r = Ax− b
donde ϕ : R → R, llamada función de penalización.
considerando a ϕ una función convexa, el problema (3.3) es un problema de optimización
convexa.
Observación:
En muchos casos ϕ es además una función simétrica, no negativa y que satisface ϕ(0) = 0.
Interpretación del Problema:
Para elegir al vector variable x, se obtiene la aproximación Ax de b que tiene asociado
78 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
un vector residual r.
Una función de penalización aplica un costo o penalidad a cada componente del vector
residual dada por: ϕ(ri) , i = 1 . . .m, la penalidad total es la suma de las penalidades
para cada residual, es decir
ϕ(r1) + ϕ(r2) . . .+ ϕ(rm)
Elecciones diferentes de x generan diferentes resultados residuales y por tanto diferente
penalidad total. El problema de aproximación mediante una función de penalización
minimiza la penalidad total causada por los residuales.
Ejemplo:
Entre las funciones de penalización mas comunes asociadas a problemas de aproximación
son:
a. La función
φ(µ) = |µ|p ; p ≥ 1
asociada al problema de aproximación de norma lp.
En particular la función de penalización cuadrática
φ(µ) = µ2
que genera el problema de aproximación de norma euclidiana.
b. la función de penalización
φ(µ) =
0 ; |µ| ≤ a
|µ| − a ; |µ| > a, a ∈ R
Llamada también “ deadzone-linear ” o “ zona muerta-lineal ” determina el rango
de la penalización, es decir para valores menores o iguales a a no es necesario
penalizar.
79 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
c. La función de penalización
φ(µ) =
−a2 log(1− (
µ
a)2) ; |µ| < a
∞ ; |µ| ≥ a
llamado la función “ log-barrier ” o función “ barrera logarítmica ”. Determina una
penalización infinita para residuales mucho mayores o iguales que a.
En la siguiente figura se muestra geométricamente estas tres funciones de penalización,
considerando el caso particular de la función de penalización cuadrática para la primera
función de penalización. a =1
4para la segunda función a = 1 para la función “ log-
barrier”.
ϕ
µ
µ( )
0.5
0.5
1
11
1.5
1.5
2
−0.5−1.5 −1/4 1/4−
log−barriercuadrática
deadzone−linear
Figura 3.6:
80 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Observación:
El escalamiento de la función penalización por un numero positivo no afecta la
solución del problema de aproximación con función penalizada pues simplemente
escala la función objetivo.
La “ forma ” de la función penalización tiene un gran efecto sobre la solución del
problema de aproximación de la función penalizada. φ(µ) mide la diferencia de un
residual de valor µ. Si φ es muy pequeño( o casi cero) para valores pequeños de µ,
significa que la solución del problema penalizado es “ casi ” igual a la solución del
problema sin penalizar.
Si φ(µ) crece rápido cuando µ crece, significa que hay fuertes diferencias para
residuales grandes; si φ se hace infinito fuera de algún intervalo, esto significa que
los residuales fuera del intervalo son inaceptables.
81 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
3.2. APROXIMACIÓN DE NORMA
Conclusiones
Considerando que existen diversos fenómenos naturales que son estudiados mediante
modelos de optimización convexa formulados de la forma:
mın f(x)
S.a : gi(x) ≤ 0 i = 1, 2, · · · ,m
hj(x) = 0 j = 1, 2, · · · , p
donde f : Rn → R , gi, hj : Rn → R son convexas, llegando a las siguientes conclusiones:
Estos modelos proporcionan grandes ventajas frente a problemas de optimización
no convexos, debido a las propiedades de convergencia que presentan las funciones
convexas sobre conjuntos cerrados.
En un problema de optimización convexa, cualquier punto que es óptimo local,
también el óptimo global.
La región factible de un problema de optimización convexa es un conjunto cerrado
y acotado, en el que queda garantizada la convergencia.
La convergencia puntual o ρ -convergencia en los problemas de optimización con-
vexa permiten hallar la mejor aproximación al punto optimal.
Los métodos para hallar la solución de los problemas de optimización convexa
todos son convergentes, gracias a la convexidad de las funciones.
82 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
Bibliografía
[1] Attouch, H.“Convergence to Functions Convexes.” París (1977)
[2] Boy, Stephen, Vandenberghe, Lieven.“Convex Optimization”. Cambrige Univer-
sity Press(2004)
[3] Di Giorgi E.“Sulla Convergenza di alcune Successioni dÍntegrali dell Tipo Area”.
Italia (1975)
[4] Joly J. L.“Une Famille de Topologies et de Convergences sur. Ensemble des Fonc-
tionelles Convexes”. France (1970)
[5] Kuratowski C.“Topologie”. Warszawa-Japan (1958)
[6] Lions, J.L.; Stampacchia, G.“Variational Inequalities”. Italia (1967)
[7] Mosco U.“Aproximation of Solutions of some Variational Inequalities”. (1967)
[8] Rockafellar, R.T.“Conjugate Dualite And Optimization”. Philadelphia (1974)
[9] Rockafellar, R.T.“Convex Analysis ”. University Princeton N.J. (1969)
[10] Salinetti G. and Wets R.“On the Convergence of Sequences of Convex Sets in Fi-
nite Dimensions ”. (1979)
[11] Salinetti G. and Wets R.“Convergence of Sequences of Closed Sets”. (1978)
[12] Wets R.“Convex Analysis and applications”. Berlin (1977)
[13] Walkup W. D.“Continuity of some Convex-Cone valued Mappings”. (1967)
[14] Wets, R.“On inf-compact Mathematical Program”. Berlin(1974)
[15] Wysman R. A.“Convergence of Sequences of Convex Sets,Cones and Function”.
(1966)
83
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS
BIBLIOGRAFÍA
[16] Zolezzi T.“Characterizations of some Variational Perturbations of the Abstract
Linear-Cuadratic Problem”. Italia (1978)
84 Bach. Luis A. Blas Baltodano
Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT
Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/
BIBLIO
TECA DE C
IENCIAS FÍSIC
AS
Y MATEMÁTIC
AS