Control Difuso-Adaptable Aplicado a un Carro Péndulo como Sistema de Cuarto Orden

download Control Difuso-Adaptable Aplicado a un Carro Péndulo como Sistema de Cuarto Orden

of 6

description

En este artículo se estudia el control difusoadaptable de un péndulo invertido, modelado como un sistemade cuarto orden. Se incluyen los fundamentos teóricos desistemas basados en lógica difusa, así como el modelo dinámicodel sistema al cual se le aplica el control. Para realizar elcontrol del p´endulo, se consideran los cuatro estados delsistema, que son posición y velocidad del péndulo, posición yvelocidad del carro. A partir de estos estados, se establecennuevas variables de estado que estén en función de la salidaactuada y la salida no actuada. Con los nuevos estados, seutiliza un controlador difuso adaptable, el cual mediantesistemas difusos se estiman funciones del sistema que sesuponen desconocidas. Se realizaron simulaciones para loscasos de estabilización y seguimiento.

Transcript of Control Difuso-Adaptable Aplicado a un Carro Péndulo como Sistema de Cuarto Orden

  • Control Difuso-Adaptable Aplicado a un Carro Pendulo como Sistema deCuarto Orden

    Francisco Ruvalcaba, Miguel Angel Llama, Vctor Santibanez

    Resumen En este artculo se estudia el control difusoadaptable de un pendulo invertido, modelado como un sistemade cuarto orden. Se incluyen los fundamentos teoricos desistemas basados en logica difusa, as como el modelo dinamicodel sistema al cual se le aplica el control. Para realizar elcontrol del pendulo, se consideran los cuatro estados delsistema, que son posicion y velocidad del pendulo, posicion yvelocidad del carro. A partir de estos estados, se establecennuevas variables de estado que esten en funcion de la salidaactuada y la salida no actuada. Con los nuevos estados, seutiliza un controlador difuso adaptable, el cual mediantesistemas difusos se estiman funciones del sistema que sesuponen desconocidas. Se realizaron simulaciones para loscasos de estabilizacion y seguimiento.

    Palabras clave: control difusoadaptable, linealizacionpor realimentacion, carro pendulo

    I. INTRODUCCIONEl problema del pendulo invertido es un tema de

    control que se ha estudiado ampliamente. Esto es debidoa que el sistema ofrece multiples retos para el diseno decontroladores, ya que el sistema es no lineal, inestable, defase no mnima y subactuado. Ademas, presenta efectosparasitos como la friccion, el juego entre engranes, latension de las bandas, y saturacion de la entrada. Todo estohace que el control del sistema pendulo invertido sea unaherramienta clasica en los laboratorios de control [1].

    Entre los trabajos previos desarrollados en el carro-pendulo del ITL figura el control LQR [2] y un controlDifuso Adaptable [3]. En el caso del control LQR seobservo que la respuesta era algo oscilatoria y que no sepoda hacer seguimiento del carro.

    En el caso del Control Difuso Adaptable propuestooriginalmente en [4], se trata de un control de linealizacionpor realimentacion, en el cual se utilizan sistemas difusospara estimar las funciones supuestas como desconocidas dela planta. Para mejorar la respuesta de los sistemas difusos,se agrega una ley de adaptacion la cual mejora la respuestacon el paso del tiempo. El problema de este controlador,es que en [4] solo se considera el control para los estadosdel pendulo, lo cual deja al carro sin regulacion alguna.En [3] se suma a la ley de control total un controlador PDrealimentando los estados del carro, logrando una respuesta

    Francisco Ruvalcaba, Miguel Angel Llama y Vctor Santibanez,pertenecen a la Division de Estudios de Posgrado e Investigacion,Instituto Tecnologico de la Laguna, Torreon, Coah., C.P. 27000,Mexico. [email protected], [email protected], [email protected].

    adecuada para los casos de estabilizacion y seguimiento.Otra manera de lograr el control del sistema es propuesta en[5], en donde se consideraron los cuatro estados del sistemacarro-pendulo dentro de una misma ley de control.

    En este artculo se estudia un control considerandolos cuatro estados del sistema carro-pendulo, como en [5],pero agregando estimadores de las funciones con sistemasdifuso-adaptables, como se propone en [4]. Este trabajoesta desarrollado actualmente en simulacion, por lo que esel primer paso para aplicarlo a la planta fsica.

    II. CONTROLADOR DIFUSO ADAPTABLE

    II-A. Control por linealizacion entrada-salidaEl controlador difuso adaptable indirecto usado en este

    trabajo consiste de un control por linealizacion entrada-salida, que se basa en encontrar una relacion directa entrela salida del sistema y y la entrada de control u, paralo cual existe una metodologa definida en [6], [7] y [8]entre otros, para un sistema expresado en la forma normal(x = x1, x = x2, . . . x(n1) = xn, x(n) = xn) con

    x(n) = f(x) + g(x)uy = x (1)

    donde x(n) significa la nesima derivada temporal de x. Yaque consideramos a nuestro sistema como de cuarto orden,la ecuacion anterior queda de la siguiente manera

    x(n) = F (x) + G(x)uy = x (2)

    donde F (x) = f1(x)L + f2(x) y G(x) = g1(x)L + g2(x),f1(x), f2(x), g1(x) y g2(x) son funciones del sistema (1), yL es una ganancia proporcional. La ley de control esta dadapor

    u =1

    G(x)

    [F (x) + kTe + y(n)m

    ], (3)

    donde se define el error como e = ym y = ym y1,siendo ym la salida deseada, y1 el nuevo estado, e =[e e . . . e(n1)

    ]T y k = [kn . . . k1]T . Al aplicar (3) en (2),la ecuacion en lazo cerrado del sistema idealmente se reducea

  • e(n) + k1e(n1) + . . . + kne = 0

    e(n) + kT e = 0

    Como las funciones del modelo de la planta f1(x), f2(x),g1(x) y g2(x) se suponen desconocidas, el controlador di-fuso adaptable las aproximara mediante las funciones f1(x),f2(x), g1(x) y g2(x), de manera que la ley de control porlinealizacion entrada-salida (3) se convierte en

    u =1

    G(x)

    [F (x) + kTe + y(n)m

    ](4)

    II-B. Diseno del controlador difusoLos sistemas difusos se pueden usar como aproximadores

    universales y aproximar uniformemente funciones no linealescon precision arbitraria. Para estimar las funciones descono-cidas de nuestra ley de control (4) se utilizan sistemas difusosque poseen fusificador impulsivo, inferencia max-prod ydefusificador centro promedio, los cuales tienen la siguienteestructura

    f1(x) =

    p1l1=1

    pnln=1 yl1lnf1(n

    i=1 Alii(xi)

    )p1

    l1=1 pnln=1

    (ni=1 Alii

    (xi)) (5)

    Para mejorar la aproximacion de las funciones f1(x), f2(x),g1(x) y g2(x) se dejan algunos parametros libres de cambiardurante la operacion en lnea y as la precision de apro-ximacion mejora con el paso del tiempo; estos parametroslibres sustituyen a las funciones de pertenencia de salida delsistema difuso, que nominalmente son fijas. Considerando laecuacion (5), se sustituye y l1lnf1 por los parametros libresf1 R

    ni=1 pi1 en f1(x) (donde pi es el numero de

    funciones de pertenencia de la entrada i), y as para lasfunciones f2(x), g1(x) y g2(x), entonces nuestras funcionesestimadas quedan como

    f1(x|f1) = Tf11(x) g1(x|g1) = Tg11(x)f2(x|f2) = Tf22(x) g2(x|g2) = Tg22(x)

    con el vector 1(x) de dimensionesn

    i=1 pi 1, 2(x) deni=1 qi 1, 1(x) de dimensiones

    ni=1 ri 1 y 2(x) den

    i=1 si 1, cuyos elementos tienen la siguiente estructura

    1,l1ln(x) =

    ni=1 Alii

    (xi)p1l1=1

    pnln=1(n

    i=1 Alii(xi)

    )

    1,l1ln(x) =

    ni=1 Clii

    (xi)r1l1=1

    rnln=1(n

    i=1 Clii(xi)

    )

    Obtenemos as las funciones estimadas

    F (x|F ) = f1 (x|f1)L + f2 (x|f2) (6)G (x|G) = g1 (x|g1)L + g2 (x|g2) (7)

    De esta manera, la ley de control difuso adaptable esta da-da finalmente por

    u =1

    G(x|G)[F (x|F ) + kTe + y(n)m

    ](8)

    II-C. Diseno de la ley de adaptacionLos parametros libres f1 , f2 , g1 y g2 se obtienen

    con una ley de adaptacion calculada a partir del metodoconocido como Aproximacion Sintetica de Lyapunov [4].

    Sean

    =

    0 1 0 00 0 1 0 0 0 0 1

    kn kn1 k1

    b =[

    0 0 1 ]TDefinimos el error de aproximacion mnimo como

    =[F (x|F ) F (x)

    ]+[G(x|G)G(x)

    ]u, (9)

    siendo f1(x|f1), f2(x|f2), g1(x|g1) y g2(x|g2) losmejores aproximadores de f1(x), f2(x), g1(x) y g2(x) res-pectivamente, con f1 ,

    f2 ,

    g1 y

    g2 como los parametros

    de adaptacion optimos, de manera que el sistema en lazocerrado puede escribirse como

    e = e + b{[

    1(f1 f1

    )+ 2

    (f2 f2

    )]+[1

    (g1 g1

    )+ 2

    (g2 g2

    )]u +

    } (10)La tarea de la ley de adaptacion es determinar un

    mecanismo de adaptacion tal que f1 f1 , f2 f2 ,g1 g1 y g2 g2 de forma que el error en lazocerrado e sea mnimo; esta ley de adaptacion se obtiene apartir del analisis de estabilidad de Lyapunov.

    Para este fin se propone la siguiente funcion candidata deLyapunov

    V (e,f ,g) =12eTPe

    +1

    21

    (f1 f1

    )T (f1 f1

    )

    +1

    22

    (f2 f2

    )T (f2 f2

    )

    +1

    23

    (g1 g1

    )T (g1 g1

    )

    +1

    24

    (g2 g2

    )T (g2 g2

    ) (11)la cual es una funcion definida positiva, con 1, 2, 3 y

    4 siendo constantes positivas, y P es una matriz simetricadefinida positiva que satisface la ecuacion de LyapunovTP + P = Q, siendo Q una matriz arbitraria n n

  • simetrica definida positiva. La derivada temporal de V a lolargo de la trayectoria del sistema en lazo cerrado de intereses

    V (e,f ,g) = 12eTQe + ePb

    +11

    (f1 f1

    )T [f1 + 1e

    TPb1(x)]

    +12

    (f2 f2

    )T [f2 + 2e

    TPb2(x)]

    +13

    (g1 g1

    )T [g1 + 3e

    TPb1(x)u]

    +14

    (g2 g2

    )T [g2 + 4e

    TPb2(x)u]

    (12)Para minimizar el error de seguimiento e, y los errores en

    los parametros de adaptacion (f1f1), (f2f2), (g1g1) y (g2 g2), y a la vez minimizar V , se seleccionanlas siguientes leyes de adaptacion

    f1 = 1eTPb1(x) g1 = 3eTPb1(x)uf2 = 2eTPb2(x) g2 = 4eTPb2(x)u (13)As, la derivada temporal de V se reduce a

    V (e,f1 ,f2 ,g1 ,g2) = 12eTQe + eTPb. Si lossistemas difusos se disenan de manera tal que el error deaproximacion mnimo sea tan pequeno para que se cumpla|eTPb| < 12eTQe, entonces V (e,f1 ,f2 ,g1 ,g2) < 0y el sistema es estable en el origen.

    III. DIN AMICA DEL CARRO-P ENDULOEl sistema carro-pendulo del ITL consta de un riel sobre

    el cual esta montado un carro con movimiento lineal.El carro tiene en uno de sus extremos un mecanismosubactuado, ya que posee mas grados de libertad queactuadores. El objetivo de control es llevar el pendulo a unaposicion vertical hacia arriba, que es el punto de equilibrioinestable.

    Para el modelado del sistema carro-pendulo se considera eldiagrama de cuerpo libre de la Fig. 1, en donde

    x = posicion del carro [m]

    x = velocidad del carro[

    m

    seg

    ]

    = posicion angular del pendulo [rad]

    = velocidad angular del pendulo[rad

    seg

    ]

    u = par de entrada [N ],

    mientras que los parametros I , l, m, y M estan dados en laTabla I y g es la fuerza de atraccion gravitacional.

    El modelo dinamico del sistema carro-pendulo se puedeobtener de las ecuaciones de movimiento de Lagrange, como

    Fig. 1. Diagrama de cuerpo libre del carro-pendulo

    TABLA IPARAMETROS DEL SISTEMA

    Descripcion Notacion ValorMasa del Carro M 2.024 kg

    Masa del pendulo m 0.338 kgLongitud al centro de masa del pendulo l 0.33 m

    Momento de inercia I 0.015 kg / m2

    se sugiere en [9] para el modelado de robots manipuladores.Por lo tanto, el modelo no lineal en terminos de la ecuacionde estados se puede escribir como:

    x1x2x3x4

    =

    x2[2x22 sinx1 cosx1 sinx1]

    x4[x22 sinx1 + sinx1 cosx1

    ]

    +

    0 cosx1

    0

    u (14)

    Para simplificar se han definido los parametros auxiliares = m + M , = ml2 + I , = ml, = mgl, y =1/( 2 cos2 x1

    ). Los estados del sistema son x1 = ,

    x2 = , x3 = x, x4 = x. Para reducir mas el modelo delsistema, lo reescribimos como sigue:

    x1 = x2 x2 = f1(x) + g1(x)ux3 = x4 x4 = f2(x) + g2(x)u (15)

    donde

    f1(x) = [2x22 sinx1 cosx1 sinx1]

    f2(x) = [x22 sinx1 + sinx1 cosx1

    ]g1(x) = cosx1g2(x) =

    IV. ESTRATEGIA DE CONTROLEn esta seccion se muestra el desarrollo del controlador

    difuso adaptable considerando el sistema como de cuarto

  • orden. Primeramente se desarrolla un controlador basadoen la linealizacion por realimentacion utilizando los cuatroestados del sistema carro-pendulo. Para lograr esto se definennuevos estados del sistema que incluyan simultaneamentelos terminos del pendulo y del carro. A partir de estosestados se define la ley de control. Para minimizar losefectos oscilatorios de esta ley, se agrega un termino deamortiguamiento. Como segundo punto, la ley de control delinealizacion por realimentacion es modificada, al cambiarlos terminos F y G por F y G, que son las funcionesestimadas mediante sistemas difuso-adaptables.

    En el simulador del carro-pendulo que se uso, el pendulocomienza de la posicion vertical hacia abajo = 180.Por lo tanto, se requiere un control adicional para acercarel pendulo a la posicion vertical invertida, conocido comocontrol de vaiven, el cual con pequenos movimientos delcarro hacia los lados, va llevando el pendulo hasta que estellegue a una posicion cercana a los 0. Al estar alrededor deesta posicion, el conmutador desactiva el control de vaiveny cambia al control de estabilizacion.

    IV-A. Control de Linealizacion por RealimentacionUna de las maneras para controlar sistemas subactuados

    es mediante la seleccion de una salida que sea funcion dela salida actuada y de la salida no actuada. Considerandonuestro sistema de cuarto orden (14), inspirados en [5]elegimos una salida y como

    y = x + L (16)

    Considerando lo anterior, escogemos nuevos estados como

    y1 = y= x + L= x3 + Lx1 (17)

    y2 = y

    = x + L= x4 + Lx2 (18)

    Con lo anterior, definimos ahora un nuevo modelo dinami-co:

    y1 = y= y2

    y2 = x4 + Lx2= [Lf1 + f2] + [Lg1 + g2]u

    Definimos

    F = Lf1 + f2 (19)G = Lg1 + g2 (20)

    Por lo tanto, el modelo queda como sigue

    y1 = y2y2 = F + Gu (21)

    A continuacion se propone la siguiente ley de controlde linealizacion por realimentacion que estabiliza el sistema(21):

    ufbl =1G

    (F + kTc

    [e1e2

    ]+ yr

    )(22)

    donde e1 = yr y, e2 = yr y y kTc =[

    k1 k2]. Al

    aplicar la ley de control (22), el sistema en lazo cerradose reduce a una ecuacion lineal, en la cual la ganancia k cdetermina la colocacion de sus polos, por lo que k c se escogede tal manera que las races de la ecuacion lineal s2 +k2s+k1 = 0 se encuentren en el semiplano izquierdo para que elsistema sea estable. Para ello se selecciono

    kc =[

    k1k2

    ]=[

    1500850

    ](23)

    Para mostrar que el controlador (22) estabiliza el sistemade cuarto orden (15), se debe conocer el valor para el cualG = 0 alrededor de = 0. Por lo que se sustituye g1 y g2en (20), y obtenemos G = , donde = L cos ,por lo que G = 0 cuando = 0, lo cual ocurre cuando = b = cos1 (/L). Este valor de se consideracomo el lmite entre dos regiones, la primera alrededor de = 0 y la otra alrededor de = 180. Si se aplica laecuacion (22) directamente al sistema de cuarto orden (15),la dinamica de ceros del sistema es crticamente estable conrespuesta oscilatoria, como se comprobo en [5]. Esto quieredecir que x y estaran oscilando indefinidamente, mientrasque y se mantendra en 0. Por lo tanto, se agrega un terminode amortiguamiento al controlador (22) para contrarrestarlas oscilaciones, el cual es un termino de realimentacion deestados, dado como

    ud = kTd [x1 x2 ex1 ex2]T (24)

    donde

    ex1 = yr xex2 = yr x

    Ahora tenemos una ley de control total dada por

    u = ufbl + ud (25)

    Aplicando el controlador (25) a la planta (15), y despues

  • linealizando el sistema, obtenemos

    x1x2x3x4

    =

    0 1 0 0+Lk1+L

    Lk2+L

    k1+L

    k2+L

    0 0 0 1L+Lk1

    LLk2L

    k1L

    k2L

    x

    +

    0

    20

    2

    ud (26)

    donde x =[

    x1 x2 x3 x4]. La ganancia de amor-

    tiguamiento kd se obtuvo mediante la tecnica de disenoRegulador Cuadratico Lineal (LQR). Para usar esta tecnica,se necesita el modelo linealizado que se obtuvo en (26) ysustituyendo los parametros de la Tabla I, el valor de laganancia kc (23), y la ganancia L = 0.67, obtenemos:

    A =

    0 1 0 04937 2771 7298 4135

    0 0 0 12303 1287 3390 1921

    (27)

    B =[

    0 1.01 0 0.47 ]T (28)Seleccionando la diagonal principal de Q =

    [100 100 200 200], R = 1 y usando la funcion lqr deMatlab, el valor de kd obtenido es

    kd =[ 65.64 30.22 107.02 65.84 ]T (29)

    Para mejorar la respuesta de la ley de control (22) seutilizaron sistemas difusos para estimar las funciones F (x)y G(x), por lo que la ley de control queda como

    uaflc =1

    G(x)

    [F (x) + kTe + y(n)m

    ](30)

    donde F (x) y G(x) estan dadas por (6) y (7). Partiendode una condicion inicial diferente de cero, es necesarioverificar que G(x) = 0; de ser el caso, tomamos el valoranterior.

    Por lo que ahora la ley de control total queda de lasiguiente manera

    u = uaflc + ud (31)Para los sistemas difusos que estiman f1 (x|f1),

    f2 (x|f2), g1 (x|g1) y g2 (x|g2) se utilizaron sistemas di-fusos con las funciones de pertenencia de entrada mostradasen la Fig. 2

    Cada uno de los cuatro sistemas difusos fue particionadoen cinco conjuntos difusos: A2i = NB (Negativo Grande),A1i = NS (Negativo Pequeno), A0i = ZE (Cero),A1i = PS (Positivo Pequeno), A2i = PB (Positivo Grande),con i = 1, 2 como el numero de entrada. Las particiones de

    Fig. 2. Funciones de pertenencia de entrada gaussianas

    los universos de discurso p , p, px y px fueron seleccionadascomo (23,15, 0, 15, 23), (115,75, 0, 75, 115),(191,5, 0, 5, 191) y (38,28, 0, 28, 38)repectivamente. Las desviaciones estandar , , xy x se seleccionaron como (1.14, 7.44, 7.44, 7.44, 1.14),(5.72, 37.34, 37.34, 37.34, 5.72),(1.91, 4.01, 4.01, 4.01, 1.91) y(11.46, 54.43, 54.43, 54.43, 11.46) respectivamente.El valor de las constantes de adaptacion es 1 = 2 = 50 y3 = 4 = 0.0000001. La aplicacion del controlador difusoadaptable al carro-pendulo se observa en la Fig. 3.

    Fig. 3. Controlador difuso adaptable

    V. RESULTADOS DE SIMULACI ON

    En la Fig. 4 se muestran los resultados para el caso deestabilizacion. En la Fig. 4.a) se muestra la posicion delpendulo, la cual despues de un poco de oscilacion, lograestabilizarse en cero grados. En la Fig. 4.b) se muestra laposicion del carro, la cual se puede observar que llega alorigen, aunque la respuesta se muestra bastante oscilatoriaantes de estabilizarse.

    En la Fig. 5 se muestra el resultado para el caso deseguimiento, en donde se uso como senal de referenciayr = 0.2 sin(t). En la Fig. 5.a) se aprecia que el penduloal llegar a la posicion invertida tiene un comportamientooscilatorio debido a que el carro trata de alcanzar la senalsinusoidal de referencia. Este efecto se mantiene hasta los16 segundos, en donde finalmente el pendulo se mantieneestable mientras que el carro sigue con un pequeno error lasenal de referencia, tal como se observa en la Fig. 5.b).

  • Fig. 4. Respuesta para el caso de estabilizacion

    Fig. 5. Respuesta para el caso de seguimiento

    VI. CONCLUSIONESEn este artculo se ha estudiado un metodo diferente

    para disenar el control del carro-pendulo. En la literaturade control automatico generalmente se aborda este sistemacomo de segundo orden, ignorando la dinamica del carro,por lo que se agrega un lazo de control externo que

    asegure su estabilidad. En este trabajo se estudia una leyde control que considera los cuatro estados del sistemacarro-pendulo. Se presentan simulaciones para el caso deestabilizacion tanto del carro como del pendulo, y para elcaso de estabilizacion del pendulo y seguimiento del carro.En ambos casos se alcanza el objetivo planteado.

    Las leyes de adaptacion (13) utilizadas en este trabajono garantizan el acotamiento de los parametros f1 , f2 , g1y g2 . Este problema se puede resolver agregando un controlsupervisorio a la ley de control (4), como es propuestoen [4]. El control supervisorio se activara solamentecuando los estados tiendan a dejar el rango estable, y sedesactivara cuando los estados regresen al rango estable.Este control supervisorio se estudio en [10], en dondese aplico a un sistema de Multiples Entradas, MultiplesSalidas. En este trabajo mencionado se pudo observar queel control supervisorio rara vez se activaba. Se planea afuturo incorporar esta estrategia de control a nuestro controldifuso adaptable.

    VII. AGRADECIMIENTOSEste trabajo fue realizado con apoyo de la DGEST y

    CONACYT.

    REFERENCIAS[1] Astrom, K. J.; Furuta, K. (Febrero 2000). Swinging up a pendulum by

    energy control. Automatica, Vol. 26, No. 2, pp. 287-295.[2] Garca, J. (2006). Implementacion y control de un sistema pendulo

    invertido. Tesis de maestra, Instituto Tecnologico de la Laguna,Mexico.

    [3] Centeno, H; Llama, M. A.; Santibanez, V. (2008). Control difusoadaptable: Aplicacion experimental a un carropendulo CONGRESOMEXICANO DE ROB OTICA, Mexico.

    [4] Wang, L. X. (1991). A course in fuzzy systems and control. PrenticeHall, USA.

    [5] El-Hawwary, M. I.; Elshafei, A. L.; Emara, H. M.; Abdel Fattah , H.A.; (November 2006). Adaptive Fuzzy Control of the Inverted Pen-dulum Problem. IEEE Transactions on Control Systems Technology.Vol. 14, No. 6, pp. 11351144.

    [6] Slotine J. J., Li W., Applied nonlinear control, Prentice Hall, USA,1991.

    [7] Khalil H., Nonlinear control systems, Prentice Hall, USA, 3a. edicion,2002.

    [8] Isidori. A., Nonlinear control systems, Springer, USA, 1995.[9] I. Fantoni, R. Lozano, Non-linear Control for underactuated Mechan-

    ical systems, Spriger-Verlang, 2002.[10] Tellaeche, J. L. (2006). Diseno de un controlador difuso adaptable

    para un robot manipulador de dos grados de libertad de transmisiondirecta. Tesis de maestra, Instituto Tecnologico de la Laguna, Mexico.