Evolvere robot stigmergici in Evorobot* cosa può fare una formica con pochissimi neuroni Versione...

Post on 01-May-2015

214 views 0 download

Transcript of Evolvere robot stigmergici in Evorobot* cosa può fare una formica con pochissimi neuroni Versione...

Evolvere robot stigmergici in Evorobot*cosa può fare una formica con pochissimi neuroni

Versione Storns 2.0

Obiettivo del tirocinio sperimentale

Evolvere un controller neurale per robot in grado di

esibire comportamenti collaborativi

paragonabili allo sfruttamento della traccia di feromone di molte specie di formiche.

Robotica evolutiva

Rete neurale E-Puck

Metodologia di ricerca che fa uso del calcolo evolutivo per sviluppare robot autonomi, cioè in grado di eseguire compiti in un ambiente senza il continuo ausilio umano.

Cos’è Evorobot*?

Software in grado di eseguire esperimenti di robotica evolutiva, sia in simulazione che in reale.

Evorobot* - schema di esecuzione

Evorobot* - Trial

Valutazione di una popolazione di individui:

• Inizializzazione ambiente (posizione casuale aree, muri…)

• Per ogni istante di simulazione (ciclo), ripeti per ogni robot:

• Ricostruzione stimoli sensoriali dall’ambiente e dagli altri robot.

• Propagazione degli stimoli nella rete neurale

• Attuazione delle reazioni (movimento, comunicazione, luci…)

• Aggiornamento della posizione del robot

• Aggiornamento del valore di fitness del robot

Evorobot* + Feromoni

• Arena divisa in celle di feromone

• Sensori aggiuntivi

• Attuatori aggiuntivi

Evorobot* + Feromoni

Alcuni dei parametri aggiunti:• Tasso di evaporazione del feromone

• Feromone territorio

• Sensori delta (da quale lato c’è più feromone?)

Evorobot* - Fitness

La funzione di fitness scelta dà un piccolo premio (+0.1) quando un robot trova il cibo, e un premio consistente (+1.0) quando riporta il cibo al nido.

Lavoro sperimentaleUn esperimento comporta:

• Scegliere parametri, ambiente, rete neurale, effettuare graduali modifiche al simulatore Evorobot*

• Esecuzione esperimento• Interpretazione dei risultati e dei comportamenti degli individui evoluti.

Durata media di un esperimento:

1000 generazioni ognuna da 100 individui (team)

ognuno valutato per 10 Trial (valutazioni)per ogni robot del team presente nell’ambiente

10.000 ticks di simulazione.

= circa 10^10 istanti di simulazione = 2 giorni elapsed time

Sono stati eseguiti e analizzati 284 esperimenti, Per un tempo macchina complessivo di 500 giorni circa.

Comprendere l’ambiente

Area Cibo

Area Nido

Robot

Robot

Robot

Area cibo

Area nido

Feromone rilasciato

Soluzioni Geometriche – 1 Capire quali comportamenti emergano da un ambiente finito e delimitato da muri, inun territorio inizialmente senza feromone.

Sono estremamente semplici e hanno successo con buona probabilità.

Soluzioni Geometriche – 2 Osservare le strategie emerse in un ambiente con onnipresenza di cibo.

Massimizza la sua fitness sfruttando una griglia di feromone per costruire un percorso orizzontale/verticale.

Comportamenti Interessanti - 1 Osservare come un robot o un gruppo di robot si comportano nascendo in un ambiente privo di feromone marcato.

Marca la zona già esplorata fino a trovare nido e cibo, poi smette di espandere la zona marcata e continua a navigare sui bordi.

Comportamenti Interessanti - 2Osservare i cambiamenti di strategia causati dalla nascita sul nido.

Simile alla precedente ma più efficiente, costruisce i percorsi all’interno della zona marcata.

Comportamenti Interessanti - 3Osservare eventuali comportamenti collaborativi in un ambiente potenzialmente illimitato, con feromone territorio.

Buona strategia per navigare tra le due zone, traiettoria molto “larga” per evitare eventuali scontri tra individui.

Comportamenti Interessanti - 4Creare un percorso più efficiente rispetto alla strategia collaborativa precedente.

Con un solo robot il pericolo di scontrarsi non sussiste, la strategia migliora sensibilmente.

Comportamenti Interessanti - 5Osservare quale spinta evolutiva è prodotta da un alto tasso di evaporazione.

Il feromone non viene più rilasciato, perché non è più informazione affidabile nel tempo. I robot sfruttano in maniera diretta ed efficiente il feromone territorio e l’informazione geometrica dell’area di rispetto.

Ulteriori comportamenti rilevanti - 1Osservare quale spinta evolutiva ha l’introduzione del concetto di energia, con un compito particolarmente difficile.

Il robot torna sul nido per ricaricarsi e poi espande la ricerca ricalcando i propri passi.

Ulteriori comportamenti rilevanti - 1Osservare quale spinta evolutiva ha l’introduzione del concetto di energia, con un compito particolarmente difficile.

Il robot torna sul nido per ricaricarsi e poi espande la ricerca.

Ulteriori comportamenti rilevanti - 2Capire quanto cambia la strategia di esplorazione e foraging quando sopravvivere diventa più difficile per tutti i membri del team.

L’ esplorazione, diventata pericolosa, viene intrapresa solo da alcuni robot.

Ulteriori comportamenti rilevanti - 3 Studiare i comportamenti in una situazione con feromone territorio, in un mondoIn cui ogni volta un ostacolo crea due strade diverse per il cibo.

Riescono a interpretare il feromone come delimitatore dell’ambiente.

Esempi negativiIl tasso di evaporazione può risultare inadeguato per le dimensioni dell’arena e il numero dei robot.

I robot spendono molto tempo a marcare l’area esplorata descrivendo spirali a causa del tasso di evaporazione alto rispetto alle dimensioni dell’arena.

Esempi negativiD’altra parte, a volte la struttura dell’ambiente può risultare troppo semplice.

I robot solitamente scelgono la strategia più semplice se la pressione evolutiva non è abbastanza forte.

Conclusioni

Valutazione dei comportamenti ottenuti

• Strategie esplorative

• Creazione di percorsi cibo-nido efficienti

• Strategie per individuare il percorso più breve in

presenza di ostacoli

Possibili sviluppi futuri

Aspetti sperimentali su cui lavorare:

• Evoluzione a stadi• Aumentare la complessità:

• Dimensioni dell’arena• Rete neurale• Ambiente (ostacoli, diversità geometrica)

• Parallelizzazione per ridurre i tempi di calcolo• Realizzare i feromoni negli esperimenti reali (ad

esempio con sensori RFID o con un depositatore di colore)