Introduzione alle funzioni di manutenzione - SLIDE
-
Upload
claudio-cancelli -
Category
Education
-
view
656 -
download
0
description
Transcript of Introduzione alle funzioni di manutenzione - SLIDE
Introduzione Introduzione alle Funzioni di Manutenzionealle Funzioni di Manutenzione
Didattica della Strumentazione Digitale e Sistemi a Microprocessore
alle Funzioni di Manutenzionealle Funzioni di Manutenzione
Benvenuti Benvenuti ……..
Claudio Claudio CancelliCancelli
Scopo di tale Unità di LavoroIntroduzione alle
Funzioni diManutenzione
Prof. Claudio Cancelli
SENSIBILIZZARE GLI STUDENTI A COMPRENDERE COMPRENDERE SENSIBILIZZARE GLI STUDENTI A COMPRENDERE COMPRENDERE L’IMPORTANZA DELLEL’IMPORTANZA DELLE
FUNZIONI DI MANUTENZIONEFUNZIONI DI MANUTENZIONE
NEI SISTEMI DI CONTROLLO A MICROPROCESSORE O DI NEI SISTEMI DI CONTROLLO A MICROPROCESSORE O DI ELABORAZIONE DELLE INFORMAZIONI
DANDO ENFASI AI
GUASTI ED AL CONTRIBUTOGUASTI ED AL CONTRIBUTO
CHE L’ELETTRONICA E L’INFORMATICA FORNISCONO PER ADOTTARE I CRITERI NECESSARI ALLA CORRETTA
MANUTENIBILITA’ DEI SISTEMI COMPLESSIMANUTENIBILITA DEI SISTEMI COMPLESSI
… per quale motivo?Introduzione alle
Funzioni di Manutenzione
Prof. Claudio Cancelli
GARANTIRE IL FUNZIONAMENTODEL SISTEMAGARANTIRE IL FUNZIONAMENTODEL SISTEMA(LA DEPENDABILITY)(LA DEPENDABILITY)(LA DEPENDABILITY)(LA DEPENDABILITY)
PER GARANTIREPER GARANTIREPER GARANTIREPER GARANTIRE
LA SICUREZZA DELLE PERSONELA SICUREZZA DELLE PERSONELA SICUREZZA DELLE PERSONELA SICUREZZA DELLE PERSONEGLI INVESTIMENTIGLI INVESTIMENTI
COSTI DI PRODUZIONECOSTI DI PRODUZIONEINFORMAZIONI PREGIATEINFORMAZIONI PREGIATEINFORMAZIONI PREGIATEINFORMAZIONI PREGIATE
I contenutiIntroduzione alle
Funzioni di Manutenzione
Prof. Claudio Cancelli
Disponibilità
GuastoAffidabilità
ORIENTATI ALLA
MANUTENZIONE DEI SISTEMI A MICROPROCESSORE
ErroreDiagnosticaDiagnostica
Gli obiettiviIntroduzione alle
Funzioni di Manutenzione
Prof. Claudio Cancelli
Obiettivi di competenza finali attesiObiettivi di competenza finali attesi•• Saper comprendere l’HW ed il SW necessari ad Saper comprendere l’HW ed il SW necessari ad
interpretare le funzioni di diagnostica nei sistemi di interpretare le funzioni di diagnostica nei sistemi di interpretare le funzioni di diagnostica nei sistemi di interpretare le funzioni di diagnostica nei sistemi di elaborazione con controllo a microprocessoreelaborazione con controllo a microprocessore
•• Saper impostare i criteri di analisi e di progettazione Saper impostare i criteri di analisi e di progettazione per la diagnosi di unità hardware duplicateper la diagnosi di unità hardware duplicateper la diagnosi di unità hardware duplicateper la diagnosi di unità hardware duplicate
Obiettivi di Teoria FondamentaliObiettivi di Teoria Fondamentali•• Conoscere il concetto di servizio offerto da un sistemaConoscere il concetto di servizio offerto da un sistema
C d il i ifi di ffid bili à C d il i ifi di ffid bili à •• Conoscere e comprendere il significato di affidabilità, Conoscere e comprendere il significato di affidabilità, disponibilità, guasto ed erroredisponibilità, guasto ed errore
•• Comprendere le modalità di rilevazione degli errori ed Comprendere le modalità di rilevazione degli errori ed di trattamento del guastodi trattamento del guastodi trattamento del guastodi trattamento del guasto
•• Introdurre il concetto di manutenzioneIntrodurre il concetto di manutenzione
Le motivazioniComprendere il concetto di servizio offerto dal Sistema
Prof. Claudio Cancelli
Esempio 1) Cosa succede il PC se con il qualeEsempio 1) Cosa succede il PC se con il qualelavoriamo/giochiamo/comunichiamo tutti i giorni si guasta? E se a guastarsi èil chip di memoria del PC presente nell’ufficio dell’amministratore delegato diuna multinazionale, quali sarebbero le conseguenze?
Esempio 2) Pensiamo ad un guasto nei sistemi di comunicazione presentiin un sottomarino (fino a 50 anni senza fare rifornimento) o su un aereosupersonico (~ 100 CPU). Lo potremmo tollerare?
Le motivazioniComprendere il concetto di servizio offerto dal Sistema
Prof. Claudio Cancelli
Esempio 3) E cosa succede se una centrale telefonica urbana vaEsempio 3) E cosa succede se una centrale telefonica urbana vacompletamente fuori servizio?
Esempio 4) Pensiamo ad unguasto nei sistemi dicomunicazione presenti in unsottomarino (fino a 50 annisenza fare rifornimento) o susenza fare rifornimento) o suun aereo supersonico (~ 100CPU). Lo potremmo tollerare?
Esempio 5) Non è finita: è così grave se durante il relax con la fase didecompressione, l’applicazione domotica del tele-wc va fuori servizio?
Le motivazioniComprendere il concetto di servizio offerto dal Sistema
Prof. Claudio Cancelli
Esercizio) Ed ora come esercizio, in quali dei sistemi riportati in figura spendereste dei quattrini per garantire l’eccellente funzionalità dell’elettronica presente in ciascuno di essi? l eccellente funzionalità dell elettronica presente in ciascuno di essi?
G
H
M
L
I
Affidabilità e DisponibilitàDefinizioni e
concettiProf. Claudio Cancelli
L’Affidabilità (reliability) è la probabilità che un componente/apparato/sistema esegua correttamente una funzione
per un dato periodo di tempo e in condizioni di funzionamento specificate senza evidenziare alcun malfunzionamento
Esempio) Una rete dati è composta da 5 router; l’affidabilità R(t) di ciascun apparato è uguale a 0 99 in un anno Vuol dire che ciascun apparato funziona
specificate senza evidenziare alcun malfunzionamento
apparato è uguale a 0,99 in un anno. Vuol dire che ciascun apparato funziona correttamente per il 99% del tempo ed è inaffidabile (F(t) = 1- R(t)) per l’1% del suo tempo.
La Disponibilità è è una funzione definita come la probabilità che il sistema non mostri malfunzionamenti nell‘istante in cui gli è
richiesto di operarerichiesto di operare.
La disponibilità (Availability) si differenzia dall'affidabilità poiché quest'ultima è una misura di corretto funzionamento in un intervallo mentre quest ultima è una misura di corretto funzionamento in un intervallo, mentre la disponibilità è una misura di corretto funzionamento ad un dato istante temporale.
Introduzione alle Funzioni di Manutenzione
Affidabilità: Sistemi in serie ed in paralleloDefinizioni e
concettiProf. Claudio Cancelli
Sistemi in SerieSistemi in Serie Sistemi in ParalleloSistemi in Parallelo
L’affidabilità totale delsistema è uguale alprodotto delleaffidabilità dei singoli
L’affidabilità totale del sistema è uguale a:
RS(t) = 1 [(1 R1(t))] * affidabilità dei singolicomponenti:
RS(t) = R1(t) * R2(t) * R3(t) *
RS(t) = 1 - [(1-R1(t))] [(1-R2(t))] * ......
Per rendere il sistemanon funzionante si devonoR3(t) …..
e per n elementi uguali:
RS(t) = e –nλt
non funzionante si devonoguastare tutti icomponenti.
All’aumentare deiRS(t) = e
All’aumentare deicomponenti, calal’affidabilità del sistema
All aumentare deicomponenti, aumental’affidabilità del sistema;se il valore ottenuto nonsoddisfa si devono usarel affidabilità del sistema,
per cui, se il valoreottenuto non soddisfa,dobbiamo usarecomponenti di migliore
soddisfa, si devono usarecomponenti di migliorequalità oppure aumentareil numero dei componentiin parallelocomponenti di migliore
qualità o trovare unasoluzione che richiedameno componenti.
in parallelo.
Introduzione alle Funzioni di Manutenzione
GuastoDefinizioni e
concettiProf. Claudio Cancelli
Per guasto si intende l’interruzione Per guasto si intende l interruzione di una o più prestazioni funzionali
offerte da un dispositivo/apparato/sistema.
E dopo aver analizzato gli esempi precedenti, possiamo pervenire ad una considerazione: se il sistema è così fondamentale da dover garantire criteri economici di sicurezza e di affidabilità criteri economici, di sicurezza e di affidabilità
dobbiamo prevedere che la presenza di un guasto non incida sul funzionamento complessivo dell’apparato o del sistema.
Bisognerà quindi dare la giusta importanza al trattamento ed alla loro prevenzione.
Al concetto di guasto è normalmente associato il
SO D
I GU
AST
O
TASSO DI GUASTO λ
definito come il numero di guasti nell’unità di tempo.
La relazione che esiste tra tasso di guasto ed affidabilità
TEMPO
TASS
MORTALITA’INFANTILE
VITAUTILE USURA
La relaz one che es ste tra tasso d guasto ed aff dab l tà risulta:
R(t) = e -λt
Introduzione alle Funzioni di Manutenzione
Guasto: origine e patologieDefinizioni e
concettiProf. Claudio Cancelli
Le cause fenomenologiche che implicanoORIGINEORIGINE
Le cause fenomenologiche che implicano……Guasti fisici (phisical faults ), dovuti a fenomeni fisici avversi;…Guasti causati dall’uomo (human–made faults ), dovuti all’imperfezione umana;
I confini del sistema che implicano…Guasti interni (internal faults ) che sono parti dello stato del sistema che…Guasti interni (internal faults ), che sono parti dello stato del sistema che,
quando richiamate dall’attività di elaborazione, produrranno un errore;…Guasti esterni (external faults ), che derivano dall’interferenza dell’ambientefisico nel sistema (perturbazioni elettromagnetiche, radiazioni, temperatura,vibrazioni etc ) o dall’interazione con l’ambiente umano;vibrazioni, etc.) o dall interazione con l ambiente umano;
La fase di creazione rispetto alla vita del sistema che implica……Guasti di progetto (design faults ), che derivano da imperfezioni che siverificano durante lo sviluppo del sistema o per modifiche successive;
Guasti operativi (operational faults ) che si verificano durante l’uso del…Guasti operativi (operational faults ), che si verificano durante l uso delsistema.
PATOLOGIEPATOLOGIE– Un guasto è attivo (active ) quando produce un errore. Un guasto attivo è o unguasto interno che era in precedenza inattivo (dormant) e che è stato attivato dalprocesso di elaborazione, o un guasto esterno.
Introduzione alle Funzioni di Manutenzione
ErroreDefinizioni e
concettiProf. Claudio Cancelli
Gli errori nei sistemi di calcolo si verificano e possono derivare da specifiche ambigue o incomplete, da errori di progetto, da errori di
programmazione, da errori hardware, da errori di immissione dati o di interpretazione dei risultati
Nei confronti degli errori si usano le tecniche di:
Tecniche di rilevamento dell’errore — error detectionTecniche di rilevamento dell errore — error detectionUna delle tecniche HW abbastanza diffuse consiste nel generare un bit di parità, normalmente associato ad un byte, e rilevarlo a valle rilevando la correttezza o menorilevando la correttezza o meno.
Tecniche di correzione dell'errore — error correctionUna tecnica abbastanza utilizzata durante la trasmissione di Una tecnica abbastanza utilizzata durante la trasmissione di informazioni consiste nell’avere un meccanismo di rilevamento dell'errore che abbia capacità di diagnosi, cioè che sappia indicare il punto in cui si è verificato un errore ed intervenire predicendo il p prisultato.
Introduzione alle Funzioni di Manutenzione
Relazione tra guasti, errori e malfunzioniDefinizioni e
concettiProf. Claudio Cancelli
S t l i dSe un guasto lo possiamo prevedere
.. lo possiamo rimuovere e gestire
È la causa dell’erroreGUASTO (FAULT)GUASTO (FAULT)
ERRORE (ERROR)ERRORE (ERROR)
È la manifestazione del guasto nel sistema(ERROR)(ERROR) g
MALFUNZIONE (FAILURE)
MALFUNZIONE (FAILURE)
È la manifestazione dell’errore sul servizio
Introduzione alle Funzioni di Manutenzione
Gestione dei guastiRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
gLe problematiche che si pongono quando bisogna garantire il
funzionamento del sistema, secondo specifiche atte a garantire la corretta funzionalità, risultano le seguenti
– Prevenzione dai guasti (fault(fault prevention)): comepossono essere prevenute le occorrenze di guasti
TestingQualità
TestingQualità
– Tolleranza ai guasti (fault(fault tolerance)tolerance): come garantireun servizio che si mantenga conforme alle specifiche,nonostante i guasti
SovradimensionamentoDiagnostica
SovradimensionamentoDiagnostica
nonostante i guasti
– Eliminazione del guasto (fault(fault removal)removal): comeridurre l'occorrenza (numero, gravità) dei guasti Debugging HW e SWDebugging HW e SW( g ) g
– Predizione di guasti (fault(fault forecasting)forecasting): come stimareil numero, la frequenza di incidenza, presente e futura, el d i i
Valutazione dei guasti inevitabili
Valutazione dei guasti inevitabili
le conseguenze dei guastinev tab lnev tab l
Introduzione alle Funzioni di Manutenzione
Tolleranza ai guastiRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
g
LA MEMORIA IN CONFIGURAZIONE SIMPLEXLA MEMORIA IN CONFIGURAZIONE SIMPLEX
Esempio 6) Cosa capita se si CPU verifica un guasto in memoria,
oppure un guasto alla CPU? Oppure su uno dei bus di i i i
CPU
interconnessione tra memoria e CPU?
EMEMORIA
Dieci minuti di tempo per pensare…………………………………………………………………………………………
Dieci minuti di tempo per pensare…………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………...………
…………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………...………
Introduzione alle Funzioni di Manutenzione
Tolleranza ai guastiRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
g
LA MEMORIA IN CONFIGURAZIONE DUPLEXLA MEMORIA IN CONFIGURAZIONE DUPLEX
CPU
BUS ‘B’BUS ‘A’
MEMORIA ‘B’
PWR ‘B’
MEMORIA ‘A’
PWR ‘A’
MEMORIA BMEMORIA A
Le due copie di memoria vengono contemporaneamente scritte (operazione di scrittura) e lette (operazione di lettura)
Introduzione alle Funzioni di Manutenzione
Configurazione Duplex: dettaglioRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
FROM CPU
?WriteO i
ReadO iCPU ? Buffer
BUS ‘A’
BUS ‘B’
BufferOperation
Operation
A.B.BUS ‘A’ BUS ‘B’
D.B.C B
‘A’ ‘B’
PWR ‘A’ PWR ‘B’
C.B.
TO CPU
MEMORIA ‘A’ MEMORIA ‘B’MUX
BUS ‘B’
BUS ‘A’
Introduzione alle Funzioni di Manutenzione
Tolleranza ai guastiRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
g
CPU E MEMORIA IN CONFIGURAZIONE DUPLEXCPU E MEMORIA IN CONFIGURAZIONE DUPLEX
PWR ‘A’ CPU PWR ‘B’CPUPWR A
BUS ‘AL’
CPU‘A’
BUS ‘BL’
CPU‘B’
BUS ‘AR’
PWR ‘B’PWR ‘A’
BUS ‘BR’
MEMORIA ‘B’
MEMORIA ‘A’ ‘B’‘A’
Le due copie di memoria vengono contemporaneamente scritte (operazioneLe due copie di memoria vengono contemporaneamente scritte (operazione di scrittura) e lette (operazione di lettura) da una CPU (attiva), l’altra CPU è
in stand-by
Introduzione alle Funzioni di Manutenzione
Tolleranza ai guastiRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
g
CPU “A” ATTIVA E MEMORIA IN CPU “A” ATTIVA E MEMORIA IN
PWR ‘A’ CPU
CONFIGURAZIONE DUPLEXCONFIGURAZIONE DUPLEX
PWR ‘B’CPUPWR A
BUS ‘AL’
CPU‘A’
BUS ‘BL’
CPU‘B’
BUS ‘AR’
PWR ‘B’PWR ‘A’
BUS ‘BR’
MEMORIA ‘B’
MEMORIA ‘A’ ‘B’‘A’
Le due copie di memoria vengono contemporaneamente scritte (operazioneLe due copie di memoria vengono contemporaneamente scritte (operazione di scrittura) e lette (operazione di lettura) da una CPU (“A” attiva), l’altra
CPU (B) è in stand-by
Introduzione alle Funzioni di Manutenzione
Controllo degli erroriRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
CPU ‘A’CPU A μP
P.I.C.
INT
DPL= 1 D.B. = F0F43
33
DPH= 0PWR ‘A’
INTMA
MEMORIA ‘A’Il controllore di
ità llparità sulla memoria “A”
rileva un errore sul byte alto del
DB
DPH_ER Alarm Register
DB
Introduzione alle Funzioni di Manutenzione
Introduzione alla manutenzioneRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
Per manutenzione si intende l'insieme di azioni che permette di mantenere o di ristabilire un apparato/sistema/dispositivo in uno
stato tale da assicurare il servizio specificatostato tale da assicurare il servizio specificato.
Teniamo presente che la manutenzione ha normalmente impatto sulle aree:T iT i l d d ll Tecnica:Tecnica: per la conoscenza necessaria dei sistemi da controllare, ...;Economica:Economica: per le previsioni di investimenti, per i budget di spesa, ...;Organizzativa:Organizzativa: per la gestione lavoro per la definizione Organizzativa:Organizzativa: per la gestione lavoro, per la definizione
dell’organigramma, ….
Introduzione alle Funzioni di Manutenzione
Introduzione alla manutenzioneRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
Consiste nel determinare le cause degli errori, sia in termini di locazione che di naturadel guasto. I programmi di diagnostica utilizzano normalmente registri di I/O nonmappati in memoria.mappati in memoria.
Consiste nell’attivare il programma di diagnostica opportuno al fine di isolare il guasto,porre l’unità identificata guasta fuori servizio e procedere con l’eliminazione del guastoporre l unità identificata guasta fuori servizio e procedere con l eliminazione del guasto.Infine se il sistema non è più in grado di fornire il servizio precedentemente offerto,viene attivato il processo di riconfigurazione con lo scopo di ripristinare il servizio.
Consiste nello schedulare il programma di diagnostica per prevenire un disservizio.L’obiettivo è identico a quello della manutenzione correttiva. Lo stesso programma did ò h d l l ddiagnosi può essere schedulato per la manutenzione preventiva od attivatodall’operatore ed utilizzato per la manutenzione correttiva.
Gli interventi di manutenzione sono subordinati al rilievo del raggiungimento di unasoglia di probabilità del verificarsi di un guasto o malfunzionamento.
Introduzione alle Funzioni di Manutenzione
Diagnosi del guastoRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
Mask INTMA
Guasto
Task 1
Mask INT
Task 2
INTMA
Remove k INT
Task 3Interrupt routine
Remove mask INTMAmask INT INTMA
Istante in cui il guasto
USER PROGRAM
Istante in cui il guasto provoca l’errore
DPH-ER INTERRUPT HANDLER
Il S.O. consente il
i
riconoscimento dell’Interrupt
i + 1
Introduzione alle Funzioni di Manutenzione
Il Loop-Back registerRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
1st Operation
μPRead OperationWrite Operation Read Operation
Loop-Back Register #1
Write Operation
D B = 0000D B = 0000 D.B. = 0000
EXOR (0000 0000) 0000
D.B. = 0000
EXOR (0000, 0000) = 0000
Introduzione alle Funzioni di Manutenzione
Il Loop-Back registerRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
2nd Operation
μPRead OperationWrite Operation
Loop-Back Register #1
Read OperationWrite Operation
D B = FFFFD B = FFFF D.B. = FFFF
EXOR (FFFF FFFF) 0000
D.B. = FFFF
EXOR (FFFF, FFFF) = 0000
Introduzione alle Funzioni di Manutenzione
Il Loop-Back registerRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
2nd Operation
μPRead OperationWrite Operation Read Operation
Loop-Back Register #1
Write Operation
D B = F7FFD B = FFFF D.B. = F7FF
EXOR (FFFF F7FF) 0800
D.B. = FFFF
EXOR (FFFF, F7FF) = 0800
Bit 11 DB Faulty
Introduzione alle Funzioni di Manutenzione
RiconfigurazioneRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
g
CPU “A” ATTIVA RILEVA GUASTO IN MEMORIA “A”CPU “A” ATTIVA RILEVA GUASTO IN MEMORIA “A”
PWR ‘A’ CPU PWR ‘B’CPUPWR A
BUS ‘AL’
CPU‘A’
BUS ‘BL’
PWR BCPU‘B’
Out of ServiceOut of Service
BUS ‘AR’
PWR ‘B’PWR ‘A’
BUS ‘BR’
ServiceService
MEMORIA ‘B’
MEMORIA ‘A’ ‘B’‘A’
CPU “A” continua a restare attiva e lavora solo con la MEMORIA “A”
Introduzione alle Funzioni di Manutenzione
RiconfigurazioneRilevazione degli errori e
trattamento del guastoProf. Claudio Cancelli
g
CPU “A” ATTIVA RILEVA ERRORE IN CPU”A”CPU “A” ATTIVA RILEVA ERRORE IN CPU”A”
PWR ‘A’ CPU PWR ‘B’CPU
Out of ServiceOut of Service
BUS ‘AL’
PWR A CPU‘A’
BUS ‘BL’
PWR BCPU‘B’
BUS ‘AR’
PWR ‘B’PWR ‘A’
BUS ‘BR’
MEMORIA ‘B’
MEMORIA ‘A’
MEMORIA ‘A’ ‘B’‘A’A
Segue le switch della CPU: la “B” da stand-by diventa attiva e continua a lavorare con le memorie in configurazione duplex.
Prof. Claudio Cancelli
Grazie per l’attenzioneGrazie per l attenzione