--- --- title: 7 – RILEVAMENTO SOGLIA tags: Misure info: dal video 1-10 minuto 64 fino al video 06-10 minuto FINE description: Blocco slide 7 --- --- ## Rilevamento a soglia valore istantaneo ![](https://i.imgur.com/ZdOpk4O.png) Ci troviamo nella prima parte dello schema ovvero **controllo del limite e controllo del trend**. L'approccio classico (più semplice) che si ha nel limit checking è: >misurare direttamente l’uscita del componente/apparato/sistema per verificare quando questa esce dai limiti consentiti (ritenuti di normale funzionamento). Ad esempio, se il valore assoluto o la sua derivata (trend) supera una determinata soglia. In questa stessa ottica si può analizzare se l’uscita è “plausibile” (è coerente) con le altre misure disponibili e con la conoscenza disponibile del processo. Con questo approccio **utilizzo il valore istantaneo $y(t)$** come mostrato in figura ![](https://i.imgur.com/NWRE3tj.png) L'allarme si attiva solo quando si superano i due valori imposti come limiti. Il tempo che intercorre tra quando il guasto si verifica sul sistema e quando la variabile supera la soglia (che io impongo) è il **tempo di rilevamento del guasto**, ovvero il tempo che intercorre da quando ho il guasto e quando si attiva l'allarme. Idealmente, questo tempo deve essere nullo (c'è un guasto, lo individuo subito). I segnali che noi valutiamo possono essere affetti da rumore, quindi più noi andiamo ad abbassare la soglia, più c'è il rischio che la soglia viene superata anche quando non c'è il guasto e si generano i cosiddetti **FALSI ALLARMI**. La scelta ottima della soglia si fa facendo un trade off tra il tempo di individuazione del guasto e il **false allarm rate** (tasso di falso allarme). ## Rilevamento a soglia derivata Se io ho i due segnali in figura come faccio a capire quale attraversa la soglia per primo? ![](https://i.imgur.com/Hd0uAwn.png) Utilizzo la derivata del segnale (faccio un limit checking sulla derivata). Faccio una valutazione della derivata del segnale e vedo la velocità con cui la mia feature diagnostica va verso la soglia alta/bassa. ![](https://i.imgur.com/JRQFlu0.png) L'obiettivo è quello di diagnosticare **precocemente un guasto**, e lo faccio con una trend analysis, cioè vedo sia il livello di un'azione ma anche con che velocità evolve. Con questo approccio, però, ci possono essere discontinuità della mia $y(t)$. In particolare, nei segnali tanto rumorosi, ci sono tantissime discontinuità in quanto si salta da valori alti a valori bassi molto velocemente. **Quindi l'analisi della derivata è utile quando il segnale è poco rumoroso**. Come si può osservare nella figura si possono combinare i due approcci considerando, sull'asse delle ascisse la derivata, mentre sulla'asse delle ordinate il valore istantaneo della variabile. Si va a formare un'area all'interno della quale sia la derivata che il valore istantaneo si trovano all'interno della soglia. Nel disegno, il primo e il terzo quadrante hanno un andamento obliquo perché se il valore istantaneo è già alto, non ha senso avere una derivata alta e quindi diminuisco la grandezza dell'area di accettazione. ## Soglie adattative - Nelle tecniche di individuazione dei guasti basate sul modello, esso può essere determinato solo con una certa approssimazione (incertezze o variazioni parametriche, approssimazioni lineari) pertanto le misure o i residui calcolati possono essere diversi da zero anche in assenza di guasti. - Spesso queste deviazioni dallo zero sono funzione dell’ampiezza e/o della frequenza dell’ingresso e, pertanto, i residui possono contenere una parte statica dipendente dall’ingresso, e una parte dinamica dipendente dalla sua derivata. - Nel momento in cui il residuo è fortemente variabile con il segnale di ingresso si può far ricorso alle **soglie adattative**. **La soglia adattativa si adatta al segnale diagnostico (in genere al residuo).** ![](https://i.imgur.com/7GIqQey.png) Il segnale di colore nero è il segnale residuale (segnale diagnostico), in blu la soglia, e in rosso la soglia adattativa. La **fault region** in figura è la zona in cui c'è il guasto (il residuo supera la soglia adattativa). Solo con la soglia normale (in blu) non saremmo stati in grado di individuare il guasto. ### Esempio di soglia adattiva - Il segnale è fatto transitare all’interno di un filtro passa alto del primo ordine che ha lo scopo di aumentare il valore della soglia (pesare le componenti ad alta frequenza del segnale). - Il segnale così generato viene sommato al segnale di partenza, moltiplicato per una costante. - Il segnale risultante viene infine fatto transitare in un filtro passa basso del primo ordine che ha lo scopo di rendere più smussato l’andamento della soglia. - Le costanti tempo del filtro passa basso sono scelte in modo da non tagliare le frequenze caratteristiche del processo, mentre le costanti di tempo del filtro passa alto dipendono dalla incertezza del modello. ![](https://i.imgur.com/iLAuxeS.png) Si manda al filtro passa basso (perchè non voglio una soglia rumorosa) la somma di: 1) $C_1$ mi serve per tenermi fuori dal range di rumore. 2) Il segnale per un'altra costante $u(t)C_2$ mi adatta la soglia al segnale. 3) Un filtro passa alto che mi fa passare solo le frequenze più alte. Questo perchè se c'è un guasto che sale rapidamente lo fa passare. Mi adatta la soglia al segnale che ha sentito il guasto Ci sono 4 gradi di libertà: 2 sulle costanti e 2 sulle frequenze di filtraggio. La soglia adattativa permette di agire sul trade off tra il false allarm rate e il tempo di rilevamento. ### Rilevamento della soglia on-line e off-line - Il superamento di soglia di una variabile $y(k)$ può essere rilevato off-line (fuori linea) oppure on-line (in linea o in tempo reale). - Nel caso off-line l’individuazione del superamento di soglia deve essere effettuata all’interno di un numero predefinito di campioni, N: occorre verificare se e quando, in un certo istante non noto, si è verificato un cambiamento nella variabile $y(k)$ (serie storica). - **Il rilevamento fuori linea può essere portato a termine solo dopo che sono stati immagazzinati tutti i dati**. Dati loggati in un server e analizzati dopo un certo delay. - Nel caso on-line ad ogni istante di campionamento occorre valutare se si è verificato un cambiamento nella variabile $y(k)$. - Il rilevamento in linea (tipico della parte bordo macchina) richiede un numero limitato di misure rispetto a quello fuori linea e, pertanto, risulta mediamente più complicato da portare a termine (non dal punto di vista computazionale ma per la mancanza di informazioni). È più complicato perchè bisogna gestire finestre temporali ridotte (non hanno tutti i dati subito) e bisogna implementare algoritmi veloci. - Quando i processi da monitorare sono descritti tramite variabili aleatorie, allora è necessario fare riferimento alle loro proprietà statistiche: saranno esse ad essere controllate per capire se c’è o meno un superamento della soglia. - Il rilevamento di soglia nel caso di segnali stocastici è tipicamente fatto con le soglie binarie. ## Soglie binarie ![](https://i.imgur.com/4hS3q8Q.png) In caso di guasto, a livello didattico, consideriamo che c'è o una variazione del valor medio (valore con probabilità più alta) o della varianza. ### Soglie binarie: la distribuzione Gaussiana ![](https://i.imgur.com/md1WlBW.png) ### Soglie binarie: stima del valor medio e della varianza <span style="color: green">*ha solo mostrato valor medio e varianza di un processo ergodico*</span> ![](https://i.imgur.com/r5w002u.png) ### Soglie binarie: esempio hypotesis testing Uso il test di ipotesi quando ho un segnale che è rumoroso. Come la metto la soglia? Non riesco con un segnale rumoroso e quindi uso dei test statistici. ![](https://i.imgur.com/FtiOmI4.png) Da qui in poi vediamo come funziona in dettaglio l'**hypotesis testing**: - Un'**ipotesi statistica** è un'affermazione che specifica parzialmente o completamente la legge di distribuzione della probabilità di una variabile casuale. Mi dice che tipologia di probabilità è (gaussiana, distribuzione T, ecc.) e i parametri che identificano la distribuzione. - L'affermazione può riferirsi sia alla forma funzionale della legge di distribuzione sia ai parametri caratteristici o ai soli parametri caratteristici quando si assume nota la forma analitica della distribuzione stessa. - L'ipotesi “**da verificare**”, usualmente indicata con il simbolo $H_0$, è detta ipotesi nulla o ipotesi zero. - Ad esempio ... si ipotizza che l'altezza degli italiani adulti di sesso maschile si distribuisca in modo (approssimativamente) normale con media pari a 1,70 metri e scostamento quadratico medio pari a 0,28 metri. L'ipotesi statistica mi dice se una distribuzione di probabilità è gaussiana oppure no. - Se invece si dà per acquisito il fatto che l'altezza degli italiani adulti di sesso maschile si distribuisce in modo (approssimativamente) normale, l'ipotesi statistica potrà riguardare i soli parametri caratteristici media $\mu$ e varianza $\sigma^2$ (o lo scostamento quadratico medio $\sigma$). - Un **test di ipotesi (statistica)** è una regola attraverso la quale si decide se accettare o meno l'ipotesi formulata sulla base delle analisi dei campioni. Quindi vado a dire se l'ipotesi è vera oppure no in base all'evidenza campionaria. Non sono test assoluti ma il risultato varia in base ai dati campionari considerati. Non necessariamente l'esito negativo mi dice che l'ipotesi è falsa. Aumentando il numero dei campioni il risultato potrebbe cambiare. - Tali dati si riferiscono naturalmente alla variabile casuale sulla cui legge di distribuzione è stata formulata l'ipotesi. ### Esempio L'universo dei campioni o spazio dei campioni C è l'insieme di tutti i possibili risultati - Un test di ipotesi consiste nel suddividere l'insieme C in due sottoinsiemi disgiunti $C_0$ e $C_1=C-C_0$ in modo tale che si decide di rifiutare l'ipotesi $H_0$ se il punto campionario cade in $C_1$ e di accettare l'ipotesi se il punto campionario cade in $C_0$. ![](https://i.imgur.com/oNlsD3k.png) - Nell'accettare o rifiutare, sulla scorta dell'evidenza campionaria, una determinata ipotesi, si può agire correttamente (accettare un'ipotesi vera o rifiutare un'ipotesi falsa) oppure si possono commettere errori aventi diversa natura - rifiutare un'ipotesi quando essa è vera - accettare un'ipotesi quando essa è falsa - L’ipotesi $H_0$ è detta ipotesi nulla mentre la sua negazione viene detta ipotesi alternativa $H_1$ È possibile avere 4 esiti diversi dal test: L'ipotesi $H_0$ è l'ipotesi che non c'è guasto. **Nella tabella l'errore di tipo I è un falso allarme, mentre quello di tipo II non mi rivela il guasto.** ![](https://i.imgur.com/GYGjXUS.png) - La probabilità di commettere un errore di tipo I, la probabilità di rifiutare una ipotesi quando è vera, è indicata usualmente con $\alpha = P(X \in C_1/H_0)$ . - $\alpha$ è usualmente detta livello di significatività del test. - La probabilità di commettere un errore di tipo II, la probabilità di accettare una ipotesi quando è falsa, è indicata usualmente con $\beta = P(X \in C_0/H_1)$. - $X=(X_1, ... , X_n)$ punto campionario. Secondo la tabella sopra il test risulta negativo se $H_0$ è accettata, è positivo se viene rifiutato. - La probabilità di rifiutare un'ipotesi quando essa è falsa viene detta forza o potenza del test relativamente all'ipotesi alternativa $\gamma(H_1)=1-\beta(H_1)$ - **Gli errori del I (falso allarme) tipo sono quelli più gravi da commettere**: infatti l’ipotesi $H_0$ riflette la situazione precedente all’esecuzione del test, lascia le cose come stanno o ancora descrive le cose che sembrano o dovrebbero essere considerate “normali”, pertanto rifiutarla in favore di una ipotesi alternativa che non è vera, può comportare la messa in pratica di interventi che poi si possono rivelare inutili, dannosi o costosi. - **Gli errori del tipo II** sono meno gravi: infatti accettare un’ipotesi che è falsa, in genere “lascia le cose come stanno...” non modifica lo stato esistente. - Un test d'ipotesi permette di accettare o rifiutare un'ipotesi $H_0$, questo non vuol dire che l'ipotesi sia vera o falsa ma che: - in base al test e al livello di significatività scelto, l'ipotesi è statisticamente da rifiutare. - in base al test e al livello di significatività scelto, non c'è significatività statistica per rifiutare l'ipotesi **È meglio che un guasto venga rilevato un filo più lento piuttosto che generare tanti falsi allarmi.** ## Come si fa il test Ricordare come funziona la probabilità: ![](https://i.imgur.com/yKQPpKi.jpg) ### Z Test ![](https://i.imgur.com/kmBZ69V.png) - Si assume che i campioni (in numero N) abbiano distribuzione normale e varianza nota sia per l’ipotesi nulla, sia per quella alternativa. - Se il risultato del test statistico cade in un zona che è detta zona di accettazione, l’ipotesi $H_0$ verrà accettata, altrimenti rifiutata. - Se il livello $\alpha$ di significatività è del 5%, la zona di accettazione copre il 95% della parte centrale della distribuzione attorno alla media campionaria (zero standardizzato), lasciando quindi il 2,5% su entrambe le code della distribuzione. Se aumento il livello di significatività diventa più facile dire che la mia media campionaria non corrisponda alla media della popolazione. Viceversa, se restringo il valore sto dicendo che, di fatto, qualsiasi sia il valore medio del mio campione non potrò mai dire, con una probabilità di errore anche bassa, che la media della popolazione non sia comparabile con quella del campione. Se dico che non voglio mai un falso allarme non faccio generare mai un allarme e quindi non rifiutare mai l'ipotesi $H_0$. ![](https://i.imgur.com/e3HKlXc.png) Per accettare oppure no ci sono delle tabelle apposite (non riportate). Se non ho la varianza della popolazione l'approssimo con quella calcolata sui campioni. Così facendo passo al **T-test**. ### T Test ![](https://i.imgur.com/Aq8NizO.png) - Quando la varianza non è nota si opera una stima del tipo $\hat \sigma^2=\frac{1}{N-1}\sum_{i=1}^N(X_i-\bar X)^2$ - Quando il numero di campioni è ridotto (tipicamente minore di 30) la distribuzione Z non è adatta. - **Il t-test è quindi indicato se il numero di campioni è limitato e la varianza non è nota**. - Il t-test converge allo Z-test (la distribuzione t converge a quella normale) per un elevato numero di campioni. - Anche per questo test vanno individuati i valori critici che separano la zona di accettazione dell’ipotesi da quella di rifiuto: per fare ciò occorre utilizzare le tavole della distribuzione t. ![](https://i.imgur.com/bbofGLq.png) Con $N< 30$ si utilizza il t-Test, mentre per quelli maggiori Z test. A lezione ha spiegato come leggere la tabella del t test (De Meio). ![](https://i.imgur.com/Y9GTRCH.png) I gradi di libertà sono i numeri di elementi del campione meno il numero dei parametri noti della distribuzione (nel t test si suppone di conoscere la media). (i gradi di libertà sono nella colonna a sinistra della tabella dei valori) Per quanto riguarda il test a singola o doppia coda possiamo dire che, ad esempio, se abbiamo un guasto su un condotto la portata può solo diminuire: uso una coda singola. Se, invece, ho un guasto che mi fa variare la misura in entrambe le direzioni uso quello a due code (temperatura media di un componente che può salire o scendere). Il Z test è un lower bound rispetto al T test, se soddisfo lo z test soddisfo anche il T test. Se io ho fatto un test ed è risultato positivo (o negativo), quell'esito è legato al campione che abbiamo. ![](https://i.imgur.com/yQk2GgM.png) ![](https://i.imgur.com/ymazWoj.jpg) *l'ultima uguaglianza è una maggiornaza* **Più la variazione è piccola e piu campioni servono.** ### Chi-Test Quando vado a considerare la varianza utilizzo il Chi-test. ![](https://i.imgur.com/bZSkcCh.png) Il test è un rapporto tra la varianza del campione e la varianza della popolazione. - A differenza dello Z-test e del t-test, in questo caso si assume che la distribuzione sia di tipo “chi-square”, e ad essere testata è la varianza della popolazione invece del suo valor medio. - Anche in questo caso si tratta di una distribuzione con f = N-1 gradi di libertà (N è il numero delle variabili, si suppone di conoscere il valor medio). - Anche per questo test vanno individuati i valori critici che separano la zona di accettazione dell’ipotesi da quella di rifiuto: per fare ciò occorre utilizzare le tavole della distribuzione “chisquare”. ![](https://i.imgur.com/P9k9WSd.png) ![](https://i.imgur.com/YB4qh9d.png) ### Test empirici: Run Sum Test Utilizzati in ambienti di media automazione. Sono test euristici molto veloci Si chiama Run Sum perché nella formula abbiamo il valore istantaneo $y(k)$. ![](https://i.imgur.com/gWUUjB0.png) Lo score associato a ogni variabile sarà tanto più grande quanto più mi sto spostando dal valor medio, poi sommo tutti questi score e vedo la direzione generale dello scostamento ### Test empirici: Test di credibilità Sono test che utilizzano informazioni qualitative sul comportamento della macchina. Sono regole inferenziali che legano euristiche qualitative a condizioni operative che possono essere estrapolate dall'informazione sul processo. ![](https://i.imgur.com/csOEi4j.png) ## Metriche per la rilevazione dei guasti Riepiloghimo l'esito dei test. Prendo un campione, faccio un test e dico se quel test è positivo o negativo. Poi, la finestra temporale scorre, rifaccio il test per avere l'esito positivo o negativo e così via. Nel tempo ho tanti esiti dei test. ![](https://i.imgur.com/51wuW6I.jpg) Queste sono le metriche con le quali si determina la bontà di un sistema di rilevamento guasti a soglia. **Sensibilità (Probality of detection POD)** = $\frac{a}{a+c}$ definisce la misura dei guasti rilevati rispetto a tutti i casi di guasto. (Deve essere alta) **Probability of false alarm (POFA)**: $\frac{b}{b+d}$ misura dei casi in cui viene attivato l'allarme senza che ci sia un guasto. (Deve essere bassa) **Specificità:** $\frac{d}{b+d}$ è il duale della POFA, misura degli eventi correttamente ignorati in quanto non corrisondono a guasto. (Deve essere alta) **Accuratezza**: $\frac{a+d}{a+b+c+d}$ indica la misura con il quale distingue tra guasto e non guasto (Deve essere alta) ## Conclusioni ![](https://i.imgur.com/CIr0Z4Z.png) ## Domande di riepilogo - Come è possibile individuare un guasto utilizzando una soglia? - Soglie nel tempo per valori istantaneo, e soglie nel tempo per la derivata - Quali sono i vantaggi nel combinare il rilevamento a soglia per il valore istantaneo e quello per la derivata? Quali sono gli svantaggi? - Che cosa sono le soglie adattative? - Quali test statistici possono essere applicati per individuare i cambiamenti nel valor medio e nella varianza di una variabile stocastica y(k)? Fare un elenco delle tecniche viste, esplicitando di volta in volta quali parametri dei segnali devono essere conosciuti a priori. - Per il valor medio si utilizza il T test, e Chi test per la varianza. - Quali sono le differenze tra metodi di rilevamento in linea e fuori linea? Quali dei metodi sopra elencati sono applicabili per il rilevamento di guasti in linea? - Fuori linea utilizzano tutta l'informazione e fanno la valutazione a posteriori, mentre in linea operano su un range limitato di valori appena misurati. - Che cosa sono i test di credibilità? - Si utilizzano delle regole che vanno a confrontare un valore ritenuto in linea con i parametri di produzione e un valore che non è corretto. ....Esercizi...