Se vi dico Sigma ... cosa vi viene in mente?
- un nuovo modello di macchina elettrica.
- un teleobiettivo reflex professionale di fascia alta.
- la diciottesima lettera dell'alfabeto greco.
- un metodo statistico per capire meglio se le misurazioni effettuate si avvicinano alla media del campione (anche chiamato: scarto quadratico medio).
- oppure il vostro supermercato di fiducia che avete sottocasa.
Chi mi conosce sa probabilmente della mia "nerditudine" intrinseca a certi argomenti, indi per cui quando si parla di Sigma io penso subito all'opzione numero 4, ossia allo scarto quadratico medio. Anche perché 4 è il mio numero preferito.
Ah... spoiler-time! Se ti infastidiscono i numeri, “skippa e vai oltre”, non mi offendo. (semicit. Caparezza) 😉
Leggendo questo interessantissimo post di Eddy Hagen :
https://www.insights4print.ceo/2024/12/is-print-quality-control-russian-roulette/
mi sono detto:
"...hm ... tutto ciò è molto interessante, ma Mr. Hagen in questo articolo non fa cenno al Sigma insito nelle sue misurazioni ... quanto sono significative le misure effettuate? Perché non proviamo ad applicare anche in questo caso lo scarto quadratico medio?".
Quindi, visto che Mr. Hagen (lo chiamo così per rispetto) non è l'unico ad avere del tempo da perdere su certi argomenti… detto-fatto... ho preso le sue misurazioni ed ho calcolato alcune cose, del tipo.
Partendo dai suoi dati:
Ho fatto un grafico del Campione dei dati:
Da questo grafico possiamo già vedere come i ∆E₀₀ siano sufficienti (abbastanza? non so, vedremo poi) per fare un minimo di statistica, sono 78 per l'esattezza, e di come questi siano molto variegati fra loro (troppo variegati?). La linea gialla rappresenta la media del campione misurato (Mean).
Poi ho sistemato i campioni in ordine crescente e raggruppati per classi:
Da questo grafico possiamo vedere come i ∆E₀₀ siano abbastanza ben distribuiti fra inferiori a 2 e superiori a 2.
...perchè parli di 2∆E₀₀ ?
In questa fase ho considerato 2∆E₀₀ come spartiacque perché questo è quel valore che la leggenda metropolitana indica come valore “assoluto” sotto al quale tutto è perfetto e sopra il quale tutto diviene "inaccettabile". In realtà Mr. Hagen (ed anche le norme ISO) ci ha ben spiegato nei suoi post che, nel mondo reale, le cose non stanno proprio così.
...si ok Mauro... ma quanti valori misurati sono sotto il 2 e quanti sopra il 2?
Hey .. un attimo, ci sto arrivando... Innanzitutto dobbiamo considerare che i dati considerati sono solo 78, la loro media è 2, 15, la mediana è 2,11 e ... Sigma è 1,18. 😉
...Mauro che noia! Cosa ci importa di SIGMA!!!... quanti valori sono sopra il 2 quindi inaccettabili????
Calma ... calma... è proprio questo l’errore fatto da molti; spartire semplicemente i ∆E₀₀ fra "buoni e cattivi" (ossia fra sotto il 2 e sopra il 2) ci porterebbe quasi sicuramente fuori strada.
Infatti se procedessimo in questa analisi tranchant ci risulterebbe che il 50% del campione è inferiore a 2, mentre l'altro 50% è superiore a 2; ed, insomma, un rapporto 50 su 50 è un risultato un tantino scarsino per essere accettato in una produzione industriale, non vi pare? Chi ha stabilito 2 come target assoluto di qualità?
...si Mauro ... le misure fanno schifo! La stampa è inaccettabile!
No... non è proprio così se… se teniamo in considerazione SIGMA, ossia lo scarto quadratico medio!
Ora, non voglio qui tediarvi con della noiosissima quanto interessantissima teoria che, se volete, potete benissimo approfondire qui:
e qui:
Quindi, ora, dopo aver letto tonnellate di teoria, ed aver chiarito il concetto di Sigma e delle sue innumerevoli applicazioni (che possiamo vedere ben schematizzate in questo grafico):
(immagine tratta da: unovirgolasei.eu)
...bene, ora avendo chiarito che in una popolazione abbiamo 3 livelli di sigma dove
2σ ne rappresenta oltre la metà (68,27%),
4σ rappresenta la quasi totalità (95,45%) e
6σ rappresenta la totalità con un minimo trascurabile di scarto (99,73%); verifichiamo quanti di quei 78 valori misurati da Mr. Hagen rientrano in questi parametri. L'ho calcolato qui:
In effetti molti valori rientrano nel range
2σ, per la precisione il
60%.
Ed addirittura il 99% dei valori rientrano nel range 4σ.
Per la precisione, riportando le nostre considerazioni al tipo di misura effettuata, dobbiamo considerare come valori "inaccettabili" (fuori tolleranza) solo quelli in direzione +σ, in quanto i valori inferiori alla media, sono campioni con ∆E₀₀ basso, quindi perfettamente in tolleranza. Indi per cui, le percentuali di Sigma accettabili aumentano diventando le seguenti:
Considerato quanto sopra abbiamo:
La percentuale dei campioni inferiori a +1σ è dell' 81%. Mentre vediamo che pressochè tutti i valori (il 99%) rientrano nella soglia +2σ .
Certo, dobbiamo anche tenere in considerazione che il campione misurato è abbastanza esiguo e che la Curtosi della curva (pari a -1,10) ci indica una significativa variabilità dei campioni.
Curticosa? Ma insomma Mauro, cosa possiamo trarre da questa estenuante filippica?
Beh... in primo luogo possiamo dire che tutti i valori ∆E₀₀ misurati da Mr. Hagen rientrano in una tolleranza di produzione <+2σ. Quindi i dati tutto sommato non sono poi così malaccio.
Lo scopo della curva Sigma è appunto ipotizzare il totale di una popolazione partendo da un campione statistico X inferiore alla popolazione. Questo significa che: se, come in questo caso, il 99% dei campioni misurati rientra in un valore inferiore a +2σ, allora possiamo ipotizzare che TUTTA la popolazione avrà lo stesso comportamento.
Ricordiamoci che misure con ∆E₀₀ alto sono dovute prevalentemente alle difformità del supporto stampato ed alla variabilità del processo stesso di stampa.
Io ho la netta sensazione che all’aumentare del campione vedremo attenuarsi le isterie delle misurazioni dovute alle difformità del supporto stampato, questo per il semplice fatto che tali difformità dovrebbero essere in numero inferiore rispetto alle zone “buone” del prodotto stampato, quindi all’aumentare del campione avremo con più probabilità delle misure con ∆E₀₀ basso piuttosto che alto. Se le difformità di stampa non sono molto frequenti, all’aumentare dei campioni misurati, miglioreremo la Curtosi della curva. Ossia, la Curtosi ci fa capire quante difformità di stampa abbiamo nel campione preso in considerazione.
Questo mio post sposta in qualche modo le conclusioni tratte da Mr. Hagen sul controllo di qualità e sulla roulette russa? Non proprio, al massimo cerca di approfondirle ulteriormente, ma lascio a voi ogni ulteriore considerazione del caso.
Il punto cruciale di questa filippica é sottolineare le evidenti differenze che esistono fra un analisi statistica ragionata e la “media del pollo” di Trilussa.
Ed infine ricordiamoci sempre che un conto è giocare alla roulette russa con 1 proiettile carico su un tamburo da 6 colpi... tutt'altra cosa è rischiare la pelle con un proiettile carico su un tamburo da 100 colpi.
Buona misurazione.
P.S. Ogni suggerimento su come meglio interpretare questi valori è sempre ben accetto.