La disuguaglianza di Chebyshev è un teorema usato in statistica che fornisce una stima prudente (intervallo di confidenza) della probabilità che una variabile casuale con varianza finita si trovi a una certa distanza dalla sua speranza matematica o dalla sua media.
La sua espressione formale è la seguente:
X = Valore stimato
µ = Aspettative matematiche del valore stimato
Ϭ = Deviazione standard del valore atteso
k = Numero di deviazioni standard
Partendo da questa espressione generale e sviluppando la parte che rimane all’interno del valore assoluto avremmo quanto segue:
Se facciamo attenzione all’espressione precedente, possiamo vedere che la parte a sinistra non è più una intervallo di confidenza. Questo ci offre sia un valore più basso che un valore più alto per il valore stimato. Pertanto, la disuguaglianza di Chebyshev ci dice la minima probabilità che il parametro della popolazione rientri in un certo numero di deviazioni standard al di sopra o al di sotto della sua media. O, per dirla in un altro modo, ci dà la probabilità che il parametro della popolazione sia all’interno di quell’intervallo di confidenza.
La disuguaglianza di Chebyshev fornisce stime approssimative del valore stimato. Nonostante abbia un certo grado di imprecisione, è un teorema abbastanza utile in quanto può essere applicato a una vasta gamma di variabili casuali indipendentemente dalla loro distribuzione. L’unica restrizione per poter utilizzare questa disuguaglianza è che k deve essere maggiore di 1 (k>1).
Esempio di applicazione della disuguaglianza di Chebyshev
Supponiamo di essere un gestore di fondi comuni di investimento. Il portafoglio che gestiamo ha un rendimento medio dell’8,14% e una deviazione standard del 5,12%. Per scoprire, ad esempio, quale percentuale dei nostri rendimenti è pari ad almeno 3 deviazioni standard dalle nostre prestazioni medie, ci limiteremmo ad applicare la formula di cui sopra a partire dall’espressione 2.
k = 1,96
Sostituire il valore di k: 1-1/1,96^2 = 0,739 = 73,9%
Ciò significa che il 73,9% dei risultati si trova nell’intervallo di confidenza a 1,96 deviazioni standard dalla media.
Facciamo l’esempio precedente per valori diversi da k.
k = 2,46k
= 3
Sostituzione del valore di k: 1-1/2,46^2 = 0,835 = 83,5%
Sostituire il valore di k: 1-1/3^2 = 0,889 = 88,9%
Ci sono l’83,5% dei dati che sono entro 2,46 deviazioni standard dalla media e l’88,9% che sono entro 3 deviazioni standard dalla media.
Usando la disuguaglianza di Chebyshev, è facile dedurre che più alto è il valore di K (maggiore è lo scostamento del valore stimato dalla sua media) maggiore è la probabilità che la variabile casuale si trovi all’interno dell’intervallo delimitato.