mercoledì, marzo 25, 2015

Qual è il sesso dei numeri? E il numero preferito? E il numero più comune?

Se vi chiedessi qual è il vostro numero preferito che rispondereste? E se vi chiedessi se i numeri hanno un sesso?
Nel mio caso le mie risposte hanno coinciso in ambo i casi con le risposte della maggioranza degli intervistati.
Mi direte: ma che senso ha la domanda se i numeri abbiano un sesso? Bene, allora restringiamo il campo. I dispari sono maschili o femminili? Restringiamo ancora. Il numero 1 è maschile o femminile? E il 2?
Se volete rispondere senza essere influenzati fatelo ora, nei commenti, prima di leggere la fine di questo post.
Le risposte che troverete alla fine provengono dal libro di Alex Bellos pubblicato in italiano con il titolo I numeri ci somigliano. Libro che non ho letto. Ho ascoltato però l'intervista a Bellos di Radio3 Scienza del 17 marzo. Oltre alla domanda sul sesso dei numeri e sul numero preferito, durante l'intervista si parla di una legge matematica che ha dell'incredibile. La legge di Benford. Se uno vi dicesse prendiamo una tabella contenente tutti i numeri di abitanti di tutti i comuni italiani. Avreste una tabella con più di ottomila numeri. Dal 36 (il numero di abitanti di Pedesina) al 2.872.086 (il numero di abitanti di Roma). Se qualcuno vi chiedesse: preso un numero a caso da quell'insieme, qual è la probabilità che quel numero cominci con la cifra 1? (Come, ad esempio, il numero di abitanti del mio paese che, nell'anno in cui sono nato, era poco sopra ai 1900)

A intuito penso che tutti considereremmo il problema come equivalente al lancio di un ipotetico dado a nove facce con una possibilità (quella di avere 1 come prima cifra) su nove cifre, quindi 1/9. Cioè circa l'11,11% di probabilità che un numero scelto a caso cominci con la cifra 1. Allo stesso modo, circa l'11,11% di probabilità che quel numero cominci con la cifra 2, e così via.
E invece guardate qua! Il 31% di quei numeri cominciano con la cifra 1, il 16,9% con la cifra 2, il 12,9% con la cifra 3, e così a scendere.

E la cosa interessante è che questa non è una caratteristica dei comuni italiani. Qualsiasi altro insieme di dati reali "sufficientemente grande" e "sufficientemente distribuito su diversi ordini di grandezza" dovrebbe seguire la distribuzione stabilita da questa legge.
Ad esempio, se considero le cifre dei conti in banca di tutti i conti correnti italiani dovrei ottenere quella distribuzione. Ma, sorprendentemente, anche se converto quei numeri in dollari, o in yen, o in sterline dovrei ottenere sempre quella distribuzione!

E allora qualcuno ha pensato: perché non usare questa legge per scovare le frodi? Con l'idea che, di solito, chi froda non conosce questa legge e tende a inserire numeri con cifre equamente distribuite. Ed effettivamente negli Stati Uniti la legge di Benford è stata accettata come prova nella contabilità forense.
Ma allora come non dire che quello dello scovatore di frodi non sia un lavoro da matematici?
E quindi anch'io mi sono messo al lavoro e ho creato una tabella con i dati relativi al mio conto corrente. Ho preso i dati degli ultimi mesi, poco più di cento numeri, e li ho riassunti nella tabella sottostante. Nella prima colonna c'è la cifra, nella seconda il numero di volte che occorre come prima cifra dei vari numeri presenti nel mio conto corrente, poi la percentuale sul totale e infine la percentuale secondo la legge di Benford.

Conto Legge
1 45 42,06%   30.1%
2 19 17,76%  17.6%
3 11 10,28%   12.5%
4 10 9,35%   9.7%
5 10 9,35%   7.9%
6 2 1,87%   6.7%
7 3 2,80%   5.8%
8 4 3,74%   5.1%
9 3 2,80%   4.6%

Come vedete, le cifre che si discostano di più dalla legge sono l'1, con una differenza del 12,5% in più, il 6, con poco meno del 5% in meno, e il 7, l'8 e il 9, che hanno tutti meno occorrenze rispetto ai valori previsti dalla legge.
Ora sono un po' incerto se giudicare questo andamento come accettabilmente aderente alle previsioni della legge di Benford o se avviare una battaglia legale per frode nei confronti della mia banca. Posso considerare un insieme di 107 numeri "sufficientemente grande"? E soprattutto, posso considerare l'insieme dei numeri del mio conto "sufficientemente distribuito su diversi ordini di grandezza? Direi di no. Di certo gli ordini di grandezza non sono così ampi come quelli dei comuni italiani. E allora per stavolta la banca si è salvata.

Ah, quasi dimenticavo i risultati del sondaggio. Allora, la stragrande maggioranza degli intervistati considera i dispari maschili e i pari femminili.
E il numero preferito è il numero 7.
Comunque, se volete conoscere dei tentativi d'interpretazione delle ragioni di tali risultati ascoltate l'intervista a Bellos di Radio3 Scienza del 17 marzo. Vi dico solo che «già nelle prime rappresentazioni numeriche, in Mesopotamia, la parola per il numero uno, ges, significava uomo, mentre min, due, voleva dire anche donna. Poi, nel VI secolo a.C., Pitagora rafforzò il concetto definendo "maschili" i numeri dispari e "femminili" i numeri pari».
Ebbene sì. Si torna sempre lì.

1 commento:

Centro Studi Applicati Benford ha detto...


posso testimoniare come amministratore della rete:
www.redflagfinder.it che si occupa di fare analisi basate sull'algoritmo di Benford che si tratta di uno strumento molto potente ed efficace che deve essere utilizzato con prudenza valutando i possibili la validità statistica degli scostamenti