RANDOM paris12   
Padri
Figli
 Totali
71172710106121010698
9712814171091251510128
222619151315121922191915216
212518192729161525212229267
27312628242420202472233286
273425372632281624252224320
332727142624171940262324300
303824282633292130302336348
213321202722241626271831286
33201214252271220221619222
11161618141213151710127161
1588694121186137107
 2562762152092382441981792602082152412739

Coppie sulla diagonale in giallo= 213

 

randomize



TROVATI paris12 Coppie sulla diagonale in giallo=234   
Padri
Figli
 Totali
1096710874111061098
142014715783131089128
192217152122131616192115216
262011292832171523232320267
242931231729221926281721286
282729292831202128212632320
253421162421252136172634300
304027302826221833293035348
332714212136252125172026286
202122162318161918181219222
14171512155181712101511161
1310848955196119107
 2562762152092382441981792602082152412739


Calcola il P value con la forza bruta.

La pagina si apre riportando i dati relativi al file paris12, che sono quelli utilizzati nella prima statistica di Discepolo, e di cui parla nel suo famoso libro on line. La prima tabella in alto, denominata RANDOM non riporta però i dati reali, ma i dati ottenuti mischiando casualmente le famiglie, ossia attribuendo a ciascun figlio un padre qualsiasi tra quelli presenti nella lista. Mentre la seconda tabella presente nella pagina riporta i dati reali estratti dal file paris12. Cliccando sulla scritta: "Effettua una nuova randomizzazione" le famiglie vengono mischiate nuovamente, e si ottiene una nuova tabella con i dati random. I dati su cui focalizziamo l'attenzione sono quelli presenti sulla diagonale centrale evidenziata in giallo, perché è su questa diagonale che troviamo il numero delle coppie formate da figli e da padri con l'ascendente dei primi uguale al segno solare dei secondi. Ogni volta che si clicca su "Effettua una nuova randomizzazione" viene generata una tabella casuale, e il programma conta il numero delle coppie presenti nella diagonale centrale. Questo numero viene ogni volta confrontato con il numero ottenuto sulla stessa diagonale nella tabella dei dati reali, e che nel caso del file paris12 sono 234. Se il numero trovato di volta in volta sulla diagonale della tabella random, è uguale o più alto a quello della diagonale della tabella vera, allora compare una scritta in rosso che ci avverte che il risultato random è uguale o più alto di quello reale. Nel caso del file paris12, se provate a cliccare ripetutamente sulla scritta "Effettua una nuova randomizzazione", vi accorgerete che la scritta in rosso, compare abbastanza frequentemente. Sono più numerose le volte in cui la scritta in rosso non appare, però potete verificare voi stessi che non si tratta di un evento raro, perché cliccando ripetutamente questa scritta prima o poi compare. Il fatto che le volte in cui la scritta in rosso non compare sono più numerose rispetto alle volte che non compare, significa che questi valori ottenuti con una procedura casuale sono di solito inferiori al valore della tabella reale. Per cui le coppie di figli e di padri con l'ascendente e il segno uguali, presenti nel file paris12 sono effettivamente più numerose del valore medio previsto. Però a questo punto diventa importante capire in che misura il valore trovato è superiore al valore atteso, per poter valutare se questa discrepanza tra i valori attesi e quelli reali è compatibile con il caso, o se si tratta di un evento talmente raro, da indurci a pensare, che questa discrepanza non sia dovuta ad un caso, ma che sia l'effetto di qualcos'altro. E' la frequenza con cui escono le scritte in rosso che ci permettono di calcolare la significatività statistica del risultato trovato. Come potete verificare personalmente, nel caso del file paris12, le scritte in rosso compaiono mediamente ogni 4 o 5 volte, e questo significa che c'è una probabilità di circa il 20% -25% di ottenere casualmente un valore più alto di quello realmente trovato nel file paris12. Si parla di significatività statistica solo quando la probabilità di trovare casualmente dei risultati maggiori, è inferiore al 5% o allo 1%. Per cui il risultato trovato non era un risultato eccezionalmente alto, ma un evento abbastanza frequente, che si verifica semplicemente per caso, una volta ogni 4 o 5 volte, e quindi non c'era proprio alcun motivo per gridare "miracolo" come invece è stato fatto. Il motivo per cui si era gridato "miracolo" è perché Discepolo aveva calcolato in modo errato il valore atteso per questo tipo di coppie, andando a prendere il primo valore trovato con una randomizzazione come valore atteso. Se il valore dello Zeta calcolato da Discepolo fosse stato corretto, allora in questa simulazione le scritte in rosso, dovrebbero comparire circa 1 volta ogni 250 tentativi. In questo caso il risultato sarebbe stato effettivamente interessante, ma si trattava di un risultato dovuto ad un errore di metodo, perché se facciamo 250 tentativi, di scritte in rosso ne compaiono circa 57, mica 1. Quello che a Discepolo è sembrato un evento eccezionale, era in realtà un evento banale, e l'unica cosa eccezionale era il valore ottenuto in modo random, che era eccezionalmente basso. Praticamente Discepolo invece di calcolare la significatività dei valori trovati, ha calcolato la significatività dei valori random. In un secondo momento, Discepolo deve aver intuito di aver commesso una sciocchezza, e ha verificato cosa accadeva, se invece di limitarsi ad effettuare le randomizzazioni una sola volta, come aveva fatto inizialmente, ne effettuava un centinaio. Il risultato di questo suo esperimento è stato che su 100 randomizzazioni in 90 casi il risultato random era inferiore al risultato trovato. Ma questo significa che nel 10% dei casi il risultato ottenuto con la procedura casuale era superiore a quello reale. In altre parole, Discepolo effettuando questo "esperimento", ha smentito il valore della significatività da lui calcolato in precedenza, perché se quel valore fosse stato giusto, su 100 tentativi non avrebbe dovuto trovare nemmeno un risultato in controtendenza ed invece ne ha trovati 10. Per cui, anche secondo i suoi calcoli, l'eccesso delle coppie trovate non era significativo, perché aveva una significatività statistica del 10% mentre il valore minimo per poter parlare di significatività statistica è del 5%.

AstriOnLine.it