Docencia Autor

Prueba de Uniformidad de Kolmogorov-Smirnov

Fuente: http://bochica.udea.edu.co/~bcalderon/6_pruebasbondadajuste.html

Es importante el tamaño de la muestra, en el ejemplo se generarán los cien(100) primeros números aleatorios con un generador congruencial con estos valores

X0=178
A=791
B=107
N=1000

Tiene un periodo de 250.

X A B N R Aleatorio
178 791 107 1000 905 0,905
905       962 0,962
962       49 0,049
49       866 0,866
866       113 0,113
113       490 0,49
490       697 0,697
697       434 0,434
434       401 0,401
401       298 0,298
298       825 0,825
825       682 0,682
682       569 0,569
569       186 0,186
186       233 0,233

Paso 1: Como los números están en el rango 0 y 1 entonces se divide este rango en un número finito de subrangos, en el ejemplo se usarán 10 subrangos.

Rango Significa
de 0 a 0,1 0 <= n < 0,1
de 0,1 a 0,2 0,1 <= n < 0,2
de 0,2 a 0,3 0,2 <= n < 0,3
de 0,3 a 0,4 0,3 <= n < 0,4
de 0,4 a 0,5 0,4 <= n < 0,5
de 0,5 a 0,6 0,5 <= n < 0,6
de 0,6 a 0,7 0,6 <= n < 0,7
de 0,7 a 0,8 0,7 <= n < 0,8
de 0,8 a 0,9 0,8 <= n < 0,9
de 0,9 a 1,0 0,9 <= n < 1

Paso 2: Lance el generador de números aleatorios, en el ejemplo se hace unas mil veces. Luego cuente cuantos números caen en cada subrango.

Rango total de números pseudo-aleatorios en cada rango
de 0 a 0,1 12
de 0,1 a 0,2 14
de 0,2 a 0,3 9
de 0,3 a 0,4 6
de 0,4 a 0,5 14
de 0,5 a 0,6 11
de 0,6 a 0,7 9
de 0,7 a 0,8 10
de 0,8 a 0,9 8
de 0,9 a 1,0 7

Paso 3: Se deduce la frecuencia obtenida acumulada

Rango frecuencia obtenida FO frecuencia obtenida acumulada Probabilidad obtenida acumulada
de 0 a 0,1 12 12 0,12
de 0,1 a 0,2 14 26 0,26
de 0,2 a 0,3 9 35 0,35
de 0,3 a 0,4 6 41 0,41
de 0,4 a 0,5 14 55 0,55
de 0,5 a 0,6 11 66 0,66
de 0,6 a 0,7 9 75 0,75
de 0,7 a 0,8 10 85 0,85
de 0,8 a 0,9 8 93 0,93
de 0,9 a 1,0 7 100 1

Paso 3: Se compara con la probabilidad esperada (como son diez rangos y debe ser uniforme, lo ideal es que hubiesen el mismo número de elementos por rango)

Rango frecuencia esperada FE frecuencia esperada acumulada Probabilidad esperada acumulada
de 0 a 0,1 10 10 0,1
de 0,1 a 0,2 10 20 0,2
de 0,2 a 0,3 10 30 0,3
de 0,3 a 0,4 10 40 0,4
de 0,4 a 0,5 10 50 0,5
de 0,5 a 0,6 10 60 0,6
de 0,6 a 0,7 10 70 0,7
de 0,7 a 0,8 10 80 0,8
de 0,8 a 0,9 10 90 0,9
de 0,9 a 1,0 10 100 1

Paso 4: Se compara la probabilidad obtenida acumulada y la probabilidad esperada acumulada y se busca cual tuvo la mayor diferencia.

Rango probabilidad obtenida acumulada probabilidad esperada acumulada Diferencia
de 0 a 0,1 0,12 0,1 0,02
de 0,1 a 0,2 0,26 0,2 0,06
de 0,2 a 0,3 0,35 0,3 0,05
de 0,3 a 0,4 0,41 0,4 0,01
de 0,4 a 0,5 0,55 0,5 0,05
de 0,5 a 0,6 0,66 0,6 0,06
de 0,6 a 0,7 0,75 0,7 0,05
de 0,7 a 0,8 0,85 0,8 0,05
de 0,8 a 0,9 0,93 0,9 0,03
de 0,9 a 1,0 1 1 0
    Mayor diferencia 0,06

Paso 5: Nivel de confianza Alpha (entre mas alto, mas confiable). Alpha = 0,05

Paso 6: Recuerde que el tamaño de la muestra es 100

Paso 7: Busque en la tabla cruzando Alpha y el tamaño de la muestra

Como el tamaño de la muestra es 100 y alpha es 0,05 entonces el número buscado es 1.36 / RaizCuadrada(100) = 0.136

Paso 8: Comparando la mayor diferencia con el número obtenido en la tabla. Como 0.06 < 0.136 entonces se acepta la hipótesis que los datos tienen la distribución U(0,1), luego el generador es bueno en uniformidad.

Actividad 1: Realice todos los pasos anteriores en Excel. ¿Cómo puede automatizar la prueba?