Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el proceso de extracción es tal que garantiza a cada uno de los elementos de la población la misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de selección muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:
Consideremos una población E formada por N elementos.
Si observamos un elemento particular,
,
en un muestreo
aleatorio sin reposición se da la siguiente circunstancia:
Si consideramos una muestra de
elementos,
donde el orden en la elección de
los mismos tiene importancia, la probabilidad de elección
de una muestra
cualquiera es
Si el orden no interviene, la probabilidad de que una muestra
sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas, tantas veces como permutaciones en el orden de sus elementos sea posible, es decir
Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces. Si el orden en la extracción de la muestra interviene, la probabilidad de una cualquiera de ellas, formada por n elementos es:
Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma de la anterior, repitiéndola tantas veces como manera de combinar sus elementos sea posible. Es decir,
es
El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, que como hemos mencionado se caracteriza por que
Sea X una v.a. definida sobre la población E, y f(x) su ley de probabilidad.
En una muestra aleatoria simple, cada observación tiene la
distribución de probabilidad de la población:
Además todos las observaciones
de la v.a. son independientes, es decir
Las relaciones(7.1)-(7.2) caracterizan
a las muestras aleatorias simples.
La selección de una muestra aleatoria puede realizarse con la
ayuda de #.#>
Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de Lotería Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dígito tiene la misma probabilidad de ser elegido, y su elección es independiente de las demás extracciones.
Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de números aleatorios de k=5 cifras (00000-99.999), una población de N=600individuos, y deseamos extraer una muestra de n=6 de ellos. En este caso ordenamos a toda la población (usando cualquier criterio) de modo que a cada uno de sus elementos le corresponda un número del 1 al 600. En segundo lugar nos dirigimos a la tabla de números aleatorios, y comenzando en cualquier punto extraemos un número t, y tomamos como primer elemento de la muestra al elemento de la población:
El proceso se repite tomando los siguientes números de la tabla de números aleatorios, hasta obtener la muestra de 10 individuos.
Las cantidades
pueden ser consideradas como observaciones de una v.a. U, que sigue una distribución uniforme en el intervalo [0,1]
El método de Montecarlo es una técnica para obtener muestras aleatorias simples de una v.a. X, de la que conocemos su ley de probabilidad (a partir de su función de distribución F). Con este método, el modo de elegir aleatoriamente un valor de X siguiendo usando su ley de probabilidad es:
A partir de ellas podemos obtener una muestra de
usando una tabla de la distribución normal:
| Números aleatorios | Muestra
|
Muestra
|
| ti |
|
xi = F-1(ui) |
| 76.293 | 0'76 | 0'71 |
| 31.776 | 0'32(=1-0'68) | -0'47 |
| 50.803 | 0'51 | 0'03 |
| 71.153 | 0'71 | 0'55 |
| 20.271 | 0'20(=1-0'80) | -0'84 |
| 33.717 | 0'34(=1-0'66) | -0'41 |
| 17.979 | 0'18(=1-0'82) | -0'92 |
| 52.125 | 0'52 | 0'05 |
| 41.330 | 0'41(=1-0'59) | -0'23 |
| 95.141 | 0'95 | 1'65 |
Obsérvese que como era de esperar, las observaciones xi tienden
a agruparse alrededor de la esperanza matemática de
.
Por otra parte, esto no implica que el valor medio de la muestra
sea necesariamente
.
Sin embargo como sabemos por el
teorema de Fisher
que
su dispersión con respecto al valor central es pequeña,
lo que implica que probablemente el valor medio
estará
muy próximo a 0, como se puede calcular:
Obsérvese que si el problema fuese el inverso,
donde únicamente conociésemos las observaciones
xi y que el mecanismo que generó esos datos hubiese
sido una distribución normal de parámetros desconocidos,
con
obtenida hubiésemos tenido una buena aproximación
del ``parámetro desconocido''
.
Sobre esta cuestión
volveremos más adelante al abordar el problema
de la estimación puntual de parámetros.