martes, 7 de junio de 2016

TEMA 9: Estadística inferencial: muestreo y estimación

En el tema de hoy vamos a proceder a explicar el tema de la inferencia estadística.

INFERENCIA ESTADÍSTICA

Al plantear un estudio en el ámbito sanitario para establecer una relación entre distintas variables, nuestro interés no suele estar exclusivamente en los pacientes concretos a los que hemos tenido acceso, sino más bien en todos los pacientes similares a estos, a esto es a lo que se le denomina Inferir.
  • Al conjunto de pacientes sobre los que queremos estudiar alguna cuestión le llamamos población de estudio.
  • Al conjunto de individuos concretos que participan en el estudio le denominamos muestra.
  • Al número de individuos de la muestra le denominamos tamaño muestral.
  • Al conjunto de procedimientos estadísticos que permiten pasar de lo particular, la muestra, a lo general, la población, le denominamos inferencia estadística.
  • Al conjunto de procedimientos que permiten elegir muestras de tal forma que éstas reflejen las características de la población le llamamos Técnicas de muestreo, esto se hace para evitar sesgos.
Como ya sabemos por anteriores entradas, siempre que trabajamos con una muestra debemos asumir el error.
  • Si la muestra se elige por un procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en ese caso se denomina muestreo probabilístico o aleatorio y el error asociado a esa muestra elegida al azar se llama error aleatorio.
  • En los muestreos no probabilísticos, no es posible evaluar el error. En los muestreos probabilísticos, el error aleatorio es inevitable pero es evaluable gracias a las leyes de la probabilidad.
Cuánto mayor sea el tamaño de la muestra, menos posibilidades tenemos de tener un error aleatorio por probabilidad.

ERROR ESTÁNDAR.

El error estándar lo definimos como la medida que trata de captar la variabilidad de los valores del estimador. Cuánto más pequeño es el error, más nos podemos fiar del valor de la muestra.

Para el cálculo del error estándar tenemos que tener en cuenta al estimador:


Error estándar para una media :

Error estándar para una proporción


De ambas fórmulas se deduce que, mientras mayor sea el tamaño de una muestra, menor será el error estándar. 

TEOREMA CENTRAL DEL LÍMITE

Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error estándar del estimador de que se trate. 
Como explicado de esta forma puede que no quede claro del todo, aquí os dejo un vídeo que me sirvió bastante a la hora de estudiar esta parte del temario.


INTERVALOS DE CONFIANZA

Los intervalos de confianza son un medio de conocer el parámetro en una población midiendo el error aleatorio. Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.
Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite. Para calcularlo emplearemos la siguiente fórmula: 

Los valores del parámetro ''z'' varían en función del nivel de confianza que nos den:
Para el nivel de confianza del 68% → z = 1
Para el nivel de confianza del 95% → z = 1,96
Para el nivel de confianza del 99% → z = 2,58

Al igual que en el error, también existe una fórmula para calcular el intervalo de confianza para la proporción:



TIPOS DE MUESTREO

Para hacer más resumida la entrada, vamos a ver una breve explicación de los tipos de muestreos estadísticos:
Distinguimos dos tipos de muestreo:
  1. Probabilístico → Todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra y conocida.
  2. No probabilístico → No existe probabilidad conocida, es una selección arbitraria.
Dentro de cada tipo, existen subdivisiones las cuales vamos a citar:

Dentro del muestreo probabilístico distinguimos:
  1. Aleatorio simple. P=1/n → por azar
  2. Aleatorio sistemático. 
  3. Estratificado.
  4. Conglomerados.
Dentro del muestreo no probabilístico distinguimos:
  1. Accidental.
  2. Por cuotas.
TAMAÑO DE LA MUESTRA

Para acabar con la entrada de esta noche, vamos a explicar el tamaño de la muestra, el cual depende de varios factores, entre los que destacamos:
  • Error estándar.
  • De la mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar.
  • De la variabilidad de la variable a estudiar.
  • El tamaño de la población de estudio.
Calculo del tamaño de una muestra para estimar la media de una población.

n= Z2*S2/e2

No hay comentarios:

Publicar un comentario