miércoles, 3 de marzo de 2010

ESTADISTICA DESCRIPTIVAS

Lo primero que se debe hacer con la información obtenida de una muestra, es reducirla a unas cuantas cifras que condensen o concentren la información más importante. Estas cifras se conocen como las estadísticas de la muestra. Obsérvese la diferencia entre Estadística, área del conocimiento que permite hacer inferencia sobre poblaciones, y la estadística de una muestra.

Ahora bien, los datos que se obtienen no pueden ser utilizados sin un previo análisis y sin reserva. Por lo general, cuando se toma una muestra se incurre en algún tipo de error estadístico, el cual tiene que ver con el tamaño de la muestra; intuitivamente es obvio que si se tiene un universo muy grande, a mayor información que se obtenga -mayor tamaño de la muestra- más cerca de la realidad van a estar las estadísticas de lamuestra, comparadas con las estadísticas del universo. Los técnicos reconocen entonces un margen de error, y se dice que un dato tiene un margen de error.

Tendencia central de la distribución

Con esta estadística se trata de examinar hacia qué valor se concentran los valores de la distribución. Las estadísticas más conocidas que miden la tendencia central son: La moda, la mediana y la media o valor esperado.

La moda: La moda se define como el valor más frecuente. Esto es, aquel valor que tiene mayor frecuencia. Debido a que los datos pueden agruparse de manera arbitraria —en el caso de la distribución continua— la moda no es la mejor medida de tendencia central. También puede suceder que haya dos “modas” iguales, en ese caso se dice que la distribución es bimodal y se presenta una ambigüedad.

La mediana: La mediana es aquel valor que divide la distribución en partes iguales, o sea que el número de observaciones por encima de la mediana es igual al número de observaciones por debajo de ella. Se conoce también como el valor medio o percentile 50.

La media o valor esperado
El valor esperado o media indica la tendencia central de los datos. Esto significa que es el valor alrededor del cual tienden a agruparse los datos de una distribución. En el caso de una variable aleatoria discreta, se calcula multiplicando cada valor posible por su probabilidad y sumando sus
resultados. En el caso de una variable aleatoria continua, se debe recurrir al concepto de integral que se estudia en el cálculo integral. Generalmente se expresa por medio de la letra griega μ (parámetro) para el universo y por la notación E( ) o X (estadística) para una muestra.

Medidas de la dispersión de la distribución
Las estadísticas que describen a una muestra o universo muestran qué tan dispersas están las observaciones o los elementos del universo. Las más comunes son la varianza, la desviación estándar (es la raíz cuadradade la varianza) y el rango. Intuitivamente se puede pensar en medir las diferencias entre cada observación y el valor central, por ejemplo, el valor esperado o media. Eso va a producir valores negativos y positivos y al sumarse entre sí deben cancelarse y producir el valor cero. Cuando se desea medir las variaciones entre dos o más variables, entre sí, entonces se habla de la covarianza.

Varianza
Una medida de la dispersión de unos datos es la varianza, es el promedio del cuadrado de las diferencias de cada dato con el promedio. Esta expresión se aplica para la distribución y la muestra; cuando se refiere a la población o universo, se utiliza la letra griega sigma s 2 (parámetro) y s2 (estadística), cuando se trata de la muestra. Sin embargo, cuando se trata de estimar la varianza de un universo o distribución a partir de la varianza de una muestra de tamaño n.

Desviación estándar
La desviación estándar (s) es la raíz cuadrada de la varianza. Se puede demostrar que si X1, X2, X3....Xn son variables aleatorias independientes con media m i y desviación estándar s i, entonces la suma de esas variables tendrán una distribución normal con media m i y desviación estándar nxs i2.
una manera de estimar la dispersión de unos datos es medir su rango. Esta es la diferencia entre el valor máximo y el valor mínimo. Con los datos de los ejemplos anteriores calcular el rango de los datos obtenidos. En Excel la fórmula para el valor máximo es =MAX(Datos) y para el valor mínimo es =MIN(Datos).

Covarianza
La covarianza indica en qué medida dos variables se mueven al unísono. Si se observa el comportamiento de la rentabilidad de las acciones en la Bolsa, se encontrará que algunas de ellas aumentan al mismo tiempo y otras disminuyen mientras las otras aumentan. El cálculo de la covarianza relaciona las diferencias entre las variables y sus medias, unas con otras.

No hay comentarios:

Publicar un comentario