Estadística Descriptiva

¿Que es Estadística Descriptiva?

La estadístca descriptiva es una gran parte de la estadística que se dedica a analizar y representar los datos. Este análisis es muy básico. Aunque hay tendencia a generalizar a toda la población, las primeras conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor centrali.

Ejemplos:

Ejemplos de este tipo de análisis descriptivo pueden encontrarse en la prensa diaria, en la parte de información económico-social: series de tiempo, gráfica de barras, índices de precios, resultados de una encuesta y más elaborado, para más de una variable, en pirámide de edades, comparativas,calificaciones,resultados de deportes, etc.

Un ejemplo de estadística descriptiva con un esbozo de predicción o pronóstico en Wikipedia: ver Tabla de consumo, Resultados deportivos, etc., en general, cuantificados en valores absolutos (tal cual), en porcentajes (%) o en índices (con un periodo base inicial = 100).

Descripción de Datos

Los datos ayudan a los encargados de la toma de decisiones a hacer conjeturas bien fundamentadas acerca de las causas y, por lo tanto, sobre los efectos probables de ciertas características de algunas situaciones. Por lo demás, el conocimiento de las tendencias adquirido con la experiencia permite conocer los posibles resultados y planear con anticipación.

Los datos estadísticos se obtienen mediante un proceso que comprende la observación o medición de conceptos, como ingresos anuales de una comunidad, calificaciones de exámenes, resistencia a la rotura de las fibras de plástico, etc., a menudo son tan numerosos que carecen de utilidad a menos que sean condensados o reducidos a una forma más adecuada.

Algunas veces puede ser satisfactorio presentar los datos tal como se encuentran y obtener información directamente de ellos; otras veces solo habrá que agruparlos y presentarlos en forma gráfica o tabulada, aquí el uso de las tecnologías computacionales es mucha utilidad y rapidez.

Datos Agrupados

Cuando la muestra consta de más de 30 datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.

Los datos agrupados se pueden resumir gráficamente, o en tablas, y mediante el uso de medidas numéricas, como la media, la amplitud, la desviación estándar, y otras más. El nombre que reciben los datos ordenados en grupos o categorías es el de distribución de frecuencia.

Distribución de Frecuencia

Una forma de sintetizar los datos consiste en valerse de una tabla o distribución de frecuencia. Tomemos como ejemplo el inventario promedio en días de 20 tiendas de conveniencia.

En las siguientes tablas se han incluido datos idénticos referentes al inventario promedio y se han dispuesto primero como un arreglo en orden ascendente y luego como una distribución de frecuencia. Para obtener la tabla 2 se tuvo que dividir los datos en grupos de valores semejantes.

Después se registraron el número de puntos graficados (observaciones) de datos que caían dentro de cada grupo.

TABLA 1: Arreglo de datos del inventario promedio (en días) de 20 tiendas de artículos de conveniencia

TABLA 2: Distribución de frecuencia del inventario promedio (en días) de 20 tiendas de artículos de conveniencia (6 clases)

Nótese que perdimos un poco de información al construir la distribución de frecuencia, por ejemplo ya no sabemos que el valor 5.5 aparece cuatro veces o que el valor 5.1 no parece en absoluto. Pero por otra parte, adquirimos información concerniente al patrón de los inventarios promedio.

La distribución de frecuencia es una tabla que organiza los datos en clases; es decir, en grupos de valores que describen una característica de los datos. El inventario promedio es una característica de las 20 tiendas de conveniencia.

Una distribución de frecuencia muestra el número de observaciones provenientes del conjunto de datos que caen dentro de cada una de las clases. Si podemos determinar la frecuencia con que ocurren los valores en cada clase de un conjunto de datos, estaremos en condiciones de construir una distribución de frecuencia.

Características de las distribuciones de Frecuencia relativa

Hasta ahora se ha expresado la frecuencia con que ocurren los valores en cada clase como el número total de observaciones que caen en dicha clase. También se puede expresar la frecuencia de cada valor como una fracción o porcentaje del número total de observaciones. La frecuencia de un inventario promedio, digamos de 4.4 a 4.9, es 5 en la tabla 2 y de 0.25 en la tabla 3. Para obtener este último valor, dividimos la frecuencia de esta clase (5) entre el número total de observaciones en el conjunto de datos (20). La respuesta puede expresarse como una fracción (5/20 ), un decimal (0.25) o un porcentaje (25 %). Una distribución de frecuencia relativa presenta las frecuencias en fracciones o porcentajes.

TABLA 3: Distribución de frecuencia relativa del inventario promedio (en días) de 20 tiendas de artículos de conveniencia.

La suma de todas las frecuencias relativas es de 1.00 o 100 %. Esto sucede porque una distribución de frecuencia relativa parea cada clase con su fracción o porcentaje correspondiente de los datos totales. Por lo anterior, las clases en cualquier distribución de frecuencia simple o relativa son exhaustivas. Todos los datos encajan en una u otra categoría. Observe también que las clases son mutuamente excluyentes; es decir, ninguna observación cae dentro de más de una categoría.

Clases discretas

Los esquemas de clasificación pueden ser cualitativos o cuantitativos y discretos o continuos. Las clases discretas son entidades individuales que no pasan de una clase a la siguiente sin una ruptura. Son discretas las siguientes clases: el número de hijos de las familias, el número de camiones que poseen las compañías transportistas, las ocupaciones de los graduados universitarios.

Los datos continuos pueden pasar de una clase a la siguiente sin ruptura alguna. Contienen una medida numérica como el peso de unas latas de tomates, los kilogramos de presión sobre el concreto, o el promedio de calificaciones de los universitarios el último semestre.

Construcción de una distribución de Frecuencia

Ahora que hemos aprendido a dividir una muestra en clases, ya se esta en condiciones de tomar datos brutos y construir una distribución de frecuencia. A continuación tomaremos el siguiente ejemplo para el desarrollo de la distribución de frecuencia:

EJEMPLO 1: Un ingeniero de control de calidad del agua en Charlotte (North Carolina) es responsable del nivel de clorinación del agua. Dicho nivel ha de acercarse bastante al que exige el departamento de salubridad. Para vigilar el cloro sin necesidad de verificar cada galón de agua que sale de la planta, el ingeniero muestrea diariamente algunos galones, mide el contenido de cloro y extrae una conclusión sobre el nivel promedio de clorinación que tiene el agua tratada de ese día. La tabla anexa muestra las concentraciones de cloro de 30 galones seleccionados como muestra de un día. Estos niveles son los datos brutos de donde el ingeniero saca sus conclusiones respecto a la población total a la que se aplicó la clorinación ese día.

Ejercicio:
http://docs.google.com/fileview?id=0B6tGIb_E1LkpMTEwYWVlOTYtMjI4Ny00ZjhiLWExM2MtZTY5ODRiMzhjN2Ez&hl=en

miércoles, 30 de junio de 2010