jueves, 23 de enero de 2014

Datos agrupados 4


Medidas de tendencia central y dispersión


Las medidas de tendencia central y dispersión son:
  • Media aritmética
  • Desviación media
  • Varianza
  • Desviación estándar 
Para determinar la media aritmética, la cual es el punto medio de los datos,  primero agregaremos una columna en la que se multipliquen las marcas de clase por las frecuencias absolutas correspondientes.
Luego se suman todos los resultados y se dividen entre el total de datos.

Para estudiar un conjunto de datos no es suficiente conocer su tendencia central. Se necesita determinar la dispersión de los datos, es decir, que tanto se alejan de la media aritmética.

La desviación media, se refiere a la dispersión que existe en los datos. Ésta se determina calculando la diferencia absoluta entre cada marca de clase y la media por la frecuencia absoluta.

Para determinar la varianza calcularemos el cuadrado de la diferencia de cada marca de clase y la media por la frecuencia absoluta.

La desviación estándar será la raíz cuadrada de la varianza.



miércoles, 22 de enero de 2014

Datos agrupados 3





Frecuencias

Las marcas de clase representan, cada una de ellas, todos los datos contenidos en el intervalo correspondiente. Se calculan promediando los límites inferior y superior de los intervalos reales.
Para determinar las frecuencias absolutas debe contar cuantos datos están dentro de cada intervalo.
La frecuencia acumulada se determina de tal forma:
La primera frecuencia acumulada es igual a la primera frecuencia absoluta.
Después será la frecuencia acumulada anterior más frecuencia absoluta actual.
La frecuencia relativa se calcula dividendo la frecuencia absoluta entre el número de datos.
La primera frecuencia relativa acumulada es igual a la primera frecuencia relativa. La segunda es igual a la primera más la segunda frecuencia relativa.


martes, 21 de enero de 2014

Datos agrupados 2



Intervalos reales

En la presentación anterior vimos cómo obtener los intervalos aparentes, pero en esta ocasión nos enfocaremos a los intervalos reales.

En esta presentacion veremos cómo obtener los intervalos reales con una serie de operaciones aritméticas. Para ello necesitamos calcular la distancia entre un intervalo y otro, tomando cualquier par de intervalos.
La distancia entre estos intervalos es la diferencia entre el límite inferior del segundo intervalo y el límite superior del primero.

Para completar una tabla de distribución de frecuencias con datos agrupados se utilizan los intervalos reales, no los aparentes.

Los intervalos aparentes solo se utilizan para facilitar el conteo cuando este es realizado manualmente.



lunes, 20 de enero de 2014

Datos agrupados 1



Datos agrupados

Cuando el número de categorías que tienes es muy grande, por ejemplo, mayor a 25, ya no es factible utilizar el método de datos no agrupados, es decir, dato por dato. En estas situaciones recurriremos a la agrupación de datos, la cual consiste en resumir un conjunto de datos agrupándolos en intervalos. Para ello se realizaran una serie de operaciones aritméticas, así logrando que los intervalos representen de una manera altamente acertada los datos.

Es necesario encontrar el valor mínimo y el máximo, así como el rango que existe entre estos.
Luego se determinara el número de intervalos, para lo cual existen varias formas. Enseguida obtendremos el tamaño de los intervalos, dividendo el rango entre el número de éstos.
Es así como podremos construir los intervalos aparentes. Lo siguiente será determinar los límites inferior y superior.

Los intervalos aparentes nos servirán cuando hay que contar los datos manualmente, pero es indispensable que en la tabla se anoten los intervalos reales.

En la siguiente presentación se muestran los pasos de una manera detallada.