Es un concepto fundamental en
estadística que es muy útil para visualizar
una gran cantidad de datos y está formado por un conjunto
de barras que representa la frecuencia con la que se obtienen ciertos valores o
datos de algún proceso, así mismo el
histograma muestra la forma en que se distribuyen los datos y las variaciones y
discontinuidades producidas entre estos.
También muestran gráficamente la
capacidad de un proceso y, si se desea, la relación que guarda el proceso con
las especificaciones y las normas.
La construcción de
histogramas se puede hacer con datos discretos y con datos continuos, este
último requiere de un poco de más trabajo, pues requiere agrupar los datos.
Las variables discretas, son aquellas que
no admiten valores intermedios, por ejemplo: Número de reclamos, pueden ser 1,
2, 3, etc; pero no 3.4, generalmente son el resultado del conteo.
Las variables continuas, son aquellas que
son susceptibles a ser divididas indefinidamente, por ejemplo el peso de un
objeto puede ser 11 Kgs, 11.33 ó 11.3398 Kgs, dependiendo de la precisión del
instrumento de medida.
¿Cómo se realiza?
Variables Discretas:
1.
Identificar la variable que se quiere medir.
2.
Hacer la recolección de los datos observados.
3.
Hacer un ordenamiento (ascendente o descendente).
4. Tabular la frecuencia con la que aparece cada uno de
los valores, es decir colocar el número de veces que aparece cada valor.
5.
Graficar asignando a cada valor su respectiva
frecuencia.
Variables Continuas:
En el caso de las variables
continuas los datos se agrupan en intervalos y se determina la frecuencia para
cada intervalo:
1. Similar a los
pasos del 1 al 3 de las variables discretas.
2. Determinar el número de intervalos a usar, usualmente
es un valor cercano a la raíz cuadrada del número total de datos.
3. Determinar el ancho del intervalo, dividiendo el
rango de los datos entre el número de intervalos. El rango es la diferencia
entre el máximo y el mínimo valor de los datos.
4. Construir los intervalos a partir del mínimo valor,
al cual se le va sumando el valor del ancho del intervalo definido
anteriormente hasta completar el número de intervalos requeridos. No es necesario
que el límite superior del último intervalo coincida con el máximo valor de los
datos.
5. Luego se tabulan
los datos dentro de cada uno de los intervalos definidos, es decir se cuenta
cuantos datos caen en cada uno de los intervalos (frecuencia del intervalo). Si
un dato cae en el límite de un intervalo, se considera en el intervalo
siguiente.
6. Graficar el
diagrama asignando a cada intervalo una barra del tamaño de su respectiva
frecuencia.
No hay comentarios.:
Publicar un comentario