MEDIDAS DE TENDENCIA CENTRAL - SOLO TIPS :Información variada y entretenimiento -->

martes, junio 07, 2011

MEDIDAS DE TENDENCIA CENTRAL

Bueno, hoy nos toca colaborar con algo de ayuda para los usuarios que llevan el curso de estadística en la universidad. Las medidas de ten... thumbnail 1 summary
Bueno, hoy nos toca colaborar con algo de ayuda para los usuarios que llevan el curso de estadística en la universidad.

Las medidas de tendencia central nos permiten identificar los valores más representativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendría cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por último la Moda nos indica el valor que más se repite o el más frecuente dentro de los datos.

1. MEDIA

Es la medida de posición central más utilizada, la más conocida y la más sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeños. La media se define como la suma de todos los valores observados, dividido por el número total de observaciones.

Forma de Calcular la Media de los datos

Ecuación 1-1

Cuando los valores representan una población la ecuación se define como:

Ecuacion de La Media para poblaciones

Ecuación 1- 2

Donde (m) representa la media, (N) representa el tamaño de la población y (Xi) representa cada uno de los valores de la población. Ya que en la mayoría de los casos se trabajan con muestras de la población todas las ecuaciones que se presenten a continuación serán representativas para las muestras. La media aritmética para una muestra esta determinada como

Ecuación de la Media para Muestras

Ecuación 1-3

Donde (X) representa la Media para la muestra, (n) el tamaño de la muestra y (Xi) representa cada uno de los valores observados. Esta fórmula únicamente es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicación de los diferentes valores por la frecuencia con que se encuentren dentro de la información; es decir,

Ecuación de la Media para valores Agrupados

Ecuación 1-4

Donde (Yi) representa el punto medio de cada observación, (ni) es la frecuencia o número de observaciones en cada clase y (n) es el tamaño de la muestra siendo igual a la suma de las frecuencias de cada clase.


Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretación se han generado tres rangos de edad los cuales se han establecido de 21 a 30 años, de 31 a 40 años y de 41 a 50 años. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organización de estos datos se representan en la tabla [1-1].

Ejemplo del calculo de la Media para datos Agrupados - Medidas de Tendencia Central

Figura 1-1

Si aplicamos la fórmula para valores agrupados obtendríamos que la media es igual a

Lo que nos indicaría que el promedio de edad de los encuestados es de 35 años. Si a estos mismos resultados le aplicamos la ecuación para datos desagrupados (Ecuación 1-3), tomando como referencia cada uno de los valores individuales, obtendríamos que la media es igual a

Lo que nos indicaría que el promedio de edad para los datos desagrupados es de 34 años aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los cálculos, principalmente al aumentar el número de datos. Para evitar estos inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados.

2. MEDIANA

Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos después que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posición de la mediana se utiliza la fórmula

Ecuación de la Posición de la Mediana

Ecuación 1-5

Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13), la posición de la mediana sería:

Lo que nos indica que el valor de la mediana corresponde a la tercera posición de la serie, que equivale al número (8). Si por el contrario contamos con un conjunto de datos que contiene un número par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendríamos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posición de la mediana sería,

Es decir, la posición tres y medio. Dado que es imposible destacar la posición tres y medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicaría que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor.

En conclusión la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan con un número impar de observaciones o datos, la mediana dará como resultado una de las posiciones de la serie ordenada; mientras que para las muestras con un número par de observaciones se debe promediar los valores de las dos posiciones centrales.

3. MODA

La medida modal nos indica el valor que más veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el número 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos más de dos valores, lo que se conoce como multimodal.

FUENTE: SPSS


ALGUNOS EJERCICIOS RESUELTOS

1)Hallar la media, mediana y moda de los sgtes. Datos no agrupados:

24 ; 7 ; 8 ; 30 ; 19 ; 17 ; 19 ; 18 ; 23 ; 11

SOLUCIÓN:

a) La media

24+7+8+30+19+17+18+23+11 = 157 = 15.7

....................10.........................10

b) La mediana

Ordenando los datos se tiene:

7, 8, 11, 17, 18, 19, 19, 23, 24, 30

Me ===> (N + 1) / 2 siendo N= número de observaciones

Me ===> (10 + 1) / 2 = 5.5

Significa que la mediana está entre el 5to y 6to valor, por lo tanto, se halla el promedio del quinto y sexto valor:

Me = (18 + 19) / 2 =18.5

Me= 18.5

c) Moda

Mo = 19

Porque se repite más veces (2 veces)

2) Dada la tabla hallar la media, mediana, y moda de los siguientes datos agrupados con intervalos:


[ a ; b >

fi

23 - 33

7

33 - 43

5

43 - 53

9

53 - 63

11

63 - 73

10

73 - 83

6

83 - 93

2


N= 50


SOLUCIÓN:

a)hallamos la media utilizando tabla de frecuencias con intervalos, se aplica la formula:

X = ∑ xifi

............N

La variable xi representa la marca de clase de cada intervalo y se calcula así:

xi = ai + bi

...........2


Intervalos

[ a ; b >

Frecuencia absoluta

fi

Marca de clase

xi

xifi

23 - 33

7

28

196

33 - 43

5

38

190

43 - 53

9

48

432

53 - 63

11

58

638

63 - 73

10

68

680

73 - 83

6

78

468

83 - 93

2

88

176


N= 50


2780

X = ∑ xifi = 2780 = 55.6

......... N........50


b) Mediana

En tabla de frecuencia con intervalos para hallar la mediana se utiliza la formula siguiente:

Me = ai + N/2 - Fi-1 x Ai

………………fi

Donde Me es la mediana

ai es el límite inferior del intervalo mediano

N es el número total de oibservaciones

Fi-1 es la frecuencia absoluta acumulada hasta el intervalo inmediato anterior al intervalo mediano.

fi es la frecuencia absoluta al intervalo mediano

Ai es la amplitud del intervalo mediano, es decir, diferencia b(límite superior intervalo) menos a (límite inferior intervalo).

Intervalos

[ a ; b >

Frecuencia absoluta

fi

Frecuencia absoluta acumulada

Fi

23 - 33

7

7

33 - 43

5

12

43 - 53

9

21 = Fi-1

53 - 63

11 = fi

32 = F4

63 - 73

10

42

73 - 83

6

48

83 - 93

2

50


N= 50


Primero se calcula N/ 2 = 50 / 2 = 25, se ubica este valor en la columna Fi de frecuencias acumuladas y se halla que está en F4 ya que ese valor 32 significa de 22 a 32 y 25 está incluido dentro de ese rango. Por lo tanto el intervalo F4 es el intervalo mediano.

Ahora se aplica la formula:

Me = ai + N/2 - Fi-1 x Ai (Ai= 63-53=10)

…………….fi

Me = 53 + 25 - 21 x 10 = 56.64

………………11



c)Moda

Para hallar la moda en tabla de frecuencias con intervalos se utiliza la siguiente formula:

Mo = ai + fi + 1 x Ai

..........(fi + 1 + fi -1)


Donde:

Mo es la moda

ai es el límite inferior del intervalo modal

fi+1 es la frecuencia inmediata superior a la del intervalo modal

fi-1 es la frecuencia inmediata inferior a la del intervalo modal

Ai es la amplitud del intervalo modal


Intervalos

[ a ; b>

Frecuencia absoluta

fi

3 - 33

7

33 - 43

5

43 - 53

9 = fi-1

53 - 63

11

63 - 73

10= fi+1

73 - 83

6

83 - 93

2


N= 50

El intervalo modal es el que corresponde a la mayor frecuencia absoluta es decir a f4=11. Eso quiere decir que la moda está en el intervalo que está entre 53 y 63.

Siendo ai= 53, Ai = 63-53=10; y localizando en la tabla fi+1 = 10 y fi-1= 9 ya se puede aplicar la formula:

Mo = 53 + 10 x 10 = 58.26

.............(10 + 9)

1 comentario

  1. -men's Romain Jerome watchWe're ready to throw some more events for everyone out there. After many months of trying to gain the "mapletip" handler for twitter, we have finally gotten it! Now, we will spread the love with you.

    ResponderEliminar

..