miércoles, 1 de diciembre de 2010

DISTRIBUCION DE FREUENCIAS


Distribucion de frecuencias

Distribución de frecuencias es como se denomina en estadística a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto significa una de las cosas más importantes de la matemática, su estadística con la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.
Elementos fundamentales para elaborar una distribución de frecuencia:
1) RANGO.
Es una medida de dispersión que se obtiene como la diferencia entre el número mayor y el número menor de los datos.
R = N_max - N_min
Ejemplo.
Dados los números: 5, 10, 12, 8, 13, 9, 15
R= 15- 5
2) AMPLITUD TOTAL.
Simplemente se obtiene sumándole 1 al rango.
AT = (R+1)
3) LAS CLASES.
Están formadas por dos extremos. el menor se llama límite inferior el mayor se llama límite superior. hay distintos tipos de clases.
Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99)
4)EL NUMERO DE CLASES.
Se determina a través de la formula de Sturges, la cual es valida cuando el No de observaciones sea menor o igual a 500. Formula.
Nc= 1 + 3.33log ( N )
Donde:
Nc es el número de clases. N es la cantidad de muestras tomadas.
5) VALOR DEL INTERVALO O AMPLITUD
Se Obtiene por medio de la ecuación de dicta:
Vi = AT / Nc
Donde:
Vi es el valor de intervalo AT es la amplitud total o "el rango" Nc es el número de clase


TIPOS DE GRAFICAS





Graficas.

 

Una gráfica es una representación de datos, generalmente numéricos, mediante líneas, superficies o símbolos, para ver la relación que guardan entre sí. También puede ser un conjunto de puntos, que se plasman en coordenadas cartesianas, y sirven para analizar el comportamiento de un proceso, o un conjunto de elementos o signos que permiten la interpretación de un fenómeno. La representación gráfica permite establecer valores que no han sido obtenidos experimentalmente, es decir, mediante la interpolación (lectura entre puntos) y la extrapolación (valores fuera del intervalo experimental).
La estadística gráfica es una parte importante y diferenciada de una aplicación de técnicas gráficas, a la descripción e interpretación de datos e inferencias sobre éstos. Forma parte de los programas estadísticos usados con los ordenadores. Autores como Edward R. Tufte han desarrollado nuevas soluciones de análisis gráficos.
Existen diferentes tipos de gráficas, que se pueden clasificar en:
  • Numéricas: con imágenes visuales que sirven para representar el comportamiento o la distribución de los datos cuantitativos de una población.
  • Lineales: se representan los valores en dos ejes cartesianos ortogonales entre sí. Las gráficas lineales se recomiendan para representar series en el tiempo, y es donde se muestran valores máximos y mínimos; también se utilizan para varias muestras en un diagrama.
  • De barras: se usan cuando se pretende resaltar la representación de porcentajes de datos que componen un total. Una gráfica de barras contiene barras verticales que representan valores numéricos, generalmente usando una hoja de cálculo. Las gráficas de barras son una manera de representar frecuencias; las frecuencias están asociadas con categorías. Una gráfica de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo (alto si es horizontal) igual a la frecuencia. La gráfica de barras sirve para comparar y tener una representación gráfica de la diferencia de frecuencias o de intensidad de la característica numérica de interés.

  • Histogramas: Se emplea para ilustrar muestras agrupadas en intervalos. Está formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con los limites de los intervalos y el centro de cada intervalo es la marca de clase que representamos en el eje de las abscisas. La altura de cada rectángulo es proporcional a la frecuencia del intervalo respectivo.
  • Circulares: gráficas que nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar.

  • Pictogramas: Un pictograma o gráfica picotirca es un diagrama de barras que se utiliza para representar datos solo que en lugar de barras se representa con un pictograma o dibujo de lo que estás representando.

    Por ejemplo si estás graficando dinero en vez de poner una barra para una freceuencia pones pila de monedas que represente la cantidad que vas a graficar. si se trata de graficar ventas de computadoras en lugar de una barra las representas con 4 o 6 imagenes de computadoras.

    Este tipo de gráfica se utiliza para graficar una variable cualitativa al igual que la de sectores circular, barras simple o Diagrama de Paretto.



 

 
 
 

CONCEPTOS GENERALES


La estadística fue fundada por el londinense John Graunt, “un mercader de mercería”, en un pequeño libro “Natural and political Observations made upon the Bells of Mortality”. Este libro fue el primer intento para interpretar fenómenos biológicos de masa y de la conducta social: a partir de datos numéricos escribir las cifras brutas de nacimientos y defunciones en Londres, de 1604 a 1661. El opúrculo de Graunt apareció en 1662. Treinta años más tarde, la Royal Society publicó en su “Philosophical Transactions” un artículo sobre tasas de mortalidad escrito por el eminente astrónomo Edmund Halley. Ambas publicaciones constituyen la base de todo trabajo posterior sobre esperanza de vida, indispensable para la solvencia de las compañías de seguros de vida.
John Graunt nació en 1620 en Berchin Lane, Londres, bajo el signo de las siete estrellas, donde su padre tenía una tienda y el hogar. Aprendió pronto el oficio de vendedor de mercería y prosperó en el negocio. El éxito le dio la posibilidad de dedicarse a ocupaciones más amplias que las de la venta de artículos de mercería. Aubrey lo describe como “una persona muy ingeniosa y estudiosa... se levantaba muy temprano para sus estudios antes de abrir la tienda”. Se hizo amigo de Sir William Petty, más tarde autor de un libro sobre la nueva ciencia de la aritmética política, y probablemente discutió con él las ideas expresadas en sus “Obervations”.







CONCEPTOS FUNDAMENTALES


Estadística descriptiva. Es un conjunto de procedimientos que sirven, para organizar,
describir y sintetizar datos, sin que las conclusiones que se extraigan de éstos rebasen su ámbito
específico.
Por ejemplo, si al recolectar las calificaciones de un grupo de estudiantes en una asignatura determinada las resumimos diciendo que la calificación promedio es7.5, estamos describiendo y sintetizando una característica de los datos; es decir, del total de calificaciones. La validez de esta descripción numérica atañe únicamente al grupo de estudiantes del cual provienen los datos y no encierra incertidumbre.
Estadística inferencial. Es un conjunto de procedimientos que se emplean para hacer
inferencias y generalizaciones respecto a una totalidad, partiendo del estudio de un número
limitado de casos tomados de esta última.
El medio empleado para el estudio estadístico es la enumeración o recuento. Enumerar es captar las características de los elementos sometidos a estudio y anotarlos o medirlos bajo las condiciones que se presentan. La estadística es, básicamente, un método de inducción basado en los grandes números y sus propiedades,(La Ley de los grandes Números, conocida también como Teorema de Bernoulli) con lo cual se eliminan los errores propios de la observación y se aumenta la validez de los resultados obtenidos.
Población.
También llamadauniver so, es todo conjunto de personas, cosas u objetos con ciertas
características comunes.
Por ejemplo: los estudiantes de preparatoria con promedio mínimo de 8 en el Estado de Michoacán en 2002; las fábricas de automóviles existentes en la República Mexicana hasta el 31 de diciembre de 2005; el conjunto de los números primos; el conjunto de las formas imaginables en que se puede repartir la riqueza nacional, etc. De estos ejemplos debe quedar claro que en estadística el concepto de población no se refiere necesariamente a personas ni objetos materiales. Tampoco tiene que estar integrada por un gran número de elementos. Si decimos “los números naturales < 10”, estaremos definiendo con precisión un universo que consta de muy pocos elementos.
Cuando se trata de elementos concretos, por ejemplo, estudiantes, fábricas de automóviles, ejidos, viviendas, etc., su definición rigurosa se alcanza, por regla general, añadiendo a la característica la ubicación o lugar y el periodo, es decir, el espacio de tiempo en el cual se considera válida esa característica. “Ejidos en el municipio de Córdoba hasta el 31 de junio de 1980”; viviendas con más de 3 habitaciones en Yucatán hasta el 30 de marzo de 1993”, etc. Cada uno de los componentes de una población recibe el nombre de elemento o unidad esencial, que puede ser individual o colectivo. En una población formada por estudiantes, el elemento o unidad esencial es “el estudiante”, cuyo carácter es, evidentemente, individual; en una población formada por fábricas de automóviles, el elemento es “la fábrica de automóviles”, de naturaleza colectiva, ya que se trata de un establecimiento en el que hay muchos obreros, empleados, departamentos, etc.
Definida una población cualquiera, se llama muestra a toda porción de elementos sacada de
Ella.








 
Si de una población formada por N elementos, se toma una parte de ellos, esta parte o subconjunto de la totalidad será una muestra. Gráficamente, universo (población), elemento y muestra se representa como en la figura siguiente:

Variable. Es toda propiedad o característica que admite variaciones dentro de un conjunto de
objetos.
Se dice que algo varía si puede tomar por lo menos dos valores, grados o formas o, incluso,
cuando una característica puede estar presente o ausente en una situación específica.
Dicho esto, podríamos estar de acuerdo en que nociones como sexo, número de hijos por familia, color de automóvil, número de huelgas anuales, nivel de estudios, etc., son variables, ya que son características que admiten por lo menos dos valores, grados o formas dentro de un universo determinado.
No obstante, la práctica docente enseña que, al empezar a familiarizarse con este tema, los alumnos suelen confundir la característica que admite variaciones con el universo o con los elementos del mismo. Compárese la lista del párrafo anterior con esta otra: persona, vivienda, lámpara, automóvil. Estos términos se refieren a objetos y no a características de objetos; por lo tanto, no son variables. Variables serían las características que quisiéramos indagar de esos objetos. Por ejemplo, de un universo formado por personas podríamos conocer su edad, lugar de nacimiento, nivel de escolaridad, clase social a que pertenecen, etc. Estas peculiaridades son variables. También son variables, de un universo formado por automóviles, su marca, modelo, color, potencia, etc., ya que son características que van cambiando de auto en auto.

 
Tipos de variables.


Según la medición
Variables cualitativas
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
  • Variable cualitativa ordinal: También llamada variable cuasicuantitativa. La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.
  • Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser:
  • Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
  • Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.
Según la influencia
Según la influencia que asignemos a unas variables sobre otras, podrán ser:
Variables independientes
Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.
Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En investigación experimental se llama así a la variable que el investigador manipula.
Variables dependientes
Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes.
Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.
La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.
Otras
Variable interviniente
Son aquellas características o propiedades que de una manera u otra afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes.
Variable moderadora
Según Tuckman: representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes.


Datos personales

Alumnos de quinto semestre de informatica