viernes, 23 de febrero de 2018

26 ESTADISTICA

ESTADISTICA
ESTADISTICA

Es la ciencia que nos proporciona un conjunto de métodos y procedimientos destinados a recopilar, organizar, clasificar, presentar, reunir y analizar datos, tanto para la deducción de conclusiones como para tomar decisiones.
En el lenguaje común es un conjunto de datos o la ciencia que sirve para tomar decisiones a base de observaciones.

CLASIFICACION

La estadística puede clasificarse en: Estadística Descriptiva y Estadística Inferencial.
Estadística Descriptiva
Se denomina así, al conjunto de métodos estadísticos que se relacionan con el resumen y descripción de los datos, como tablas, gráficos y el análisis mediante algunos cálculos.
Estadística Inferencial
Se denomina asi, al conjunto de métodos con los que se hace la generalización a la Inferencia sobre una población utilizando una muestra.

CONCEPTOS BASICOS

● Unidad elemental
Persona u objeto al cual se le va a estudiar alguna característica. A esta observación también se le llama DATO.
Población
Es la totalidad de elementos del conjunto estudiado, en los cuales se presentará determinadas características (edades, pesos, estatura, número de artículos defectuosos y no defectuosos producido por una industria, etc.).
El tamaño de la población se denota con la letra N.
- Los alumnos de 5to de secundaria del distrito del Rímac.
● Muestra
Es una parte o subconjunto de la población que será sometida a estudio.
El tamaño de la muestra se denota con la letra n.
- La nota promedio en historia del Perú de una sección de secundaria.
- El control de calidad de algunos artículos producidos por una Industria láctea.
 Datos estadísticos
Son números o medidas que han sido recopilados, como resultado de observaciones.
● Variable estadística
Es la característica de la población que Interesa al investigador y que puede tomar distintos valores.
A las variables se les denota con las letras mayúsculas: X, Y, W, Z.
A las observaciones se les denota con las letras minúsculas: x, y, w, z.
- Sea X el ingreso mensual de cada padre.
x4 = s/400 indica que cada padre asignado al número 4 tiene un ingreso mensual de s/400
- Peso, estatura, sexo de un grupo de personas.
Parámetro
Es el valor constante que se utiliza para describir una variable en la población, para ello se requiere la información de toda la población.
- La media, varianza
Valor estadístico o estratigráfico
Es una variable que cambia de valor de una muestra a otra. El valor que admite en una muestra particular sirve para estimar al parámetro.
- La media
- La varianza S2
Estimar
Consiste en considerar el valor del estadígrafo hallado en una muestra como si fuera el valor del parámetro.
Dato
Representa la respuesta o valor que adquiere la variable en cada unidad de análisis.
El dato puede expresarse por un número o una palabra.
CLASES DE VARIABLES

La variable estadística puede ser: cualitativa o cuantitativa.

Variable cualitativa
Consiste en clasificar las variables por categorías. No lleva clasificación numérica, es decir son variables cuya característica es una cualidad o propiedad que presenta una población.
Pueden ser variables nominal o jerarquizada.
Variable cualitativa nominal: Son cuando no se pueden establecer un orden en los atributos.
Variable
Dominio de la Variable
Profesión a seguir al acabar la secundaria
- Educación
- Ingeniería
- Derecho
Variable cualitativa ordinal o jerarquizada: Cuando es posible mantener un orden en las alternativas.
Variable
Dominio de la Variable
Nivel de educación alcanzado
- Primaria
- Secundaria
- Superior incompleta
- Superior completa

Variable cuantitativa
Son variables que se obtienen como resultado de mediciones o conteos es decir cuando se puede establecer cuanto o en qué cantidad se tiene una determinada característica.
La variable cuantitativa puede ser discreta o continua.
Variable cuantitativa discreta: Los valores que toma la variable son números enteros.
Variable
Dominio de la Variable
Número de hermanos
0, 1, 2, 3,….
Variable cuantitativa continua: Los valores que toma la variable son números reales es decir puede tomar cualquier valor de un intervalo determinado.
Variable
Dominio de la Variable
Peso
45kg
48g
52kg
ETAPAS DE LA INVESTIGACION ESTADISTICA

Las etapas de investigación del método estadístico son:

● Planificación o preparación del estudio
Esta etapa tiene la finalidad de estudiar los detalles concernientes a la recolección, clasificación y análisis de la Información.
- Fundamentación del estudio e identificación de las variables.
- Determinación de objetivos.
- Organización de las variables, precisión de los datos e información requerida.

Recolección de datos o información
Esta etapa tiene para el investigador mucha más importancia que cualquier otra, pues tiene que ser vigilada constantemente por éste, de manera que la información recogida sea correcta.
Para obtenerlos se usan entrevistas, censos, encuesta, etc.

● Organización y presentación de la información o datos
Luego de recogida la información, es necesario revisarla, resumirla y presentarla convenientemente, antes de que sea posible analizarla.

Análisis e interpretación de los datos
Es la parte final de un estudio estadístico y puede ser presentado en tablas o gráficos, en forma tal, que faciliten su comprensión y su posterior análisis y utilización.
Los cuadros numéricos de una sola variable estadística se denominan distribución de frecuencias.

ORGANIZACIÓN Y PRESENTACION DE DATOS

Una vez recolectados los datos se procede a su organización, clasificación y tabulación; para presentarlos en una tabla.
Existen dos tipos de tablas de frecuencia para presentar un conjunto de datos:
- Tablas de frecuencia para datos agrupados.
- Tablas de frecuencia para datos no agrupados.

PRESENTACION NUMERICA
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

Tablas de variable discreta. Se han encuestado a 20 familias respecto al número de miembros que conforman (padres e hijos incluidos).
4        2       3       5       6
2        3       3       4       5
3        7       2       2       3
6        3       3       4       2

Alcance (A)
Es un intervalo cerrado definido por los datos de menor y mayor valor.
A = [2 ; 7]

● Rango o amplitud de los datos (R)
El rango, es la diferencia entre el mayor y el menor de los valores que toma la variable.
Xmáx 7  y  Xmin = 2
R = 7 - 2 = 5

Intervalo de clase (Ii)
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. El límite inferior de una clase pertenece al intervalo pero el límite superior no pertenece al intervalo.
[2 ; 7>
Límite inferior = 2
Límite superior = 7
Ancho de clase (W)
Es la diferencia entre límite superior e inferior de cada intervalo.
[2 ; 7>
Wi = 7 – 2 = 5
W =
Marca de clase (xi)
Es el punto medio del intervalo.
[2 ; 7>
x =  = 4,5

Determinación del Rango
R = Xmax - Xmin
R = 7 – 2 = 5

Determinación del # de intervalos de clase (K) - REGLA DE STUGES
K = 1 + 3,3log(n)
n = # de datos
Se redondea el valor de K para que los valores mayores se encuentren en el último intervalo.
Si n = 20
K = 1 + 3,3log(20) 5,2933….
K puede ser 4, 5 o 6
c
Determinación del tamaño de los intervalos o amplitud (C)
Es conveniente que los intervalos de clase sean del mismo tamaño.
C =

Frecuencia absoluta (fi)
Es el número de veces que aparece un valor de la variable estadística.
- El dato 3 aparece 7 veces.
Frecuencia absoluta de dato 3 = 7

● Frecuencia acumulada (Fi)
La frecuencia absoluta acumulada de un dato de la variable, es la cantidad de datos hasta determinado valor de la variable.
- el dato 2 aparece 5 veces y el dato 3 aparece 7 veces.
La frecuencia absoluta acumulada del dato 3 será 5 + 7 = 12

Frecuencia relativa (hi)
Es el cociente entre la respectiva frecuencia absoluta (f¡) del dato y el total de datos (n).
hi =
La frecuencia relativa puede ser expresada en porcentaje.
- Frecuencia relativa del dato 3:
 = 0,35 = 35%

● Frecuencia relativa acumulada (Hi)
Es el cociente entre la frecuencia absoluta acumulada (Fi) y el total de datos.
Hi  =
- La frecuencia relativa acumulada del dato 3 será =  = 0,60 = 60%
Hacemos una tabla de frecuencias con los datos del ejemplo anterior.
NUMERO DE MIEMBROS DE UNA FAMILIA
n = 20; K = 5; C = 1

xi
fi
Fi
hi
Hi
[2;3>
[3;4>
[4;5>
[5;6>
[6;7]
2,5
3,5
4,5
5,5
6,5
5
7
3
2
3
5
12
15
17
20
0,25
0,35
0,15
0,1
0,15
0,25
0,6
0,75
0,85
1


n=20

1

Ejemplo 1: Construir la distribución de frecuencias de variable continua sobre las edades de 50 personas
73 47 67 82 67 70 60 67 61 80
65 70 57 85 59 70 57 73 77 58
69 58 76 67 52 68 69 66 72 86
76 79 77 88 94 67 77 54 93 56
73 64 70 46 68 63 72 84 63 74
n = 50; Rango = 94 – 46 = 48;
K = 1 + 3,3log(50) 6,6066…. K = 8
C =  = 6
Edades
xi
fi
Fi
hi
Hi
[46;52>
[52;58>
[58;64>
[64;70>
[70;76>
[76;82>
[82;88>
[88;94]
49
55
61
67
73
79
85
91
2
5
7
12
11
6
4
3
2
7
14
26
37
43
47
50
0,04
0,10
0,14
0,24
0,22
0,12
0,08
0,06
0,04
0,14
0,28
0,52
0,74
0,86
0.94
1


n=50

1

Ejemplo 2: Construir la distribución de frecuencias con los datos siguientes:
Ii
fi
[12, 16>
3
[16, 20>
4
[20, 24>
3
[24, 28>
4
[28, 32>
1
n = 15; Rango = 32 – 12 = 20; K = 5; C = 4

Ii
xi
fi
Fi
hi
Hi
[12, 16>
14
3
3
0,20
0,20
[16, 20>
18
4
7
0,27
0,47
[20, 24>
22
3
10
0,20
0,67
[24, 28>
26
4
14
0,27
0,94
[28, 32>
30
1
15
0,07
1


15




Propiedades de las frecuencias:

Sea n el número total de datos de la variable X, que toma los valores x1, x2, x3,…., xk

● Las frecuencias absolutas fi y las frecuencias absolutas acumuladas Fi son números enteros no negativos y no mayores que n.
0 fi n    0 Fi n
● Las frecuencias relativas hi y las frecuencias relativas acumuladas Hi son casi siempre números decimales no negativos y no mayores que la unidad.
0 hi 1    0 Hi 1
● La suma de las frecuencias absolutas es igual al número de datos de la variable.
f1 + f2 + f3 +- - - + fk = n
● La suma de las frecuencias relativas es igual a 1 o 100%
h1 + h2 + h3 +- - - + hk = 1 = 100%
● El último valor de la frecuencia absoluta acumulada es igual al número de datos de la variable.
Fk = n
 PROBLEMAS PROPUESTOS


1. Los datos siguientes representan a los alumnos extranjeros en 50 aulas de una universidad. Hallar el porcentaje de aulas que no tienen estudiantes extranjeros.
2   0   4   4   1   4   0   3   2   0
0   1   1   1   0   1   2   4   0   1
1   5   2   2   5   3   4   0   4   0
0   0   3   0   1   4   2   1   2   0
3   1   3   1   2   0   5   6   3   2

a) 20%         b) 25%         c) 26%
d) 28%         e) 30%
2. Del ejemplo anterior. ¿Qué porcentaje de aulas cuentan con 1, 2 o 2 alumnos extranjeros?

a) 50%         b) 52%         c) 54%
d) 55%         e) 60%

3. La tabla de frecuencias representan al número de alumnos por cada colegio de cierto distrito. Hallar el % de colegios que tienen entre 50 y 110 alumnos.
# de alumnos
fi
[0;20>
5
[20;40>
20
[40;60>
40
[60;80>
35
[80;100>
35
[100;120>
50
[120;140>
15
[140;160>
20
[160;180>
15
[180;200>
15

a) 42%         b) 44%         c) 45%
d) 46%         e) 48%

4. Del ejemplo anterior. Hallar el % de colegios que tienen menos de 50 alumnos

a) 18%         b) 19%         c) 20%
d) 22%         e) 25%

5. Del diagrama escalonado siguiente, hallar la media de los datos agrupados.
a) 8              b) 9              c) 10
d) 11            e) 12

6. En una fábrica donde el sueldo promedio de los obreros es s/800, se Incrementan los obreros en  25% del ya existente con un sueldo medio igual al 60% de los antiguos. Si 3 meses más tarde se incrementa cada sueldo en 20% ¿cuánto es el nuevo salario promedio?

a) s/798,       b) s/880        c) s/880,2
d) s/883        e) s/883,2

7. Hallar la mayor edad de cuatro personas cuya media es 24 años, la mediana es 23 años y el valor bimodal es 22 años.

a) 25            b) 26            c) 27
d) 28            e) 29

8. La siguiente tabla de frecuencias de las edades de 50 alumnos cuyo ancho de clase es constate e igual a 2. Hallar el % de los que tienen menos de 10 años.

Ii
xi
fi



[  ;8>






X
X

Y
Y-5
a) 60%         b) 62%         c) 64%
d) 66%         e) 68%

9. En la siguiente distribución de frecuencias sobre las estaturas de 50 jóvenes, donde h1 = h5 y h2 = h4; hallar Y + X

Ii
fi
hi
Hi
[1,55;1,60>



[1,60;1,65>



[1,65;1,70>

0,

[1,70;1,75>
5

0,96
[1,75;1,80>




a) 9              b) 10            c) 11
d) 12            e) 13

10. En la siguiente distribución de frecuencias sobre los sueldos en soles de los empleados de una empresa; hallar el número de empleados.

Ii
fi
hi
[500;800>
x
1/x
[800;1100>

2/x
[1100;1400>

9/x
[1400;1700>

3/x

a) 200          b) 215          c) 220
d) 225          e) 250

11. Las ganancias diarias de una distribuidora de alimentos se muestran en una tabla de frecuencias de 6 intervalos cuya ganancia mínima es s/6 y su rango es 36. Hallar la moda.
f2 = 2f1          f4 = 304        h3 = 0,25
F2 = 120       H2 = 0,15      H5 = 0,93

a) 27,5        b) 27,1        c) 26,5
d) 26,34       e) 26,1

12. Hallar la varianza de la siguiente tabla de frecuencias, donde el ancho de clase es constante.
Ii
fi
Fi
[20;25>
z - 4

[25;x>

z + 6
[x;y>
y - 2

[y;w>

3w
[w;z>
x - 10


a) 44,21       b) 48,35       c) 51,46
d) 50,33       e) 55,23

13. Se tiene el siguiente histograma de frecuencias relativas sobre 340 personas.
Hallar las muestras que existen entre el intervalo x3 y x5


a) 180          b) 185          c) 190
d) 195          e) 200

14. Hallar la suma de cuartiles impares en siguiente tabla de frecuencias sobre las edades de un grupo de personas, donde el ancho de clase es constante.

Ii
fi
Fi
[30;35>

3
[35;40>
7

[40; >
12
22
[ ;50>
23
45
[ ;55>

59
[55;60>
1
60

a) 91,04       b) 91,08       c) 92
d) 92,04       e) 92,08

15. De la pregunta anterior; hallar la diferencia positiva entre los deciles extremos

a) 15,07       b) 16,05       c) 16,07
d) 17,05       e) 17,07

16. En la tabla de frecuencias hallar la varianza de una muestra.

Ii
fi
[0;10>
6
[10;20>
19
[20;30>
45
[30;40>
22
[40;60>
8

a) 97,        b) 97,        c) 96,
d) 96,        e) 95,

17. En la tabla de frecuencias hallar la desviación estándar poblacional.

 xi
fi
13
3
14
15
15
23
16
10
17
5
18
4

a) 0,52         b) 0,63         c) 0,8
d) 1,2           e) 1,23

19. El siguiente histograma muestra la altura de los puentes peatonales, cuya altura estándar debe ser 3,5 m. ¿cuál será el % de puentes que se encuentran entre el promedio y la altura estándar?

a) 16%         b) 17%         c) 18%
d) 19%         e) 20%

19. EXAMEN UNI. Del gráfico
Tasa de aprobación en los cursos A, B, C, D y E de un grupo de estudiantes.


Se afirma:
I. El porcentaje promedio de desaprobación por curso es 36%.
II. El porcentaje de aprobación del curso D es el 60% del porcentaje de aprobación del curso B.
III. La tasa de desaprobación del curso E es el 60% de la tasa de aprobación en el curso C.
¿Cuáles de las afirmaciones son verdaderas?

a) Solo I       b) Solo II      c) Solo III
d) Solo I y II  e) Solo I y III

20. EXAMEN UNI. Semanalmente, un trabajador ahorra cierta cantidad en soles, y durante 40 semanas ahorra las siguientes cantidades

21   35   29   31   23   22   28   33
28   25   31   26   24   27   27   33
37   29   19   36   23   18   46   12
26   41   30   18   39   15   24     4
25   33   10   28   20   27   17   31

Se construye una tabla de frecuencias de 7 intervalos de igual longitud fija A. Si F5 es la frecuencia acumulada del quinto intervalo (ordenados los extremos de los mismos de forma creciente), determine el valor de (A + F5) – 1

a) 30            b) 32            c) 37
d) 38            e) 39

Descarga el archivo
Descargar el solucionario


1 comentario: