ESTADISTICA
ESTADISTICA
Es la ciencia que nos proporciona un
conjunto de métodos y procedimientos destinados a recopilar, organizar, clasificar,
presentar, reunir y analizar datos, tanto para la deducción de conclusiones
como para tomar decisiones.
En el lenguaje común es un conjunto de datos o la ciencia
que sirve para tomar decisiones a base de observaciones.
CLASIFICACION
La estadística puede clasificarse en: Estadística
Descriptiva y Estadística Inferencial.
Estadística Descriptiva
Se denomina así, al conjunto de métodos
estadísticos que se relacionan con el resumen y descripción de los datos, como
tablas, gráficos y el análisis mediante algunos cálculos.
Estadística Inferencial
Se denomina asi, al conjunto de métodos
con los que se hace la generalización a la Inferencia sobre una población utilizando
una muestra.
CONCEPTOS
BASICOS
● Unidad
elemental
Persona u objeto al cual se le va a estudiar alguna
característica. A esta observación también se le llama DATO.
● Población
Es la totalidad de elementos del conjunto
estudiado, en los cuales se presentará determinadas características (edades,
pesos, estatura, número de artículos defectuosos y no defectuosos producido por
una industria, etc.).
El tamaño de la población se denota con la
letra N.
- Los alumnos de
5to de secundaria del distrito del Rímac.
● Muestra
Es una parte o subconjunto de la población
que será sometida a estudio.
El tamaño de la muestra se denota con la
letra n.
- La nota promedio en historia
del Perú de una sección de secundaria.
- El control de calidad de
algunos artículos producidos por una Industria láctea.
Son números o medidas que han sido
recopilados, como resultado de observaciones.
● Variable estadística
Es la característica de la población que
Interesa al investigador y que puede tomar distintos valores.
A las variables se les denota con las
letras mayúsculas: X, Y, W, Z.
A las observaciones se les denota con las
letras minúsculas: x, y, w, z.
- Sea X el ingreso mensual de
cada padre.
x4 = s/400 indica que
cada padre asignado al número 4 tiene un ingreso mensual de s/400
- Peso, estatura, sexo de un
grupo de personas.
● Parámetro
Es el valor constante que se utiliza para
describir una variable en la población, para ello se requiere la información de
toda la población.
- La media, varianza
● Valor
estadístico o estratigráfico
Es una variable que cambia de valor de una
muestra a otra. El valor que admite en una muestra particular sirve para
estimar al parámetro.
- La media
- La varianza S2
● Estimar
Consiste en considerar el valor del
estadígrafo hallado en una muestra como si fuera el valor del parámetro.
● Dato
Representa la respuesta o valor que
adquiere la variable en cada unidad de análisis.
El dato puede expresarse por un número o
una palabra.
CLASES DE VARIABLES
La variable estadística puede ser:
cualitativa o cuantitativa.
● Variable
cualitativa
Consiste en clasificar las variables por
categorías. No lleva clasificación numérica, es decir son variables cuya
característica es una cualidad o propiedad que presenta una población.
Pueden ser variables nominal o
jerarquizada.
Variable cualitativa nominal: Son cuando no se pueden establecer un orden en los
atributos.
Variable
|
Dominio de la
Variable
|
Profesión a seguir al acabar
la secundaria
|
- Educación
- Ingeniería
- Derecho
|
Variable cualitativa ordinal o jerarquizada: Cuando es posible mantener un orden en
las alternativas.
Variable
|
Dominio de la
Variable
|
Nivel de educación alcanzado
|
- Primaria
- Secundaria
- Superior incompleta
- Superior completa
|
Variable cuantitativa
Son variables que se obtienen como resultado
de mediciones o conteos es decir cuando se puede establecer cuanto o en qué
cantidad se tiene una determinada característica.
La variable cuantitativa puede ser
discreta o continua.
Variable cuantitativa discreta: Los valores que toma la variable son números enteros.
Variable
|
Dominio de la
Variable
|
Número de hermanos
|
0, 1, 2, 3,….
|
Variable cuantitativa continua: Los valores que toma la variable son números reales es
decir puede tomar cualquier valor de un intervalo determinado.
Variable
|
Dominio de la
Variable
|
Peso
|
45kg
48g
52kg
|
ETAPAS
DE LA INVESTIGACION ESTADISTICA
Las etapas de investigación del método estadístico son:
● Planificación o preparación del estudio
Esta etapa tiene la finalidad de estudiar
los detalles concernientes a la recolección, clasificación y análisis de la
Información.
- Fundamentación del estudio e
identificación de las variables.
- Determinación de objetivos.
- Organización de las variables, precisión
de los datos e información requerida.
● Recolección
de datos o información
Esta etapa tiene para el investigador mucha
más importancia que cualquier otra, pues tiene que ser vigilada constantemente
por éste, de manera que la información recogida sea correcta.
Para obtenerlos se usan entrevistas,
censos, encuesta, etc.
● Organización y presentación de la información o datos
Luego de recogida la información, es
necesario revisarla, resumirla y presentarla convenientemente, antes de que sea
posible analizarla.
● Análisis
e interpretación de los datos
Es la parte final de un estudio
estadístico y puede ser presentado en tablas o gráficos, en forma tal, que
faciliten su comprensión y su posterior análisis y utilización.
Los cuadros numéricos de una sola variable
estadística se denominan distribución de frecuencias.
ORGANIZACIÓN
Y PRESENTACION DE DATOS
Una vez recolectados los datos se procede a su
organización, clasificación y tabulación; para presentarlos en una tabla.
Existen dos tipos de tablas de frecuencia para presentar
un conjunto de datos:
- Tablas de frecuencia para datos agrupados.
- Tablas de frecuencia para datos no agrupados.
PRESENTACION
NUMERICA
TABLA
DE DISTRIBUCIÓN DE FRECUENCIAS
Tablas de variable discreta. Se han encuestado a 20 familias respecto al número de
miembros que conforman (padres e hijos incluidos).
4 2
3 5
6
2 3
3 4
5
3 7
2 2
3
6 3 3 4 2
● Alcance (A)
Es un intervalo cerrado definido por los datos de menor y
mayor valor.
A = [2 ; 7]
● Rango o amplitud de los datos (R)
El rango, es la diferencia entre el mayor
y el menor de los valores que toma la variable.
Xmáx 7
y Xmin = 2
R = 7 - 2 = 5
● Intervalo de
clase (Ii)
Cada clase está delimitada por el límite inferior de la
clase y el límite superior de la clase. El límite inferior de una clase
pertenece al intervalo pero el límite superior no pertenece al intervalo.
[2 ; 7>
Límite inferior = 2
Límite superior = 7
● Ancho de clase
(W)
Es la diferencia entre límite superior e inferior de cada
intervalo.
[2 ; 7>
Wi = 7 – 2 = 5
W =
● Marca de clase (xi)
Es el punto medio del intervalo.
[2 ; 7>
x =
=
4,5
● Determinación
del Rango
R = Xmax - Xmin
R = 7 – 2 = 5
● Determinación
del # de intervalos de clase (K) - REGLA
DE STUGES
K =
1 + 3,3log(n)
n = # de datos
Se redondea el valor de K para que los valores mayores se
encuentren en el último intervalo.
Si n = 20
K = 1 + 3,3log(20) ≅ 5,2933….
K puede ser 4, 5 o 6
c
● Determinación
del tamaño de los intervalos o amplitud (C)
Es conveniente que los intervalos de clase sean del mismo
tamaño.
C =
● Frecuencia
absoluta (fi)
Es el número de veces que aparece un valor
de la variable estadística.
- El dato 3 aparece 7 veces.
→ Frecuencia absoluta de dato 3 = 7
● Frecuencia acumulada (Fi)
La frecuencia absoluta acumulada de un
dato de la variable, es la cantidad de datos hasta determinado valor de la
variable.
- el dato 2 aparece 5 veces y el dato 3 aparece
7 veces.
→ La frecuencia absoluta acumulada del dato
3 será 5 + 7 = 12
● Frecuencia
relativa (hi)
Es el cociente entre la respectiva
frecuencia absoluta (f¡) del dato y el total de datos (n).
hi =
La frecuencia relativa puede ser expresada
en porcentaje.
- Frecuencia relativa del dato 3:
● Frecuencia relativa acumulada (Hi)
Es el cociente entre la frecuencia
absoluta acumulada (Fi) y el total de datos.
Hi =
- La frecuencia
relativa acumulada del dato 3 será =
= 0,60 = 60%
Hacemos una tabla de frecuencias con los datos del
ejemplo anterior.
NUMERO DE MIEMBROS DE UNA FAMILIA
n = 20; K = 5; C = 1
xi
|
fi
|
Fi
|
hi
|
Hi
|
|
[2;3>
[3;4>
[4;5>
[5;6>
[6;7]
|
2,5
3,5
4,5
5,5
6,5
|
5
7
3
2
3
|
5
12
15
17
20
|
0,25
0,35
0,15
0,1
0,15
|
0,25
0,6
0,75
0,85
1
|
n=20
|
1
|
Ejemplo 1: Construir la
distribución de frecuencias de variable continua
sobre las edades de 50 personas
73 47 67
82 67 70 60 67 61 80
65 70 57
85 59 70 57 73 77 58
69 58 76
67 52 68 69 66 72 86
76 79 77
88 94 67 77 54 93 56
73 64 70 46 68 63 72 84 63 74
n = 50; Rango = 94 – 46 = 48;
K = 1 + 3,3log(50) ≅ 6,6066…. → K = 8
C =
= 6
Edades
|
xi
|
fi
|
Fi
|
hi
|
Hi
|
[46;52>
[52;58>
[58;64>
[64;70>
[70;76>
[76;82>
[82;88>
[88;94]
|
49
55
61
67
73
79
85
91
|
2
5
7
12
11
6
4
3
|
2
7
14
26
37
43
47
50
|
0,04
0,10
0,14
0,24
0,22
0,12
0,08
0,06
|
0,04
0,14
0,28
0,52
0,74
0,86
0.94
1
|
n=50
|
1
|
Ejemplo 2:
Construir la distribución de frecuencias con los datos siguientes:
Ii
|
fi
|
|
[12, 16>
|
3
|
|
[16, 20>
|
4
|
|
[20, 24>
|
3
|
|
[24, 28>
|
4
|
|
[28, 32>
|
1
|
|
n = 15; Rango = 32 – 12 = 20; K = 5; C =
4
Ii
|
xi
|
fi
|
Fi
|
hi
|
Hi
|
[12, 16>
|
14
|
3
|
3
|
0,20
|
0,20
|
[16, 20>
|
18
|
4
|
7
|
0,27
|
0,47
|
[20, 24>
|
22
|
3
|
10
|
0,20
|
0,67
|
[24, 28>
|
26
|
4
|
14
|
0,27
|
0,94
|
[28, 32>
|
30
|
1
|
15
|
0,07
|
1
|
15
|
Propiedades de las frecuencias:
Sea n el número total de datos de la
variable X, que toma los valores x1, x2, x3,….,
xk
● Las frecuencias absolutas fi y las
frecuencias absolutas acumuladas Fi son números enteros no negativos y no
mayores que n.
0 ≤ fi ≤ n 0 ≤ Fi ≤ n
● Las frecuencias relativas hi y las
frecuencias relativas acumuladas Hi son casi siempre números decimales no
negativos y no mayores que la unidad.
0 ≤ hi ≤ 1 0 ≤ Hi ≤ 1
● La suma de las frecuencias absolutas es
igual al número de datos de la variable.
f1 + f2 + f3 +- - - + fk = n
● La suma de las frecuencias relativas es
igual a 1 o 100%
h1 + h2 + h3 +- - - + hk = 1 =
100%
● El último valor de la frecuencia
absoluta acumulada es igual al número de datos de la variable.
Fk =
n
1. Los datos siguientes
representan a los alumnos extranjeros en 50 aulas de una universidad. Hallar el
porcentaje de aulas que no tienen estudiantes extranjeros.
2 0 4 4 1 4 0 3 2 0
0 1 1 1 0 1 2 4 0 1
1
5 2 2
5 3 4
0 4 0
0
0 3 0
1 4 2
1 2 0
3
1 3 1
2 0 5
6 3 2
a)
20% b) 25% c) 26%
d)
28% e) 30%
2. Del ejemplo anterior. ¿Qué porcentaje de aulas cuentan
con 1, 2 o 2 alumnos extranjeros?
a)
50% b) 52% c) 54%
d)
55% e) 60%
3. La tabla de frecuencias representan al número de
alumnos por cada colegio de cierto distrito. Hallar el % de colegios que tienen
entre 50 y 110 alumnos.
# de
alumnos
|
fi
|
[0;20>
|
5
|
[20;40>
|
20
|
[40;60>
|
40
|
[60;80>
|
35
|
[80;100>
|
35
|
[100;120>
|
50
|
[120;140>
|
15
|
[140;160>
|
20
|
[160;180>
|
15
|
[180;200>
|
15
|
a)
42% b) 44% c) 45%
d)
46% e) 48%
4. Del ejemplo anterior. Hallar el % de colegios que
tienen menos de 50 alumnos
a)
18% b) 19% c) 20%
d)
22% e) 25%
5. Del diagrama escalonado siguiente, hallar la media de los
datos agrupados.
a)
8 b) 9 c) 10
d)
11 e) 12
6. En una fábrica donde el sueldo promedio
de los obreros es s/800, se Incrementan los obreros en 25% del ya existente con un sueldo medio igual
al 60% de los antiguos. Si 3 meses más tarde se incrementa cada sueldo en 20%
¿cuánto es el nuevo salario promedio?
a)
s/798, b) s/880 c) s/880,2
d)
s/883 e) s/883,2
7. Hallar
la mayor edad de cuatro personas
cuya media es 24 años, la mediana es 23 años y el valor bimodal es 22 años.
a)
25 b) 26 c) 27
d)
28 e) 29
8. La siguiente tabla de frecuencias de las edades de 50
alumnos cuyo ancho de clase es constate e igual a 2. Hallar el % de los que
tienen menos de 10 años.
Ii
|
xi
|
fi
|
[ ;8>
|
||
X
|
X
|
|
Y
|
Y-5
|
a)
60% b) 62% c) 64%
d)
66% e) 68%
9. En la
siguiente distribución de frecuencias sobre las estaturas de 50 jóvenes, donde
h1 = h5 y h2 = h4; hallar Y + X
Ii
|
fi
|
hi
|
Hi
|
[1,55;1,60>
|
|||
[1,60;1,65>
|
|||
[1,65;1,70>
|
0,
|
||
[1,70;1,75>
|
5
|
0,96
|
|
[1,75;1,80>
|
a)
9 b) 10 c) 11
d)
12 e) 13
10. En la
siguiente distribución de frecuencias sobre los sueldos en soles de los
empleados de una empresa; hallar el número de empleados.
Ii
|
fi
|
hi
|
[500;800>
|
x
|
1/x
|
[800;1100>
|
2/x
|
|
[1100;1400>
|
9/x
|
|
[1400;1700>
|
3/x
|
a)
200 b) 215 c) 220
d)
225 e) 250
11. Las ganancias diarias de una distribuidora de
alimentos se muestran en una tabla de frecuencias de 6 intervalos cuya ganancia
mínima es s/6 y su rango es 36. Hallar la moda.
f2 = 2f1 f4 = 304 h3
= 0,25
F2 = 120 H2
= 0,15 H5 = 0,93
a) 27,5
b)
27,1
c)
26,5
d) 26,34 e)
26,1
12. Hallar la varianza de la siguiente tabla de
frecuencias, donde el ancho de clase es constante.
Ii
|
fi
|
Fi
|
[20;25>
|
z - 4
|
|
[25;x>
|
z + 6
|
|
[x;y>
|
y - 2
|
|
[y;w>
|
3w
|
|
[w;z>
|
x - 10
|
a)
44,21 b) 48,35 c) 51,46
d)
50,33 e) 55,23
13. Se tiene el siguiente histograma de frecuencias
relativas sobre 340 personas.
Hallar las muestras que existen entre el intervalo x3
y x5
a)
180 b) 185 c) 190
d)
195 e) 200
14. Hallar
la suma de cuartiles impares en siguiente tabla de frecuencias sobre las edades
de un grupo de personas, donde el ancho de clase es constante.
Ii
|
fi
|
Fi
|
[30;35>
|
3
|
|
[35;40>
|
7
|
|
[40; >
|
12
|
22
|
[ ;50>
|
23
|
45
|
[ ;55>
|
59
|
|
[55;60>
|
1
|
60
|
a) 91,04 b)
91,08 c) 92
d)
92,04 e) 92,08
15. De la pregunta anterior; hallar
la diferencia positiva entre los deciles extremos
a) 15,07 b)
16,05 c) 16,07
d)
17,05 e) 17,07
16. En la tabla de frecuencias
hallar la varianza de una muestra.
Ii
|
fi
|
[0;10>
|
6
|
[10;20>
|
19
|
[20;30>
|
45
|
[30;40>
|
22
|
[40;60>
|
8
|
a) 97,
b)
97,
c)
96,
d) 96,
e)
95,
17. En la tabla de frecuencias
hallar la desviación estándar poblacional.
xi
|
fi
|
13
|
3
|
14
|
15
|
15
|
23
|
16
|
10
|
17
|
5
|
18
|
4
|
a) 0,52 b) 0,63 c) 0,8
d) 1,2 e)
1,23
19. El siguiente histograma
muestra la altura de los puentes peatonales, cuya altura estándar debe ser 3,5
m. ¿cuál será el % de puentes que se encuentran entre el promedio y la altura
estándar?
a) 16% b)
17% c) 18%
d)
19% e) 20%
19. EXAMEN UNI. Del gráfico
Tasa de aprobación en los cursos A, B, C, D y E de un grupo de estudiantes.
Se afirma:
I. El porcentaje promedio de desaprobación por curso es 36%.
II. El porcentaje de aprobación del curso D es el 60% del porcentaje de
aprobación del curso B.
III. La tasa de desaprobación del curso E es el 60% de la tasa de
aprobación en el curso C.
¿Cuáles de las afirmaciones son verdaderas?
a) Solo I b) Solo
II c) Solo III
d) Solo I y II e)
Solo I y III
20. EXAMEN
UNI. Semanalmente, un trabajador ahorra cierta cantidad en
soles, y durante 40 semanas ahorra las siguientes cantidades
21 35
29 31 23
22 28 33
28 25
31 26 24
27 27 33
37 29
19 36 23
18 46 12
26 41
30 18 39
15 24 4
25 33
10 28 20
27 17 31
Se construye una tabla de frecuencias de 7 intervalos de igual longitud
fija A. Si F5 es la frecuencia acumulada del quinto intervalo (ordenados
los extremos de los mismos de forma creciente), determine el valor de (A + F5)
– 1
a) 30 b) 32 c) 37
d) 38 e)
39