División de la Estadística y
su Objeto de Estudio
La Estadística
es una disciplina que utiliza recursos matemáticos para organizar y resumir una
gran cantidad de datos obtenidos de la realidad, e inferir conclusiones
respecto de ellos. Tiene como propósito la descripción del conjunto
de datos colectados, así como la generalización y/o toma de
decisiones acerca de las características de todas las observaciones
potenciales bajo consideración. En consecuencia nos permite organizar y resumir
datos para poder realizar inferencias (conclusiones) relativas a los mismos.
Para su mejor estudio se han creado varias formas de clasificar los estudios
estadísticos. Algunas de las más comunes son las siguientes:
“Clasificación
de la Estadística según la etapa o función”
Generalmente se
considera que la estadística tiene dos funciones (divisiones). Hay una estadística
descriptiva y una estadística inferencial. La primera etapa
se ocupa de describir la muestra, y la segunda etapa infiere
conclusiones a partir de los datos que describen la muestra (por ejemplo
con respecto a la población). A continuación, se dará paso a describir
brevemente, cada etapa.
Estadística Descriptiva o
Deductiva
Se refiere a la recolección,
presentación, descripción, análisis e interpretación
de una colección de datos, esencialmente consiste en resumir
éstos con uno o dos elementos de información (medidas descriptivas) que
caracterizan la totalidad de los mismos.
La Estadística Descriptiva recolecta, describe,
analiza, interpreta y presenta los datos de una población en forma de tablas y
gráficas
Consiste sobre
todo en la presentación de datos en forma de tablas y gráficas;
así que se emplea simplemente para resumir de forma numérica o gráfica un
conjunto de datos. Esta comprende cualquier actividad relacionada con los datos
y está diseñada para resumir o describir los mismos sin factores pertinentes
adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos,
como tales.
La estadística
Descriptiva es el método de obtener de un conjunto de datos conclusiones
sobre sí mismos y no sobrepasan el conocimiento proporcionado por éstos.
Puede utilizarse para resumir o describir cualquier conjunto ya sea que
se trate de una población o de una muestra, cuando en la etapa
preliminar de la Inferencia Estadística se conocen los elementos de una
muestra.
Así pues, si
aplicamos las herramientas ofrecidas por la estadística descriptiva a una
muestra, solo nos limitaremos a describir los datos encontrados en dicha
muestra, por lo que no se podrá generalizar la información hacia la población.
Estadística Inferencial o
Inductiva
La Estadística Inferencial trabaja a base de
muestras para inferir aspectos de la población.
La estadística
descriptiva trabaja con todos los individuos de la población. La estadística
inferencial, sin embargo, trabaja con muestras, subconjuntos formados
por algunos individuos de la población. A partir del estudio de la muestra se
pretende inferir aspectos relevantes de toda la población.
Cómo se selecciona la muestra, cómo se realiza la inferencia, y qué grado de
confianza se puede tener en ella son aspectos fundamentales de la estadística
inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de estadística,
probabilidad y matemáticas.
Para que éstas
generalizaciones sean válidas la muestra deben ser representativa de
la población y la calidad de la información debe ser
controlada, además puesto que las conclusiones así extraídas están sujetas a
errores, se tendrá que especificar el riesgo o probabilidad que con que
se pueden cometer esos errores.
La Estadística
Inferencial investiga o analiza una población partiendo de
una muestra tomada. Es así que permite realizar conclusiones o
inferencias, basándose en los datos simplificados y analizados
de una muestra hacia la población o universo.
Por ejemplo, a
partir de una muestra representativa tomada a los habitantes de una ciudad, se
podrá inferir la votación de todos los ciudadanos que cumplan los requisitos
con un error de aproximación.
En sus
particularidades la Inferencia distingue la Estimación (cuando se usan
las características de la muestra para hacer inferencias sobre las
características de la población) y la Contrastación de Hipótesis (cuando
se usa la información de la muestra para responder a interrogantes sobre la
población).
“Clasificación
de la Estadística según el tiempo considerado”
Si se clasifica la Estadística en base al tiempo
considerado, tenemos la Estadística Estática (datos de la actualidad) y la
Estadística Evolutiva (datos del pasado).
Dentro de la estadística
descriptiva se distinguen los datos en función al tiempo en que se
encuentra analizada la población; de esta manera, tenemos 2 clasificaciones:
Estadística Estática o
Estructural
La estadística
estática o estructural, que describe la población en un momento dado
empleando datos de la actualidad (por ejemplo la tasa de nacimientos en
determinado censo)
Estadística Dinámica o
Evolutiva
La estadística
dinámica o evolutiva, que describe como va cambiando la población en el
tiempo empleando datos del pasado (por ejemplo el aumento anual en
la tasa de nacimientos).
“Clasificación
de la Estadística según la cantidad de variables estudiada”
También, se
puede clasificar a la Estadística en función de la cantidad de variables que
están siendo estudiadas en determinado problema estadístico. Desde este punto
de vista hay una estadística univariada (estudia una sola variable, como
por ejemplo la inteligencia, en una muestra), una estadística bivariada
(estudia cómo están relacionadas dos variables, como por ejemplo inteligencia
y alimentación), y una estadística multivariada (que estudia tres o
más variables, como por ejemplo como están relacionados el sexo, la edad
y la alimentación con la inteligencia).
Estadística Univariada
Un ejemplo perfecto del análisis estadístico
univariado, es la utilización del promedio o media aritmética, pues sólo se
mide una variable.
Cuando el
análisis presenta característica por característica, aisladamente,
estaremos en presencia de un análisis estadístico univariado. Esto
quiere decir, que se está estudiando una sola variable.
El análisis
univariado es el análisis básico, primario. Las características o propiedades
de las personas o cosas han de medirse una a una, de modo univariado y si se
presentan de esa manera decimos que es análisis univariado.
Los estadísticos
básicos que conocemos, como la media, la mediana, la moda,
la varianza, los porcentajes, entre otros, miden una variable.
Es decir, fueron hechos univariados.
Ahora bien este
tipo de análisis ha sido muy criticado ya que la realidad se presenta
interconectada, relacionada. Por ejemplo existe una relación entre el peso y la
talla de las personas o entre la el interés y el rendimiento escolar, etc.
Como la realidad
se presenta relacionada necesitamos métodos más rigurosos para evaluarla. Esto
lo podemos hacer de dos modos; El primero es medir las variables de modo
univariado (analizarlas) y relacionarlas luego en la interpretación.
Estadística Bivariada
La Estadística bivariada, busca la relación entre 2
variables, mediante la elaboración de índices y resultados estadísticos
La estadística
univariada se aplica, por lo general, en explotaciones estadísticas básicas
de la fuente de datos (frecuencias, porcentajes, promedios, tasas…). La estadística
bivariada trata de ir más allá elaborando índices y resultados estadísticos
en términos de relaciones entre dos variables de interés, así como de
establecer inferencias sobre una población a partir de datos que provienen de
una muestra (como, por ejemplo, en los estudios mediante encuesta).
El conjunto de técnicas
estadísticas bivariadas difiere en función del tipo de datos de los que se
dispone (niveles de medida: nominal, ordinal, intervalo, razón),
adaptándose en todo momento al contexto de análisis aplicado en el que nos
encontremos.
Estadística Multivariada
La Estadística multivariada tiene diversas aplicaciones
en una enorme cantidad de áreas, como los son: la agricultura, el deporte, la
psicología, la economía, etc.
Los métodos
estadísticos multivariantes y el análisis multivariante son herramientas
estadísticas que estudian el comportamiento de tres o más variables al mismo
tiempo. Se usan principalmente para buscar las variables menos
representativas para poder eliminarlas, simplificando así
modelos estadísticos en los que el número de variables sea un problema y para comprender
la relación entre varios grupos de variables. Algunos de los
métodos más conocidos y utilizados son la Regresión lineal y el Análisis
discriminante.
Se pueden
sintetizar dos objetivos claros:
1. Proporcionar métodos cuya
finalidad es el estudio conjunto de datos multivariantes que el análisis
estadístico uni y bidimensional es incapaz de conseguir.
2. Ayudar al analista o
investigador a tomar decisiones óptimas en el contexto en el que se encuentre
teniendo en cuenta la información disponible por el conjunto de datos
analizado.
Los datos
multivariados surgen cuando a un mismo individuo se le mide más
de una característica de interés. Un individuo puede ser un objeto o
concepto que se puede medir. Más generalmente, los individuos son llamados
unidades experimentales. Ejemplos de objetos: personas, animales, terrenos,
compañías, países, etc. Ejemplos de conceptos: amor, amistad, noviazgo, etc.
Una variable es una característica o atributo que se le mide a un individuo.
Las aplicaciones
de la estadística multivariada están presentes en distintas áreas o
ramas de la ciencias, como por ejemplo en: Investigación de mercados
(para identificar características de los individuos con el propósito de
determinar qué tipo de personas compran determinado producto); en el sistema
de educación de cualquier tipo de especialidad (para conocer los
estudiantes que tendrán éxito y concluirán satisfactoriamente sus estudios); en
la agricultura (al estudiar la resistencia de determinado tipo de
cosechas a daños por plagas y sequías); en el deporte (para conocer a
partir de medidas antropométricas las posibilidades de obtener buenos
resultados en un deporte específico); en la psicología (al estudiar la
relación entre el comportamiento de adolescentes y actitudes de los padres); en
la economía (para conocer el nivel de desarrollo de un territorio en
relación con otros y realizar inferencias a partir de variables económicas
fundamentales, entre otros).