La
estadística descriptiva es aquella parte o campo de la estadística, disciplina matemática
y método científico, que tiene por objeto, dada una muestra, identificar la tendencia observada, la descripción del comportamiento estadístico, señalando sus
principales rasgos o características, para lo que se diseñan diferentes estadísticos,
en la estadística tradicional clasificados
en función de si son de tendencia central o dispersión, de tendencia central
destacan la Media Aritmética, Moda y Mediana, y de dispersión, Desviación Media, Varianza y Desviación Típica.
Frente
a la taxonomía tradicional, en estadística de la probabilidad o probabilidad
estadística, Introducción a la Probabilidad Imposible propone una nueva
clasificación complementaria y alternativa, a partir del estudio de las
puntuaciones directas o frecuencias de los sujetos u opciones en la muestra,
donde se diferencia entre estadísticos individuales o muestrales, teóricos o
empíricos, estableciéndose estadísticos individuales, empíricos y teóricos, y
estadísticos muestrales, empíricos y teóricos, y sobre los contrastes entre
valores empíricos, teóricos y críticos, la crítica racional de la realidad, la
estadística inferencial, ya sea en estudios intramedicionales, o intermedicionales,
en donde se ubicarían además los estudios comparados entre mediciones de
muestras o poblaciones diferentes.
La
estadística descriptiva, por tanto, se limita sólo y exclusivamente a la
descripción de las tendencias, siendo la descripción el proceso que, a través
de los estadísticos, detalla e informa de los principales rasgos o
característica de una tendencia, siendo la tendencia el comportamiento
estadístico, ya sea a nivel individual, sujeto u opción, o muestral, del conjunto
de elementos de la muestra, y siendo una información o detalle sólo estadístico
por cuanto sólo y únicamente se limita al estudio descriptivo de las mediciones cuantitativas, descartándose
cualquier valoración subjetiva o cualitativa, por cuanto la estadística es
catalogada un método particular de investigación cuantitativa, particular por
cuanto el método general o método
científico en general de las ciencias es el método deductivo, y en concreto en
las ciencias sintéticas o empíricas, el método hipotético deductivo, el cual a
su vez puede utilizar de diferentes técnicas o métodos de estudios
subordinados, entre ellos, entre los cuantitativos, la estadística, y dentro de
la estadística, si el objeto es sólo
informar o detallar de una determinada tendencia, sin someterla a una crítica
racional exhaustiva o comparación externa, la estadística descriptiva.
La principal
diferencia entre estadística descriptiva e inferencial, es que mientras la descriptiva
únicamente describe tendencias, individuales o muestrales, la naturaleza del
comportamiento estadístico de un sujeto u opción o muestra en general, la
estadística inferencial determina si una tendencia dada, sobre una hipótesis
empírica, es suficiente para ser
racional, pasando la hipótesis de ser empírica a provisionalmente objetiva, formando
parte de la teoría de la ciencia. La aceptación racional de la tendencia depende
de la política científica, que establece el criterio racional, razón crítica, a
la luz de la cual decide la aceptación provisional de las hipótesis empíricas
para ser racionales.
A su
vez la estadística descriptiva se diferencia de la estadística comparada por
cuanto si el objeto de la estadística descriptiva es únicamente describir, es
sobre los datos obtenidos de la descripción cuantitativa de varias realidades
sobre la que a posteriori la estadística comparada puede realizar comparaciones
cuantitativas sobre las diferentes realidades, dentro de las ciencias
comparadas en general, o en los modelos estructuralistas particulares de las
ciencias sociales, entendiendo por proceso de comparación la puesta en
contraposición o contrastes de dos o más entidades.
En
cualquier caso, ya sea el objeto último de un estudio la verificación de una
hipótesis particular, estadística inferencial, o la comparación, estadística comparada, sea
cual sea la intención última del modelo lo que es necesario de partida es una
descripción lo más fidedigna o fiel posible a la realidad, una descripción
fiable, lo cual depende del proceso de elaboración y síntesis de datos que
ofrece la estadística descriptiva, siendo por tanto la estadística descriptiva la
primera fase de estudio en cualquier proyecto de investigación cuantitativa,
racional o comparada.
Todo
proyecto de investigación cuantitativo de la realidad, ya sea para comparar
diferentes entidades o criticar racionalmente la realidad, debe partir de una
descripción estadística lo más isomorfa posible, lo cual dependerá del criterio o método
utilizado y la política aplicada a la selección muestral.
El motivo de
porque se exige fiabilidad en los estudios estadísticos se explica
ampliamente en el apartado 2 y apartado 7 de Introducción a la Probabilidad Imposible, la definición del error que se maneja en la obra parte de una definición dialéctica, de hecho,
Introducción a la Probabilidad Imposible es una obra en la cual se sintetizan
diferentes corrientes filosóficas, racionalismo crítico, positivismo y
materialismo dialéctico, y precisamente, si para el positivismo lógico la
identidad dialéctica de los opuestos propuesta por Hegel es un error, por
cuanto la proposición “A = B”, según
Wittgenstein, es lógicamente errónea, por cuanto únicamente es verdadera la
proposición “A = A”, en Probabilidad Imposible el error lógico se muestra
dialécticamente necesario, siendo el error lógico “A = B” lo que la política
científica se ve obligada a aceptar, si bien, sólo debe aceptar el menor posible.
La
razón por la cual la política científica
debe aceptar el error lógico, aunque sea el menor posible, se debe a la propia
contradicción dialéctica implícita en la antropología humana, el ser humano en
tanto que en ser en si, limitado por su propia forma o definición humana, entra
en contradicción frente a la infinitud de cualidades singulares de la verdadera
realidad real, la verdad pura e incognoscible, esa contradicción hace que
cualquier definición limitada sea necesariamente provisional, en un margen de error lógico o necesario entre la
definición de la realidad y la realidad misma, en esencia la contradicción
entre la verdadera realidad moral, la verdad moral del universo, y la verdad
moralmente política, la verdad política, lo que a juicio de la política científica
es verdad de acuerdo a su razón crítica, establecida por la política científica
de acuerdo a su ideología política.
La contradicción
entre verdad moral del universo, lo que realmente es verdad, y verdad política,
lo que la política científica alcanza a conocer o está dispuesta a aceptar, es
la base de las cíclicas contradicciones, crisis, y revoluciones científicas, en
la medida que dependiendo de los márgenes de error aceptados por los diferentes
paradigmas, dependiendo del grado de isomorfismo alcanzado en sus definiciones
de la realidad, el isomorfismo entre realidad política y realidad real, se
alcanzan niveles de estabilidad o progreso en el desarrollo de la ciencia y la
sociedad, la historia humana.
En
esencia la contradicción antropológica humana que tiene su origen en la
contradicción entre realidad humana limitada frente realidad fuera de sí
infinita, es en esencia la contradicción entre idea y realidad, en donde en
función del grado de isomorfismo entre ambas variables depende la estabilidad o
progreso de la historia social y de la ciencia.
Dentro
de los paradigmas cuantitativos, en los que cabe englobar Probabilidad Imposible, en la estadística descriptiva esta contradicción entre realidad para
sí, política, y realidad en sí, la verdad moral, queda manifestada en la
necesidad de aceptar un margen de error de representatividad muestral, ya sea
en estudios muestrales o poblacionales, en la medida que es el único margen de error que opera en la
estadística descriptiva, dado que es aquella parte o campo de la estadística
que no desarrolla una praxis crítica o comparada.
Estudios
muéstrales son aquellos que dado un universo no puede estudiar todo el universo
de forma completa, teniendo que seleccionar de ese universo una muestra de lo
que sucede, en donde, la contradicción dialéctica entre realidad en si y fuera
de sí queda manifestada en el momento esa muestra, que no es el universo, dice
representar a ese universo, cuando en realidad no lo es, de forma que se parte
de una identidad entre muestra, factor A, y universo factor B, en donde si se
dice que A representa a B, para describir B basta con describir A, en tanto que
si A es suficientemente representativo de B, se da entonces la igualdad dialéctica
entre A y B, dándose el error lógico de la contradicción dialéctica, en donde
siendo falso que “A = B”, es un error lógico dialécticamente necesario que la
política científica tiene aceptar, al menos en el menor margen de error para
ser lo más fiable posible.
En
el caso de la estadística inferencial el error lógico dialécticamente necesario
propio de la inferencia es la identidad dialéctica entre lo real, A y lo ideal
B, en donde la máxima hegeliana, según la cual todo lo real es ideal y todo lo
ideal es real, es sólo cierta parcial y provisionalmente, por que, en
Probabilidad Imposible, sólo y exclusivamente dentro del margen de error que
acepte la política científica se aceptará el isomorfismo idea y realidad,
porque más allá del error necesario es políticamente falso que todo lo real sea
ideal y viceversa.
Evidentemente
la forma en que en los ejemplos se designa A, a la realidad o la muestra, y B,
al universo o la idea, es arbitraria, se podría designar a A o B de forma
inversa, la única función que cumple designar de uno u otro modo a uno u otro factor,
A o B, es revelar la naturaleza del error en la lógica y la dialéctica para
entender la necesidad dialéctica del error lógico en la estadística y la
probabilidad.
Volviendo
a la estadística descriptiva, en los estudios muéstrales en Introducción a la Probabilidad Imposible se explica como la forma de cuantificar el margen de
error de representatividad muestral dependerá del tipo de universo, clasificándose
dos tipos de universos, de sujetos u opciones infinitos o de opciones limitadas,
de modo que en universos de sujetos la probabilidad de error de representatividad muestral vendrá dado por la función de inversión de N, 1/N, y
en universos de opciones limitadas por la inversión de las puntuaciones directas o frecuencias, 1/Σxi.
Estudios
poblacionales serán aquellos en donde si el universo viene definido por una
población durante una historia particular, y es posible el estudio completo de
toda la población en un momento particular de su historia, entonces no es
necesario, para ese momento de su
historia, la selección de una muestra, pudiendo estudiarse de forma completa la
población. Un ejemplo, si queremos estudiar la distribución de la renta per
capita en una sociedad, no es necesaria una selección muestral, directamente se
estudia a la población completa. Si tenemos una base de datos que contenga los
datos de toda la población de ballenas en el mundo, podríamos estudiar directamente
a toda la población de ballenas sin necesidad de una selección muestral previa.
Si dada una galaxia pudiéramos estudiar toda la población de estrellas que
componen esa galaxia, sería innecesario la selección de una muestra
representativa.
En
principio todo estudio poblacional se revela como independiente de la selección
muestral, salvo por un detalle, en el momento que conceptualizamos la población
como una población en un momento particular de su historia, lo que en realidad
estudiamos es una muestra de esa historia en particular, es decir, la
distribución de la renta per capita en una sociedad en un momento de su
historia es sólo una muestra de la evolución de la renta per capita en su
historia, posiblemente a lo largo de su historia la evolución de la
distribución de la renta per capita experimente cambios de los cuales cualquier
estudio puntual en un momento dado es sólo una muestra de su evolución en su
historia. Igualmente, si queremos estudiar el comportamiento de las ballenas,
no es igual el estudio que se haga de la población de ballenas en un momento u
otro de la historia, dependiendo del grado de extinción de las ballenas que ha
podido introducir cambios en su comportamiento alimenticio o en sus rutas
migratorias, e igualmente no es igual el comportamiento de una población de
estrellas dependiendo de su edad, no es igual el comportamiento que puedan
tener en sus primeros años de juventud o en su momento de mayor envejecimiento
próximas a producir estrellas de neutrinos, supernovas o agujeros negros. El estudio
de una población, al igual que el de una muestra cualquiera, en un momento de
la historia es el estudio de una muestra de la historia.
Si
bien los estudios poblacionales se diferencian de los estudios muestrales en
que en los estudios poblacionales la probabilidad de error de representatividad
muestral viene dado por la dimensión de la población, inversión de N o
inversión de las puntuaciones directas o frecuencias, a los estudios
poblacionales se les aplica los mismos procedimientos de estudio que a los muestrales.
Si
bien los estudios poblacionales se ubican en los universos de sujetos u
opciones infinitos, si el objeto de estudio son las puntuaciones directas de la
población, e infinitos en cuanto la historia natural, la evolución de lo que
sucede en el espacio tiempo, es la continua transformación infinita, de la
materia en energía y la energía en materia, dado que si ni se crean ni se destruyen
no tienen un origen o final, es una dialéctica infinita sin principio ni fin
histórico, en aquellos estudios poblacionales donde lo que se estudian sean
frecuencias, por ejemplo, en poblacionales humanas, la proporción de hombres o
mujeres en la sociedad o la tasa de votos por candidatos o delegados en una
democracia representativa, serían estudios poblacionales en un universo de
opciones limitadas.
La
estadística descriptiva, por tanto, al igual que la estadística inferencial o
comparada, está también sujeta a márgenes de error, sólo que el margen de error
de la estadística descriptiva es el margen de error entre la muestra o población y el universo y su
historia.
Dentro
de este margen de error, la estadística descriptiva pretende una información cuantitativa
lo más detallada posible de las tendencias reales observadas, a través de los
estadísticos, en estadística tradicional, de tendencia central o dispersión, en
Introducción a la Probabilidad Imposible, individuales o muestrales, empíricos
o teóricos.
El
motivo por el cual en Introducción a la Probabilidad Imposible se hace una
taxonomía alternativa a la tradicional, se debe a que, dialécticamente, en la
medida que los opuestos son idénticos, en realidad, llega un momento en la identidad matemática
entre dispersión y tendencia central donde esta clasificación es innecesaria y
carece de lógica, porque llega un momento en donde toda tendencia, incluida la
central, son estadísticos de dispersión, y viceversa, dado que son en realidad
lo mismo, dándose siempre más preferencia a la dispersión por cuanto
dialécticamente todo conocimiento es el conocimiento de las diferencias, la
primera y principal de ellas, la diferencia entre lo en si y lo fuera de sí, a
fin de asimilarlo, hacerlo para sí.
Mientras
para la estadística tradicional la tendencia central y la de dispersión son diametralmente
opuestas sin haber nada en común, en Probabilidad Imposible se da el caso que
el principal estadístico de tendencia central para la estadística tradicional,
la Media Aritmética, es una función que ejerce la inversión de N,1/N, que, en
Probabilidad Imposible desarrolla una multifuncionalidad en virtud de la cual
inversión de N, 1/N, es al mismo tiempo Media Aritmética y probabilidad de
dispersión teórica en universos de sujetos u opciones infinitos, o también
llamados para abreviar universos de sujetos o universos infinitos, es decir, lo
que para la estadística tradicional es sólo tendencia central, en Probabilidad Imposible es al mismo tiempo tendencia central y dispersión, de igual forma, si
para la estadística tradicional la Desviación Media es un estadístico de
dispersión del cual surgen los demás, Varianza y Desviación Típica, con la diferencia
que en Varianza se elevan al cuadrado las puntuaciones diferenciales, y en
Desviación Típica es simplemente raíz cuadrada de la Varianza, siendo en todo
caso estadísticos de dispersión, en Probabilidad Imposible la Desviación Media
es al mismo tiempo un estadístico de dispersión y de tendencia central, por
cuanto, en realidad la Desviación Media es la tendencia central del sesgo.
Otro
caso más de identidad dispersión y tendencia central es la moda, mientras para
la estadística tradicional es de tendencia central, el elemento de mayor frecuencia,
en la identidad sujeto u opción que hace Probabilidad Imposible, la moda, en
universos de opciones limitadas, sería la probabilidad empírica máxima o máxima
probabilidad empírica, o simplemente la máxima, a efectos de tener la mayor
frecuencia, al igual que en universos de sujetos la máxima sería para el sujeto
que tuviera la mayor probabilidad empírica por tener la mayor puntuación
directa, siendo la máxima la probabilidad empírica de aquel sujeto u opción que
tendría la mayor dispersión empírica individual posible, el mayor Nivel de Sesgo normal, luego dependiendo del punto de vista desde el cual se observe el
fenómeno de la moda, puede entenderse como un estadístico de tendencia central,
en función del cual se aglutina la mayor parte de la muestra, o de máxima
dispersión empírica posible, aquel que más se diferencia de la norma
estadística, la Media Aritmética o inversión de N.
A
partir de los estadísticos es como la estadística descriptiva señala como es la
tendencia particular de un determinado elemento de la muestra, sujeto u opción,
o la muestra en general, iniciando el estudio, en Introducción a la Probabilidad Imposible, desde el cálculo de
las probabilidades empíricas, la probabilidad teórica, los Niveles de
Sesgo normales, la Desviación Media o Típica, y, para los modelos normales, los
estadísticos teóricos de máxima tendencia, necesarios además para la crítica
racional en estadística inferencial, desde
el Máximo Sesgo Teórico Posible, Máximo Sesgo Empírico Posible, a la
Máxima Desviación Media Teórica Posible, y todos los demás, incluida la MáximaDesviación Típica Teórica Posible, expuesto todos ellos de forma sintética en el apartado 11 de Introducción a la Probabilidad Imposible, así como sus correlatos para el estudio de puntuaciones directas o
frecuencias en el apartado 12.
En
Introducción a la Probabilidad Imposible se diferencia entre modelos normales y
modelos omega en la medida que tendrán ideales y estadísticos diferentes. En líneas
generales los modelos normales son aquellos en donde la dispersión puede
oscilar entre cero o máxima, calculándose la máxima dispersión según sea
individual o muestral, la máxima dispersión individual puede ser empírica o
teórica, según sea Máximo Sesgo Empírico Posible o Máximo Sesgo Teórico
Posible, y la máxima dispersión muestral posible mediante la Máxima Desviación
Media Teórica Posible o la Máxima Desviación Típica Teórica Posible, y a nivel
empírico la máxima dispersión muestral empírica es la Desviación Intermedia,
igual a dividir entre dos la diferencia de la máxima menos la mínima, siendo la
máxima igual a la máxima probabilidad empírica y siendo la mínima igual a la probabilidad
empírica mínima. Los modelos normales son aquellos en donde el objeto de
estudio puede variar entre igualdad de oportunidades o sesgo, sean estudios de
sesgo positivo o negativo, siempre y cuando en los estudios de sesgo de todos
los sujetos u opciones de N sólo halla uno que sea el único ideal posible.
Si
dentro delos N sujetos u opciones hay más de un sujeto u opción ideal, en igualdad
de ideal, entonces será un modelo omega, aquellos en donde la magnitud de los
sujetos u opciones ideales dentro de N varía entre dos y N menos uno, pero en todo caso hay más de un ideal
posible, dado que en caso contrario sería un modelo normal donde hubiera un
único ideal, y en cualquier caso nunca puede toda N ser igual de ideal, dado
que si toda N es igual de ideal entre sí entonces sería un modelo normal de
igualdad de oportunidades. En Introducción a la Probabilidad Imposible los
modelos omega tendrán sus propios estadísticos ideales.
La
estadística descriptiva, independientemente del tipo de universo, infinito o
limitado, o modelo de estudio , normal u omega, es siempre aquel estudio cuantitativo de la
realidad que únicamente se limita a dar la información más detallada posible de
lo que sucede, sin pretensión de validar idea previa alguna o hacer comparaciones, y en este sentido si
bien el método general de la ciencia es deductivo, en los métodos descriptivos
su único propósito es la inducción de lo que sucede de la simple observación de
los hechos, si bien la inducción no es suficiente para demostrar nada, dado que
no se somete a la crítica racional, objeto ya de la estadística inferencial
sobre el establecimiento previo de una tesis, idea todavía no validada síntesis
de hechos observados y esquemas e ideas previas, estas últimas a su vez
síntesis de ideas y esquemas de diversa naturaleza, ya sean las teorías previas
provisionalmente aceptadas por la ciencia, o ideas filosóficas, políticas, o
subjetivas, dando lugar dicha síntesis, entre lo observado y lo a priori, a una deducción lógica, una hipótesis que debe
ser puesta a prueba en la práctica en el contraste de ideas o crítica racional,
objeto de la estadística inferencial .
En
cualquier caso, todo proyecto de investigación, sea racional, contraste de
hipótesis, o comparado, la comparación de diferentes estadísticas, deberá tener
por primera fase del estudio la estadística descriptiva, sobre la que elaborar
la colección de mediciones, datos e informaciones, para criticar o comparar
posteriormente la realidad. Si bien otro uso de la estadística descriptiva es
su utilización inductiva, la descripción cuantitativa de la realidad para una
primera exploración inicial de una serie de hechos o fenómenos, de la que
inducir qué está sucediendo, para posteriormente, sobre la síntesis de la
inducción y los esquemas e ideas previas, de la ciencia, la filosofía y la
política, o subjetivas del investigador, deducir hipótesis que posteriormente sean
contrastadas, tal como se explica en el apartado 10 de Introducción a la
Probabilidad Imposible.
En
resumen, la estadística descriptiva es la primera forma y más intuitiva de la
estadística, que tiene por objeto la descripción de la tendencia, es decir, la
descripción del comportamiento de lo que sucede en una muestra o población, para
en fases posteriores, hacer comparaciones y estudios racionales.
Rubén
García Pedraza, Madrid a 31 de agosto del 2013