Se
dirá que hay sesgo estadístico o de probabilidad cuando el comportamiento de
cualquier elemento en un conjunto no se ajusta a un modelo de igualdad de oportunidades, ya sea porque no sigue un comportamiento aleatorio al azar o no
se rige por el ideal igualdad de condiciones.
Si en
un juego de azar, por ejemplo, en la ruleta se observa mayor frecuencia de un
número frente los demás, o al lanzar una moneda al aire hay más caras que
cruces o viceversa, o al lanzar unos dados al aire se repite con mayor
frecuencia una combinación, se dice que
hay sesgo, al no haber un verdadero comportamiento en igualdad de oportunidades
que demuestren que la dinámica de juego sea verdaderamente aleatoria, y la
ruleta, la moneda, o los dados, se encuentran sesgados, si bien, desconocemos
el motivo del sesgo, ya sea porque los juegos han sido deliberadamente trucados,
o es un sesgo debido a su propio desgaste natural, para lo que serían
necesarias investigaciones ulteriores, sobre si el sesgo es intencionado o
debido a procesos naturales.
En
una investigación sobre el estudio de componentes químicos en determinadas
formaciones geológicas, capas terrestres, cordilleras, glaciares, fallas, se
observa una mayor frecuencia de determinados elementos frente a otros, se dirá
que la presencia de dichos elementos en las formaciones materiales estudiadas
no es aleatoria, habiendo un sesgo positivo de dichos elementos químicos en las
muestras, si bien desconocemos el motivo por el cual dichos elementos químicos
forman parte de dichas estructuras, ya sea por procesos naturales graduales,
cataclismos terrestres, glaciaciones, volcanes, o interferencias ajenas a la
dinámica de nuestro planeta, grandes meteoritos, radiaciones de supernovas, o
por acción directa o indirecta de otros cuerpos celestes, cometas, lluvias de
estrellas fugaces, etc... que sería motivo de investigaciones posteriores, el origen
más probable o causas posibles de dichas estructuras materiales.
En
un estudio climático de estudiarse la distribución de las precipitaciones en
diferentes regiones del planeta, y observarse un sesgo negativo importante de
lluvias en desiertos, frente un sesgo positivo importante de lluvias en climas
tropicales, e importantes tasas de nieve en regiones árticas y antárticas,
evidentemente se observa una estructura no aleatoria de la distribución delas
precipitaciones y acumulación de hielo y nieve, en donde las posibles causas deberán
investigarse en la propia dinámica de cada clima.
De
hacerse una investigación social cuantitativa sobre tendencias sociales, intención
de voto, opinión pública sobre situación financiera, cambio climático, hambrunas
en países subdesarrollados, y observase
una inclinación favorable hacia determinados partidos o ideas políticas, valoración
positiva o negativa de la situación económica, preocupación por el cambio climático, y malestar
por las hambrunas, se habrá observado una estructura social formada por
diferentes tipos de sesgo, sesgo social positivo a determinadas tendencias e
ideas políticas, económicas, ecológicas o humanitarias, si bien para conocer en
profundidad de forma objetiva los motivos por las que se manifiesta dicha
estructura social serán necesarias nuevas investigaciones que indaguen sobre el
posible origen de dichas tendencias.
La
estructura de un sistema, natural o social, es una dinámica no lineal definida por
los flujos de distribución estadística en sus variables, en donde según la
distribución muestre una dinámica de igualdad o sesgo, la estructura del
sistema cambia. El posible origen o causa probable por la que los juego dinámicos
se transforman se puede deber a múltiples factores accidentales o contingencias
capaces de producir patrones de regularidad estable, tal como se explica en el
apartado 13 de Introducción a la Probabilidad Imposible.
Sesgo
estadístico o de probabilidad es la diferencia entre el valor real en la
medición de cualquier elemento de una muestra, y el que debería tener en
igualdad de oportunidades. Dicha diferencia en la estadística tradicional se
llama puntuación diferencial, y es igual a la diferencia entre el puntaje de
cada elemento menos la media aritmética, siendo la media aritmética el valor de
cada elemento en auténticas condiciones de igualdad.
En
Probabilidad Imposible a cada elemento de la muestra se llama sujeto u opción,
y al puntaje de cada sujeto u opción se llama puntuación directa o frecuencia,
de forma que para la estadística tradicional, lo que en Probabilidad Imposible
se llama primer método, la puntuación diferencial será igual a la puntuación
directa de sujeto u opción menos la media aritmética, siendo la media
aritmética el promedio de todas las puntuaciones directas o frecuencias.
Para
el estudio del campo de la estadística de la probabilidad o probabilidad estadística, la teoría de Probabilidad Imposible desarrolla diferentes métodos sintéticos,
uno de ellos el Segundo Método, donde las puntuaciones directas o frecuencias
se transforman a un sistema de probabilidades empíricas, igual a la puntuación directa
o frecuencia de cada sujeto u opción entre la suma total de todas de todas las puntuaciones
directas o frecuencias, cuya diferencia, de la probabilidad empírica, menos la
probabilidad teórica será igual al Nivel de Sesgo, siendo la probabilidad
teórica aquella probabilidad que teóricamente debería tener cada sujeto u
opción de darse verdaderas condiciones de igualdad, ya sea porque la igualdad
de oportunidades sea un objetivo de la
política científica, o porque en un proceso o sistema natural lo verdaderamente
aleatorio es que todo ocurra en igualdad de oportunidades aleatoriamente. La
probabilidad teórica será igual a la media aritmética de las probabilidades
empíricas, que será igual a la inversión de N.
Los
estudios de sesgo serán aquellos cuyo objetivo sea el comportamiento
diferencial de las probabilidades empíricas de los sujetos u opciones respecto
la probabilidad teórica, lo cual es lo mismo que decir que el objeto de los
estudios de sesgo es el comportamiento diferencial de los sujetos u opciones
entre sí. En el momento que tan sólo un único sujeto u opción se desmarque del
comportamiento en igualdad de oportunidades, se generará un sesgo, positivo o negativo, que deberá ser contrarrestado por el sesgo inverso, negativo o
positivo, de uno o más sujetos u opciones diferentes.
El
sistema de probabilidad empírica en realidad lo que mide es el valor
proporcional de la puntuación directa o frecuencia de cada sujeto u opción frente
a la puntuación directa o frecuencia de los demás sujetos u opciones, lo cual
quiere decir que realmente lo que mide la probabilidad empírica no es si un
sujeto tiene más o menos puntuación directa o frecuencia, lo que mide es la
proporción de dicha probabilidad empírica frente las demás, y lo hace en forma
de cociente, puntuación directa de sujeto u opción entre la suma de todas las puntuaciones
directas o frecuencias de la muestra.
En
el momento que tan sólo un sujeto u opción, por mínima que sea, tiene una
diferencia de su probabilidad empírica menos la teórica, generando una
diferencia positiva, sesgo positivo, si la probabilidad empírica es superior a
la teórica, o creando una diferencia negativa, sesgo negativo, cuando la
probabilidad empírica es inferior a la teórica, automáticamente, en el momento
que se produce un sesgo, automáticamente hace que uno o más sujetos u opciones
del resto de la muestra generen un sesgo inverso de igual magnitud.
Siempre
que se produzca un sesgo, positivo o negativo, automáticamente se creará un
sesgo opuesto dela misma magnitud, ya sea porque al menos un sujeto u opción
diferente genere un sesgo opuesto de igual magnitud al sesgo de ese otro sujeto
u opción, o varios sujetos u opciones generen en suma un sesgo opuesto de
magnitud idéntico al de aquel otro sujeto u opción.
Es
decir, si el sujeto A genera un sesgo positivo, o bien el sujeto B genera un
sesgo negativo en valor absoluto de igual magnitud al sesgo positivo de A, o la
suma del sesgo negativo de los sujeto B y C es en términos absolutos una
magnitud de sesgo equivalente a la magnitud del sesgo de A. Y a la inversa,
siempre que A genere un sesgo negativo, o bien el sesgo positivo de B o el
sesgo positivo de B y C será de igual magnitud al valor absoluto del sesgo
negativo de A.
El
motivo por el cual siempre, en términos absolutos, habrá tanto sesgo positivo
por sesgo negativo y viceversa, y en el momento que, en términos absolutos, uno
o más sujetos u opciones generen un sesgo positivo o negativo habrá en suma un
sesgo negativo o positivo de igual magnitud por uno o más sujetos u opciones
diferentes, es porque el Nivel de Sesgo, en el Segundo Método, puntuación
diferencial en el primer método, se calcula sobre la media aritmética, de forma
que si la media aritmética es sólo el promedio de las puntuaciones directas o
frecuencias, o las probabilidades empíricas, en el momento que un sujeto u
opción tenga un valor empírico inferior o superior a la media aritmética, dicho
diferencial será compensado por uno o más sujetos u opciones cuyo valor
empírico sea superior o inferior a la media aritmética, de forma que en la
muestra siempre habrá el mismo valor
absoluto de magnitud de sesgo positivo y de sesgo negativo.
En el
Segundo Método la suma de todos los todos sesgos positivos de la muestra
siempre será idéntica a la suma del valor absoluto de todos los sesgos
negativos de la muestra, lo que en el primer método sería equivalente a decir
que la suma de las puntuaciones diferenciales de signo positivo de la muestra
será de una magnitud equivalente a la suma de los valores absolutos de las
puntuaciones diferenciales de signo negativo. Debido a la equivalente magnitud
de los sesgos, positivos o negativos, o puntuaciones diferenciales, positivas o
negativas, es por lo que el cálculo de la Desviación Media sólo puede hacerse
sobre el sumatorio de los valores absolutos de las puntuaciones diferenciales,
en el primer método, o sumatorio de los valores absolutos de los Niveles de
Sesgo en el Segundo Método, o bien, para neutralizar el efecto del signo dichos
diferenciales se elevan al cuadrado para el cálculo de la Varianza, o la
Desviación Típica, raíz cuadrada de la Varianza.
En
la medida que de no sumarse los valores absolutos de los sesgos entonces el
sumatorio sería igual a cero, dado que habría la misma magnitud de sesgo
positivo que de negativo, esto lo que indica es que, sea el tipo de muestra que
sea , si dividimos entre dos el sumatorio del valor absoluto de todos los
sesgos, sería igual a la suma de todos los sesgos positivos, o la suma de todos
los sesgos negativos, dado que, bajo esa estructuración del sesgo, de haber
sólo en la muestra un solo sujeto u opción de sesgo positivo, y todos los
demás, N menos uno, sesgo negativo, o viceversa, de haber en la muestra un solo
sujeto u opción de sesgo negativo, y todos los demás, N menos uno, sesgo
positivo, el sesgo de ese único sujeto u opción sería igual a dividir entre dos
el sumatorio de los valores absolutos de todos los sesgos, siendo dicho
sumatorio el Sesgo Total.
Máximo Sesgo Empírico Posible = Σ / ( p(xi) – 1/N ) / : 2
Σ /
( p(xi) – 1/N ) / = Sesgo Total
Los
estudios de sesgo, a diferencia de los estudios de igualdad de oportunidades,
serán aquellos en donde el objetivo ideal de la política científica es la identificación
de valores diferenciales en el
comportamiento de la naturaleza o la sociedad.
Los
estudios de sesgo en Introducción a la Probabilidad Imposible se explican con
más detalle en el apartado 10, si bien a lo largo de toda la obra se exponen
diferentes modelos de crítica racional para este tipo de estudios, ya sea a
nivel intramedicional e intermedicional, así como modelos de crítica racional
en la predicción empírica, ya sea en forma de proyecciones o pronósticos, según
se estudie sobre variaciones posibles o reales, apartado 17.
Dentro
de Probabilidad Imposible se identifican los siguientes modelos de estudios de
sesgo, en función sea en modelos normales o modelos omega.
Modelos
normales son aquellos donde la dispersión empírica puede oscilar entre cero o
máxima, en donde la dispersión empírica tiende a cero entonces es un modelo de
tendencia a igualdad de oportunidades, y si la dispersión empírica tiende a
máxima entonces es un modelo de máxima dispersión. Dentro de los modelos
normales habrá que diferenciar entre aquellos estudios que tengan por objeto el
estudio del sesgo positivo de un sujeto u opción ideal, mientras los demás
tienden a probabilidad empírica cero, por ejemplo, en una batería de ítems si
por cada ítem sólo hay una opción correcta entonces lo ideal es que esa opción
ideal sea la única que tenga probabilidad empírica distinta de cero, mientras
todas las demás deberían tender a cero. A mayor incremento de la probabilidad
empírica del sujeto u opción ideal, en detrimento de los demás sujetos u
opciones, la dispersión empírica tenderá a Máxima Desviación Media Teórica Posible, luego a Máxima Varianza Teórica Posible y a Máxima Desviación Típica Teórica Posible.
En
relación a los estudios de sesgo negativo en modelos normales, en los estudios
normales del sesgo positivo que integren un solo sujeto u opción ideal, al
mismo tiempo que se estudia el sesgo positivo del ideal, compaginar el estudio
de sesgo positivo con el estudio de la evolución del sesgo negativo de los
demás sujetos u opciones no ideales.
Y
otro modelo muy diferente de estudio de sesgo negativo serían las muestras de
ceros, aquellos en donde el ideal de la política científica sea la probabilidad
empírica cero de toda cualidad o variable no ideal en toda una muestra, por
ejemplo, en farmacología experimental lo ideal es que ante un nuevo fármaco todos
los pacientes de una muestra bajo medicación desarrollen cero síntomas de la
enfermedad que están siendo tratados, luego si el tratamiento es el adecuado al
final del estudio la probabilidad empírica de desarrollo de síntomas en todos
los pacientes debería ser igual a cero, el resultado final debería ser una
muestra de cero síntomas, una muestra de ceros.
En
este tipo de estudios, en donde lo ideal sea la muestra de ceros, la
complejidad radica en que a medida que la muestra tiende a cero, simplemente con
que halla el más mínimo sujeto u opción que tenga probabilidad empírica
distinta de cero, entonces la dispersión empírica sería máxima. Únicamente se
estabilizaría la dispersión en inversión de N cuando la probabilidad empírica
de absolutamente toda la muestra fuera igual a cero, porque entonces la
Desviación Media sería igual a inversión de N, tal como se explica en el
apartado 9 de Introducción a la Probabilidad Imposible.
Los
estudios de muestras de ceros se consideran estudios de sesgo negativo porque si
se alcanza una muestra de ceros, la Desviación Media siempre será igual a
inversión de N, porque el Nivel de Sesgo de todo sujeto u opción sería igual a
menos inversión de N,” - 1/N”.
Los
modelos omega serían aquellos en donde dada una muestra de N sujetos u opciones
no necesariamente tiene porque haber un único sujeto u opción ideal a
incrementar el sesgo positivo, habiendo en los modelos omega la posibilidad de
más de un sujeto u opción ideal, siempre y cuando la magnitud de sujetos u
opciones ideales sea superior a uno e inferior a N. Modelos omega son aquellos
en donde la magnitud de sujetos u opciones ideales puede variar entre dos y N
menos uno.
El
motivo por el cual los ideales en N de los modelos omega es a partir de dos
sujetos u opciones ideales es porque si sólo hubiera uno entonces sería un
modelo normal de dispersión máxima, y si toda N fuera igual de ideal sería un
modelo normal de igualdad de oportunidades, de manera que siempre y cuando
halla al menos un sujeto u opción no ideal en el cual se aumente el sesgo
negativo, y un mínimo de dos sujetos u opciones ideales de aumento del sesgo
positivo, una magnitud de ideales entre dos y N menos uno, será un modelo
omega, en donde se podrá estudiar o bien el sesgo positivo de los sujetos u
opciones ideales en función dela probabilidad ideal, o se podrá estudiar el
sesgo negativo de los sujetos u opciones no ideales.
Los
estudios de sesgo, sea en modelos normales o en modelos omega, se diferenciarán
de los modelos de igualdad de oportunidades, en la medida que su objetivo final
es el incremento de la dispersión, ya sea, en modelos normales,a dispersión
máxima o igual a inversión de N en muestras de ceros, o dispersión ideal en los
estudios omega. El aumento de la dispersión se medirá en función dela
diferencia entre el comportamiento real de los elementos y lo que debería ser
en igualdad de oportunidades, en donde dicha diferencia en el Segundo Método se
estudia en el Nivel de Sesgo, probabilidad empírica de sujeto u opción menos
teórica, y en función del signo del
diferencial se definirá el tipo de sesgo, positivo o negativo, habiendo
diferentes modelos de estudio según los objetivos de la política científica, que
dependiendo de la magnitud de sus ideales en N determinará el tipo de modelo,
normal u omega.
Rubén
García Pedraza, Madrid a 8 de marzo del 2014