Se dice que algo está sesgado cuando
muestra un comportamiento diferente al azar. Si lanzamos una moneda al aire, y
el número de caras o de cruces es diferente al cociente de dos entre número
total de lanzamientos, la moneda está sesgada a favor de aquella opción, cara o
cruz, que demuestre mayor ocurrencia. Si en una estadística de natalidad el
número de nacimientos de niños y niñas es diferente al cociente de dos entre
número total de nacimientos, hay una tendencia sesgada a más niños o niñas, según en uno u otro género halla
mayor tasa de nacimientos. Si en una serie de pruebas de diferentes
tratamientos médicos para una misma enfermedad, uno u otro tratamiento logra
que un mayor número de pacientes se reponga fuera de lo que sería esperable por
azar, el tratamiento que logre mejores resultados demuestra mayor sesgo positivo que aquellos cuyo número de pacientes repuestos sea inferior. Si en un
examen a una serie de alumnos la distribución de puntuaciones difiere a lo que
sería una distribución aleatoria hay una distribución sesgada, en donde el
mayor sesgo positivo será de los alumnos que obtengan mejores puntuaciones.
Se dirá sesgo a todo comportamiento que
difiera de una distribución aleatoria por azar, y la tendencia natural del azar
es a la distribución en torno la media aritmética en ausencia de condicionantes
que determinen otro comportamiento diferente, todo comportamiento que difiera
de lo que sería un comportamiento aleatorio, entorno a la media aritmética,
será un comportamiento sesgado.
En Probabilidad Imposible se llamará
sesgo a la dispersión estadística que genere cualquier tipo de comportamiento diferente
al esperable por azar, y la forma en que se mide el grado de sesgo de cada
sujeto u opción en Probabilidad Imposible es a través del Nivel de Sesgo, igual
a probabilidad empírica menos probabilidad teórica.
Nivel de Sesgo= p(xi) – 1/N
p(xi)= xi/ ∑xi = probabilidad empírica
1/N= ∑xi/N = probabilidad teórica
N= número de sujetos u opciones de la
muestra
xi= puntuación directa o frecuencia
Lo que para la teoría de Probabilidad Imposible es Nivel de Sesgo en la estadística tradicional se llama puntuación
diferencial, sólo que mientras la puntuación diferencial lo que contrasta es la
puntuación directa y la media aritmética de las puntuaciones directas, y lo que
Probabilidad Imposible contrasta en términos diferenciales en el Nivel de Sesgo
son dos probabilidades estadísticas, la probabilidad empírica menos la teórica.
En la medida que el estudio de la realidad a través de las probabilidades
estadísticas que desarrolla Probabilidad Imposible genera un nuevo método de estudio, al método de estudio que tiene su base en los conceptos de
probabilidad empírica y teórica, se denominará Segundo Método, para
diferenciarlo del Primer Método que sería la estadística tradicional.
La probabilidad empírica mide la
tendencia individual real de cada sujeto u opción, mientras la probabilidad
teórica indica señala el verdadero comportamiento en igualdad de condiciones,
en ausencia de cualquier otro factor salvo el azar. La diferencia entre el
comportamiento real y el aleatorio, mide el grado de dispersión real del sujeto
u opción frente al teórico en igualdad de oportunidades. De este modo lo que
realmente mide el Nivel de Sesgo es la dispersión entre la tendencia individual
empírica y lo que en función de la magnitud de la muestra, N, debería ser la
tendencia teórica en ausencia de sesgo, la inversión de N, 1/N.
Una vez calculado la dispersión individual se puede obtener una estimación de la dispersión muestral , lo que
precisa de la suma de todos los Niveles de Sesgo, una operación no exenta de
cierta complicación, por cuanto si el resultado de la diferencia de
probabilidad empírica menos probabilidad teórica un resultado cuyo signo,
positivo o negativo, depende de que la probabilidad empírica sea mayor o menor
que la teórica, y se da el caso que la inversión de N es un algoritmo
multifuncional, por cuanto desempeña funciones variadas, entre ellas la función
de probabilidad teórica, además de media aritmética de las probabilidades
empíricas, por cuanto la inversión de N es un estadístico de tendencia central,
la suma de todos los Niveles de Sesgo que tengan sesgo negativo tendrá un
resultado equivalente a la suma de todos los Niveles de Sesgo de sesgo
positivo. A este fenómeno de la identidad entre la suma de todos los Niveles de
Sesgo positivo de una muestra y la suma de todos los Niveles de Sesgo negativo
de esa misma muestra, en Probabilidad Imposible se denomina fenómeno
producto de la bondad natural, por cuanto naturalmente los sesgos tienden a
compensarse, es decir, el volumen de sesgo positivo de una muestra será siempre
igual al volumen de sesgo negativo, y viceversa, el volumen de sesgo negativo
siempre será igual al volumen de sesgo positivo. Debido a este fenómeno de
bondad natural, y es que los sesgos positivos y negativos tienden a
compensarse, si se suma todos los Niveles de Sesgo, positivos y negativos, de
todos los sujetos u opciones de una misma muestra, el resultado del sumatorio de
todos los Niveles de Sesgo sería igual a cero.
∑ (p(xi) – 1/N) = 0
Fenómeno análogo al que sucede en la
estadística tradicional, el Primer Método, con la puntuación diferencial, donde
el sumatorio de todas las puntuaciones diferenciales sería igual a cero.
∑ (xi – µ) = 0
A fin de salvar este obstáculo la
estadística tradicional, el Primer Método, establece dos mecanismos, de un lado
el sumatorio del valor absoluto de todas las puntuaciones diferenciales, o la
elevación al cuadrado de las puntuaciones diferenciales. Una vez salvado este
escollo, para que el sumatorio no sea igual a cero, a continuación el Primer
Método se limita simplemente al cociente del sumatorio, ya sea de los valores
absolutos o cuadrados de las puntuaciones diferenciales, entre la frecuencia
total. Al cociente de dividir entre frecuencia total el sumatorio de los
productos de valores absolutos de las puntuaciones diferenciales por la
frecuencia de su puntuación directa se llamará Desviación Media, y si en lugar
de considerar el valor absoluto de la puntuación diferencial se calcula sobre
su cuadrado se llamará Varianza.
Desviación Media = ∑ [ / (xi – µ) / f ] : F
Varianza = ∑ [ (xi – µ)² f ] : F
F= frecuencia total
f= frecuencia de cada puntuación
directa
En el Segundo Método de Probabilidad Imposible el modo de salvar el problema que supone que el sumatorio de los
Niveles de Sesgo teniendo en cuenta el signo sea igual a cero es el mismo que
en el Primer Método, ya bien el sumatorio de los valores absolutos de los
Niveles de Sesgo sin tener en cuenta el signo, lo que sería en sentido estricto
el Sesgo Total, o bien el sumatorio de los Niveles de Sesgo al cuadrado, que en
tal caso nos da una estimación cuadrática del Sesgo Total.
Sesgo Total = / ( p(xi) – 1/N ) /
Sesgo Total cuadrático = ( p(xi) – 1/N )²
El Sesgo Total de este modo sería la
suma del valor absoluto de todos los Niveles de Sesgo, y nos daría una
percepción de la cantidad de sesgo en una muestra. Si ya de por si tenemos dos
monedas diferentes, y sobre un mismo número de lanzamientos en cada moneda,
calculamos el Sesgo Total acumulado al lanzar cada moneda, y una moneda
demuestra mayor Sesgo Total que la otra, se podría decir sin lugar a dudas que
una moneda demuestra mayor sesgo que la otra. Si después de un examen a dos
grupos de alumnos diferentes, un grupo de alumnos demuestra un mayor nivel de
Sesgo Total que el otro grupo, entonces la dispersión dentro de ese grupo es ya
de por sí mayor que el del otro grupo que presenta menor Sesgo Total, lo cual
significaría que se darían condiciones de igualdad de oportunidades entre ambos
grupos de alumnos, de modo que cabe sospechar que en el grupo de alumnos que
tiene mayor Sesgo Total hay más diferencias significativas entre los alumnos de
mayor y menor rendimiento.
Una vez calculado el Sesgo Total el
Segundo Método de Probabilidad Imposible nos permite dos cálculos diferentes a
partir de este cómputo, o bien Sesgo Total entre dos igual a Máximo Sesgo Empírico Posible, o bien Sesgo Total entre N igual a Desviación Media.
Empecemos el análisis del Máximo Sesgo
Empírico Posible, igual a Sesgo Total entre dos. En la medida que el Sesgo
Total es la suma del valor absoluto de todos los Niveles de Sesgo, positivos o
negativos, si se sumara todos los Niveles de Sesgo positivo y el valor absoluto
de todos los Niveles de Sesgo negativos, el resultado sería igual al Sesgo
Total. El hecho que el Sesgo Total sea igual a la suma de todos los sesgos
positivos o negativos, y que por la propia bondad natural de la inversión de N,
el valor obtenido de la suma en términos absolutos de los sesgos negativos sea
idéntico al obtenido de la suma de todos los sesgos positivos, implica
necesariamente que el 50% del Sesgo Total es equiparable a la suma de todos los
Niveles de Sesgo positivo, o el 50% del Sesgo Total es equiparable a la suma de
todos los Niveles de Sesgo negativo. Dado que el 50% del Sesgo Total es la suma
de los Niveles de Seso positivos, y el otro 50% es la suma del valor absoluto
de los Niveles de Sesgo negativo, y se da el caso que el cálculo del 50% del
Sesgo Total es equiparable a dividir entre dos el Sesgo Total, entonces, si se
divide el Sesgo Total entre dos se obtiene un valor idéntico al que se
obtendría de o bien sumar todos los Niveles de Sesgo positivo, o todos los
Niveles de Sesgo negativo.
Ahora bien, el hecho que Sesgo Total
entre dos sea igual a la suma de todos los Niveles de Sesgo positivos, o el
términos absolutos de todos los Niveles de Seso negativo, no implica en modo
alguno que la mitad de la muestra, la mitad de N, sea de sesgo positivo o
negativo, porque se puede dar el caso que bajo condiciones de máxima tendencia,
de toda N un único sujeto u opción tenga puntuación directa o frecuencia
distinta de cero, mientras todos los demás sujetos u opciones, N menos uno,
tengan puntuación directa o frecuencia igual a cero, lo que implicaría entonces
que el Nivel de Sesgo positivo de ese único sujeto u opción distinto de cero
sería idéntico a la suma de los valores absolutos de todos los Niveles de Sesgo
cuya puntuación directa o frecuencia sea igual a cero. De lo que se concluye
que, independientemente de que dentro de N el número de sujetos u opciones que
tengan sesgo positivo o negativo oscile entre uno y N menos uno, nunca y
absolutamente nunca el Nivel de Sesgo de ningún sujeto u opción puede ser
superior al cociente de Sesgo Total entre dos, motivo por el cual al Sesgo
Total entre dos en el Segundo Método de Probabilidad Imposible se conocerá por
Máximo Sesgo Empírico Posible.
Máximo Sesgo Empírico Posible=
∑ / ( p(xi) – 1/N ) / : 2
∑ / ( p(xi) – 1/N ) / : 2
En la medida que en el Primer Método,
la estadística tradicional, normalmente el problema que supone la identidad a
cero del sumatorio de puntuaciones diferenciales se salva normalmente a través
de la elevación al cuadrado de los diferenciales, a fin de adaptar el Segundo
Método al Primer Método, el cálculo del Máximo Sesgo Empírico Posible puede ser
también cuadrático.
Máximo Sesgo Empírico Posible
Cuadrático=
∑ ( p(xi) – 1/N )² : 2
∑ ( p(xi) – 1/N )² : 2
Y a fin que en los contrastes frente
los Niveles de Sesgo normales y corrientes sea de forma típica, la posibilidad
de la raíz cuadrada del Máximo Sesgo Empírico Posible Cuadrático daría lugar al
Máximo Sesgo Empírico Posible Típico.
Máximo Sesgo Empírico Posible
Típico=
∑ √[ ( p(xi) – 1/N )² ] : 2
∑ √[ ( p(xi) – 1/N )² ] : 2
El Nivel de Sesgo sería un estimador
de la dispersión empírica individual, el Sesgo Total ya sería un estimador de
la dispersión estadística muestral, que dividido entre dos sería igual al
Máximo Sesgo Empírico Posible, ofreciendo además las variantes de Máximo Sesgo
Empírico Posible Cuadrático o Típico, para adaptarlo a la estadística
tradicional. En cualquier caso tal como se reitera en Introducción a laProbabilidad Imposible, estadística de la probabilidad o probabilidad estadística, en Probabilidad Imposible siempre se prefiere la utilización de
los diferenciales entre probabilidades en términos absolutos por cuanto no
alteran el valor de las diferencias, siendo muy importante conservar los datos
lo más fielmente posible a la realidad a
fin de reducir los márgenes de error acumulados en las operaciones.
Además del Máximo Sesgo Empírico
Posible, otra estimación de dispersión muestral que nos permite calcular el
Sesgo Total es la propia Desviación Media de las probabilidades estadísticas de
la muestra, en donde Sesgo Total entre N, o Sesgo Total por inversión de N,
1/N, sería igual la Desviación Media de las probabilidades empíricas de los
sujetos u opciones.
Desviación Media =
∑ /( p(xi) – 1/N )/ : N =
∑ /( p(xi) – 1/N )/ · 1/N
∑ /( p(xi) – 1/N )/ : N =
∑ /( p(xi) – 1/N )/ · 1/N
En la medida que la Desviación Media
es igual a Sesgo Total por inversión de N, e inversión de N es igual a la
distribución teórica por azar, entonces la Desviación Media es igual a sesgo
por azar, es decir, la Desviación Media lo que mide es cual debería ser la
distribución del Sesgo Total de la muestra por azar, es decir, teóricamente
dado ese nivel de Sesgo Total cual debería ser la porción de sesgo que debería
corresponder a cada sujeto u opción de distribuirse el Sesgo Total en igualdad
de condiciones entre todos los sujetos u opciones. Precisamente es a partir de
la comprensión de la naturaleza de la Desviación Media, sesgo por azar, donde
en Introducción a la Probabilidad Imposible, estadística de la probabilidad o probabilidad estadística, dentro de la estadística inferencial intramedicional,
en el apartado 11 se explican una serie de modelos de pruebas de contraste de
hipótesis para la crítica racional de los datos comparando los Niveles de Sesgo
individuales y la Desviación Media.
A fin de adaptar el Segundo Método de
Probabilidad Imposible a la estadística tradicional, el Primer Método, en lugar
de Desviación Media de las probabilidades empíricas se puede calcular la
Varianza de las probabilidades empíricas, igual a dividir entre N, o producto
por inversión de N, el sumatorio de los Niveles de Sesgo al cuadrado.
Varianza= S² =
∑ ( p(xi) – 1/N )² : N =
∑ ( p(xi) – 1/N )² · 1/N
∑ ( p(xi) – 1/N )² : N =
∑ ( p(xi) – 1/N )² · 1/N
Y la raíz cuadrada de la Varianza
igual a la Desviación Típica de las probabilidades empíricas.
Desviación Típica= S =
∑ √ [ ( p(xi) – 1/N )² ] : N =
∑ √ [ ( p(xi) – 1/N )² ] · 1/N
∑ √ [ ( p(xi) – 1/N )² ] : N =
∑ √ [ ( p(xi) – 1/N )² ] · 1/N
El modelo de estudio que propone
Probabilidad Imposible en el campo de la estadística de la probabilidad o
probabilidad estadística supone una reformulación de muchas de las ecuaciones
originales de la estadística tradicional, aportando nuevas definiciones, y
nuevas operaciones de los que a posteriori surgen nuevos modelos de contraste de hipótesis.
Rubén García Pedraza, Madrid 30 de agosto del 2015
Google Play |
La Librería |