Dado un conjunto N tendente a infinito es inevitable que absolutamente todo suceda, siempre que se disponga de tiempo suficiente o infinito , y he ahí donde está el verdadero problema irresoluble o quid de la cuestión de la existencia ¿quién nos garantiza que dispongamos del tiempo necesario para que ocurra lo que debe o deseamos que suceda?


domingo, 30 de agosto de 2015

Sesgo Total


Se dice que algo está sesgado cuando muestra un comportamiento diferente al azar. Si lanzamos una moneda al aire, y el número de caras o de cruces es diferente al cociente de dos entre número total de lanzamientos, la moneda está sesgada a favor de aquella opción, cara o cruz, que demuestre mayor ocurrencia. Si en una estadística de natalidad el número de nacimientos de niños y niñas es diferente al cociente de dos entre número total de nacimientos, hay una tendencia sesgada a  más niños o niñas, según en uno u otro género halla mayor tasa de nacimientos. Si en una serie de pruebas de diferentes tratamientos médicos para una misma enfermedad, uno u otro tratamiento logra que un mayor número de pacientes se reponga fuera de lo que sería esperable por azar, el tratamiento que logre mejores resultados demuestra mayor sesgo positivo que aquellos cuyo número de pacientes repuestos sea inferior. Si en un examen a una serie de alumnos la distribución de puntuaciones difiere a lo que sería una distribución aleatoria hay una distribución sesgada, en donde el mayor sesgo positivo será de los alumnos que obtengan mejores puntuaciones.

Se dirá sesgo a todo comportamiento que difiera de una distribución aleatoria por azar, y la tendencia natural del azar es a la distribución en torno la media aritmética en ausencia de condicionantes que determinen otro comportamiento diferente, todo comportamiento que difiera de lo que sería un comportamiento aleatorio, entorno a la media aritmética, será un comportamiento sesgado.

En Probabilidad Imposible se llamará sesgo a la dispersión estadística que genere cualquier tipo de comportamiento diferente al esperable por azar, y la forma en que se mide el grado de sesgo de cada sujeto u opción en Probabilidad Imposible es a través del Nivel de Sesgo, igual a probabilidad empírica menos probabilidad teórica. 

Nivel de Sesgo= p(xi) – 1/N
 

p(xi)= xi/ ∑xi = probabilidad empírica

1/N= ∑xi/N = probabilidad teórica

N= número de sujetos u opciones de la muestra

xi= puntuación directa o frecuencia 

Lo que para la teoría de Probabilidad Imposible es Nivel de Sesgo en la estadística tradicional se llama puntuación diferencial, sólo que mientras la puntuación diferencial lo que contrasta es la puntuación directa y la media aritmética de las puntuaciones directas, y lo que Probabilidad Imposible contrasta en términos diferenciales en el Nivel de Sesgo son dos probabilidades estadísticas, la probabilidad empírica menos la teórica. En la medida que el estudio de la realidad a través de las probabilidades estadísticas que desarrolla Probabilidad Imposible genera un nuevo método de estudio, al método de estudio que tiene su base en los conceptos de probabilidad empírica y teórica, se denominará Segundo Método, para diferenciarlo del Primer Método que sería la estadística tradicional. 

La probabilidad empírica mide la tendencia individual real de cada sujeto u opción, mientras la probabilidad teórica indica señala el verdadero comportamiento en igualdad de condiciones, en ausencia de cualquier otro factor salvo el azar. La diferencia entre el comportamiento real y el aleatorio, mide el grado de dispersión real del sujeto u opción frente al teórico en igualdad de oportunidades. De este modo lo que realmente mide el Nivel de Sesgo es la dispersión entre la tendencia individual empírica y lo que en función de la magnitud de la muestra, N, debería ser la tendencia teórica en ausencia de sesgo, la inversión de N, 1/N.

Una vez calculado la dispersión individual se puede obtener una estimación de la dispersión muestral , lo que precisa de la suma de todos los Niveles de Sesgo, una operación no exenta de cierta complicación, por cuanto si el resultado de la diferencia de probabilidad empírica menos probabilidad teórica un resultado cuyo signo, positivo o negativo, depende de que la probabilidad empírica sea mayor o menor que la teórica, y se da el caso que la inversión de N es un algoritmo multifuncional, por cuanto desempeña funciones variadas, entre ellas la función de probabilidad teórica, además de media aritmética de las probabilidades empíricas, por cuanto la inversión de N es un estadístico de tendencia central, la suma de todos los Niveles de Sesgo que tengan sesgo negativo tendrá un resultado equivalente a la suma de todos los Niveles de Sesgo de sesgo positivo. A este fenómeno de la identidad entre la suma de todos los Niveles de Sesgo positivo de una muestra y la suma de todos los Niveles de Sesgo negativo de esa misma muestra, en Probabilidad Imposible se denomina fenómeno producto de la bondad natural, por cuanto naturalmente los sesgos tienden a compensarse, es decir, el volumen de sesgo positivo de una muestra será siempre igual al volumen de sesgo negativo, y viceversa, el volumen de sesgo negativo siempre será igual al volumen de sesgo positivo. Debido a este fenómeno de bondad natural, y es que los sesgos positivos y negativos tienden a compensarse, si se suma todos los Niveles de Sesgo, positivos y negativos, de todos los sujetos u opciones de una misma muestra, el resultado del sumatorio de todos los Niveles de Sesgo sería igual a cero.

∑ (p(xi) – 1/N) = 0 

Fenómeno análogo al que sucede en la estadística tradicional, el Primer Método, con la puntuación diferencial, donde el sumatorio de todas las puntuaciones diferenciales sería igual a cero.

∑ (xi – µ) = 0 

A fin de salvar este obstáculo la estadística tradicional, el Primer Método, establece dos mecanismos, de un lado el sumatorio del valor absoluto de todas las puntuaciones diferenciales, o la elevación al cuadrado de las puntuaciones diferenciales. Una vez salvado este escollo, para que el sumatorio no sea igual a cero, a continuación el Primer Método se limita simplemente al cociente del sumatorio, ya sea de los valores absolutos o cuadrados de las puntuaciones diferenciales, entre la frecuencia total. Al cociente de dividir entre frecuencia total el sumatorio de los productos de valores absolutos de las puntuaciones diferenciales por la frecuencia de su puntuación directa se llamará Desviación Media, y si en lugar de considerar el valor absoluto de la puntuación diferencial se calcula sobre su cuadrado se llamará Varianza. 

Desviación Media = ∑ [ / (xi – µ) /  f ] : F

Varianza = ∑ [ (xi – µ)²  f ] : F
 

F= frecuencia total

f= frecuencia de cada puntuación directa 

En el Segundo Método de Probabilidad Imposible el modo de salvar el problema que supone que el sumatorio de los Niveles de Sesgo teniendo en cuenta el signo sea igual a cero es el mismo que en el Primer Método, ya bien el sumatorio de los valores absolutos de los Niveles de Sesgo sin tener en cuenta el signo, lo que sería en sentido estricto el Sesgo Total, o bien el sumatorio de los Niveles de Sesgo al cuadrado, que en tal caso nos da una estimación cuadrática del Sesgo Total. 

Sesgo Total = / ( p(xi) – 1/N ) /

Sesgo Total cuadrático =  ( p(xi) – 1/N )² 

El Sesgo Total de este modo sería la suma del valor absoluto de todos los Niveles de Sesgo, y nos daría una percepción de la cantidad de sesgo en una muestra. Si ya de por si tenemos dos monedas diferentes, y sobre un mismo número de lanzamientos en cada moneda, calculamos el Sesgo Total acumulado al lanzar cada moneda, y una moneda demuestra mayor Sesgo Total que la otra, se podría decir sin lugar a dudas que una moneda demuestra mayor sesgo que la otra. Si después de un examen a dos grupos de alumnos diferentes, un grupo de alumnos demuestra un mayor nivel de Sesgo Total que el otro grupo, entonces la dispersión dentro de ese grupo es ya de por sí mayor que el del otro grupo que presenta menor Sesgo Total, lo cual significaría que se darían condiciones de igualdad de oportunidades entre ambos grupos de alumnos, de modo que cabe sospechar que en el grupo de alumnos que tiene mayor Sesgo Total hay más diferencias significativas entre los alumnos de mayor y menor rendimiento.

Una vez calculado el Sesgo Total el Segundo Método de Probabilidad Imposible nos permite dos cálculos diferentes a partir de este cómputo, o bien Sesgo Total entre dos igual a Máximo Sesgo Empírico Posible, o bien Sesgo Total entre N igual a Desviación Media.

Empecemos el análisis del Máximo Sesgo Empírico Posible, igual a Sesgo Total entre dos. En la medida que el Sesgo Total es la suma del valor absoluto de todos los Niveles de Sesgo, positivos o negativos, si se sumara todos los Niveles de Sesgo positivo y el valor absoluto de todos los Niveles de Sesgo negativos, el resultado sería igual al Sesgo Total. El hecho que el Sesgo Total sea igual a la suma de todos los sesgos positivos o negativos, y que por la propia bondad natural de la inversión de N, el valor obtenido de la suma en términos absolutos de los sesgos negativos sea idéntico al obtenido de la suma de todos los sesgos positivos, implica necesariamente que el 50% del Sesgo Total es equiparable a la suma de todos los Niveles de Sesgo positivo, o el 50% del Sesgo Total es equiparable a la suma de todos los Niveles de Sesgo negativo. Dado que el 50% del Sesgo Total es la suma de los Niveles de Seso positivos, y el otro 50% es la suma del valor absoluto de los Niveles de Sesgo negativo, y se da el caso que el cálculo del 50% del Sesgo Total es equiparable a dividir entre dos el Sesgo Total, entonces, si se divide el Sesgo Total entre dos se obtiene un valor idéntico al que se obtendría de o bien sumar todos los Niveles de Sesgo positivo, o todos los Niveles de Sesgo negativo.

Ahora bien, el hecho que Sesgo Total entre dos sea igual a la suma de todos los Niveles de Sesgo positivos, o el términos absolutos de todos los Niveles de Seso negativo, no implica en modo alguno que la mitad de la muestra, la mitad de N, sea de sesgo positivo o negativo, porque se puede dar el caso que bajo condiciones de máxima tendencia, de toda N un único sujeto u opción tenga puntuación directa o frecuencia distinta de cero, mientras todos los demás sujetos u opciones, N menos uno, tengan puntuación directa o frecuencia igual a cero, lo que implicaría entonces que el Nivel de Sesgo positivo de ese único sujeto u opción distinto de cero sería idéntico a la suma de los valores absolutos de todos los Niveles de Sesgo cuya puntuación directa o frecuencia sea igual a cero. De lo que se concluye que, independientemente de que dentro de N el número de sujetos u opciones que tengan sesgo positivo o negativo oscile entre uno y N menos uno, nunca y absolutamente nunca el Nivel de Sesgo de ningún sujeto u opción puede ser superior al cociente de Sesgo Total entre dos, motivo por el cual al Sesgo Total entre dos en el Segundo Método de Probabilidad Imposible se conocerá por Máximo Sesgo Empírico Posible.

Máximo Sesgo Empírico Posible=

∑ / ( p(xi) – 1/N ) / : 2 

En la medida que en el Primer Método, la estadística tradicional, normalmente el problema que supone la identidad a cero del sumatorio de puntuaciones diferenciales se salva normalmente a través de la elevación al cuadrado de los diferenciales, a fin de adaptar el Segundo Método al Primer Método, el cálculo del Máximo Sesgo Empírico Posible puede ser también cuadrático.

Máximo Sesgo Empírico Posible Cuadrático=

∑ ( p(xi) – 1/N )² : 2 

Y a fin que en los contrastes frente los Niveles de Sesgo normales y corrientes sea de forma típica, la posibilidad de la raíz cuadrada del Máximo Sesgo Empírico Posible Cuadrático daría lugar al Máximo Sesgo Empírico Posible Típico.

Máximo Sesgo Empírico Posible Típico=

 √[ ( p(xi) – 1/N )² ] : 2 

El Nivel de Sesgo sería un estimador de la dispersión empírica individual, el Sesgo Total ya sería un estimador de la dispersión estadística muestral, que dividido entre dos sería igual al Máximo Sesgo Empírico Posible, ofreciendo además las variantes de Máximo Sesgo Empírico Posible Cuadrático o Típico, para adaptarlo a la estadística tradicional. En cualquier caso tal como se reitera en Introducción a laProbabilidad Imposible, estadística de la probabilidad o probabilidad estadística, en Probabilidad Imposible siempre se prefiere la utilización de los diferenciales entre probabilidades en términos absolutos por cuanto no alteran el valor de las diferencias, siendo muy importante conservar los datos lo más fielmente posible a la realidad a  fin de reducir los márgenes de error acumulados en las operaciones.

Además del Máximo Sesgo Empírico Posible, otra estimación de dispersión muestral que nos permite calcular el Sesgo Total es la propia Desviación Media de las probabilidades estadísticas de la muestra, en donde Sesgo Total entre N, o Sesgo Total por inversión de N, 1/N, sería igual la Desviación Media de las probabilidades empíricas de los sujetos u opciones.

Desviación Media =

 /( p(xi) – 1/N )/ : N =

 /( p(xi) – 1/N )/ · 1/N 

En la medida que la Desviación Media es igual a Sesgo Total por inversión de N, e inversión de N es igual a la distribución teórica por azar, entonces la Desviación Media es igual a sesgo por azar, es decir, la Desviación Media lo que mide es cual debería ser la distribución del Sesgo Total de la muestra por azar, es decir, teóricamente dado ese nivel de Sesgo Total cual debería ser la porción de sesgo que debería corresponder a cada sujeto u opción de distribuirse el Sesgo Total en igualdad de condiciones entre todos los sujetos u opciones. Precisamente es a partir de la comprensión de la naturaleza de la Desviación Media, sesgo por azar, donde en Introducción a la Probabilidad Imposible, estadística de la probabilidad o probabilidad estadística, dentro de la estadística inferencial intramedicional, en el apartado 11 se explican una serie de modelos de pruebas de contraste de hipótesis para la crítica racional de los datos comparando los Niveles de Sesgo individuales y la Desviación Media.

A fin de adaptar el Segundo Método de Probabilidad Imposible a la estadística tradicional, el Primer Método, en lugar de Desviación Media de las probabilidades empíricas se puede calcular la Varianza de las probabilidades empíricas, igual a dividir entre N, o producto por inversión de N, el sumatorio de los Niveles de Sesgo al cuadrado.

Varianza= S² =

 ( p(xi) – 1/N )² : N =

 ( p(xi) – 1/N )² · 1/N 

Y la raíz cuadrada de la Varianza igual a la Desviación Típica de las probabilidades empíricas.

Desviación Típica= S =

 √ [ ( p(xi) – 1/N )² ] : N =

   [ ( p(xi) – 1/N )² ] · 1/N 

El modelo de estudio que propone Probabilidad Imposible en el campo de la estadística de la probabilidad o probabilidad estadística supone una reformulación de muchas de las ecuaciones originales de la estadística tradicional, aportando nuevas definiciones, y nuevas operaciones de los que a posteriori surgen nuevos modelos de contraste de hipótesis.

 Rubén García Pedraza, Madrid 30 de agosto del 2015


 
 
https://play.google.com/store/books/details?id=lERWBgAAQBAJ&rdid=book-lERWBgAAQBAJ&rdot=1&source=gbs_vpt_read&pcampaignid=books_booksearch_viewport
Google Play
 
 
https://probabilidadimposible.wordpress.com/
La Librería