Dado un conjunto N tendente a infinito es inevitable que absolutamente todo suceda, siempre que se disponga de tiempo suficiente o infinito , y he ahí donde está el verdadero problema irresoluble o quid de la cuestión de la existencia ¿quién nos garantiza que dispongamos del tiempo necesario para que ocurra lo que debe o deseamos que suceda?


sábado, 8 de marzo de 2014

Estudios de sesgo


Se dirá que hay sesgo estadístico o de probabilidad cuando el comportamiento de cualquier elemento en un conjunto no se ajusta a un modelo de igualdad de oportunidades, ya sea porque no sigue un comportamiento aleatorio al azar o no se rige por el ideal igualdad de condiciones.

Si en un juego de azar, por ejemplo, en la ruleta se observa mayor frecuencia de un número frente los demás, o al lanzar una moneda al aire hay más caras que cruces o viceversa, o al lanzar unos dados al aire se repite con mayor frecuencia una combinación,  se dice que hay sesgo, al no haber un verdadero comportamiento en igualdad de oportunidades que demuestren que la dinámica de juego sea verdaderamente aleatoria, y la ruleta, la moneda, o los dados, se encuentran sesgados, si bien, desconocemos el motivo del sesgo, ya sea porque los juegos han sido deliberadamente trucados, o es un sesgo debido a su propio desgaste natural, para lo que serían necesarias investigaciones ulteriores, sobre si el sesgo es intencionado o debido a procesos naturales.

En una investigación sobre el estudio de componentes químicos en determinadas formaciones geológicas, capas terrestres, cordilleras, glaciares, fallas, se observa una mayor frecuencia de determinados elementos frente a otros, se dirá que la presencia de dichos elementos en las formaciones materiales estudiadas no es aleatoria, habiendo un sesgo positivo de dichos elementos químicos en las muestras, si bien desconocemos el motivo por el cual dichos elementos químicos forman parte de dichas estructuras, ya sea por procesos naturales graduales, cataclismos terrestres, glaciaciones, volcanes, o interferencias ajenas a la dinámica de nuestro planeta, grandes meteoritos, radiaciones de supernovas, o por acción directa o indirecta de otros cuerpos celestes, cometas, lluvias de estrellas fugaces, etc... que sería motivo de investigaciones posteriores, el origen más probable o causas posibles de dichas estructuras materiales.

En un estudio climático de estudiarse la distribución de las precipitaciones en diferentes regiones del planeta, y observarse un sesgo negativo importante de lluvias en desiertos, frente un sesgo positivo importante de lluvias en climas tropicales, e importantes tasas de nieve en regiones árticas y antárticas, evidentemente se observa una estructura no aleatoria de la distribución delas precipitaciones y acumulación de hielo y nieve, en donde las posibles causas deberán investigarse en la propia dinámica de cada clima.

De hacerse una investigación social cuantitativa sobre tendencias sociales, intención de voto, opinión pública sobre situación financiera, cambio climático, hambrunas en países subdesarrollados, y  observase una inclinación favorable hacia determinados partidos o ideas políticas, valoración positiva o negativa de la situación económica,  preocupación por el cambio climático, y malestar por las hambrunas, se habrá observado una estructura social formada por diferentes tipos de sesgo, sesgo social positivo a determinadas tendencias e ideas políticas, económicas, ecológicas o humanitarias, si bien para conocer en profundidad de forma objetiva los motivos por las que se manifiesta dicha estructura social serán necesarias nuevas investigaciones que indaguen sobre el posible origen de dichas tendencias.

La estructura de un sistema, natural o social, es una dinámica no lineal definida por los flujos de distribución estadística en sus variables, en donde según la distribución muestre una dinámica de igualdad o sesgo, la estructura del sistema cambia. El posible origen o causa probable por la que los juego dinámicos se transforman se puede deber a múltiples factores accidentales o contingencias capaces de producir patrones de regularidad estable, tal como se explica en el apartado 13 de Introducción a la Probabilidad Imposible.

Sesgo estadístico o de probabilidad es la diferencia entre el valor real en la medición de cualquier elemento de una muestra, y el que debería tener en igualdad de oportunidades. Dicha diferencia en la estadística tradicional se llama puntuación diferencial, y es igual a la diferencia entre el puntaje de cada elemento menos la media aritmética, siendo la media aritmética el valor de cada elemento en auténticas condiciones de igualdad.

En Probabilidad Imposible a cada elemento de la muestra se llama sujeto u opción, y al puntaje de cada sujeto u opción se llama puntuación directa o frecuencia, de forma que para la estadística tradicional, lo que en Probabilidad Imposible se llama primer método, la puntuación diferencial será igual a la puntuación directa de sujeto u opción menos la media aritmética, siendo la media aritmética el promedio de todas las puntuaciones directas o frecuencias.

Para el estudio del campo de la estadística de la probabilidad o probabilidad estadística, la teoría de Probabilidad Imposible desarrolla diferentes métodos sintéticos, uno de ellos el Segundo Método, donde las puntuaciones directas o frecuencias se transforman a un sistema de probabilidades empíricas, igual a la puntuación directa o frecuencia de cada sujeto u opción entre la suma total de todas de todas las puntuaciones directas o frecuencias, cuya diferencia, de la probabilidad empírica, menos la probabilidad teórica será igual al Nivel de Sesgo, siendo la probabilidad teórica aquella probabilidad que teóricamente debería tener cada sujeto u opción de darse verdaderas condiciones de igualdad, ya sea porque la igualdad de oportunidades  sea un objetivo de la política científica, o porque en un proceso o sistema natural lo verdaderamente aleatorio es que todo ocurra en igualdad de oportunidades aleatoriamente. La probabilidad teórica será igual a la media aritmética de las probabilidades empíricas, que será igual a la inversión de N.

Los estudios de sesgo serán aquellos cuyo objetivo sea el comportamiento diferencial de las probabilidades empíricas de los sujetos u opciones respecto la probabilidad teórica, lo cual es lo mismo que decir que el objeto de los estudios de sesgo es el comportamiento diferencial de los sujetos u opciones entre sí. En el momento que tan sólo un único sujeto u opción se desmarque del comportamiento en igualdad de oportunidades, se generará un sesgo, positivo o negativo, que deberá ser contrarrestado por el sesgo inverso, negativo o positivo, de uno o más sujetos u opciones diferentes.

El sistema de probabilidad empírica en realidad lo que mide es el valor proporcional de la puntuación directa o frecuencia de cada sujeto u opción frente a la puntuación directa o frecuencia de los demás sujetos u opciones, lo cual quiere decir que realmente lo que mide la probabilidad empírica no es si un sujeto tiene más o menos puntuación directa o frecuencia, lo que mide es la proporción de dicha probabilidad empírica frente las demás, y lo hace en forma de cociente, puntuación directa de sujeto u opción entre la suma de todas las puntuaciones directas o frecuencias de la muestra.

En el momento que tan sólo un sujeto u opción, por mínima que sea, tiene una diferencia de su probabilidad empírica menos la teórica, generando una diferencia positiva, sesgo positivo, si la probabilidad empírica es superior a la teórica, o creando una diferencia negativa, sesgo negativo, cuando la probabilidad empírica es inferior a la teórica, automáticamente, en el momento que se produce un sesgo, automáticamente hace que uno o más sujetos u opciones del resto de la muestra generen un sesgo inverso de igual magnitud.

Siempre que se produzca un sesgo, positivo o negativo, automáticamente se creará un sesgo opuesto dela misma magnitud, ya sea porque al menos un sujeto u opción diferente genere un sesgo opuesto de igual magnitud al sesgo de ese otro sujeto u opción, o varios sujetos u opciones generen en suma un sesgo opuesto de magnitud idéntico al de aquel otro sujeto u opción.

Es decir, si el sujeto A genera un sesgo positivo, o bien el sujeto B genera un sesgo negativo en valor absoluto de igual magnitud al sesgo positivo de A, o la suma del sesgo negativo de los sujeto B y C es en términos absolutos una magnitud de sesgo equivalente a la magnitud del sesgo de A. Y a la inversa, siempre que A genere un sesgo negativo, o bien el sesgo positivo de B o el sesgo positivo de B y C será de igual magnitud al valor absoluto del sesgo negativo de A.

El motivo por el cual siempre, en términos absolutos, habrá tanto sesgo positivo por sesgo negativo y viceversa, y en el momento que, en términos absolutos, uno o más sujetos u opciones generen un sesgo positivo o negativo habrá en suma un sesgo negativo o positivo de igual magnitud por uno o más sujetos u opciones diferentes, es porque el Nivel de Sesgo, en el Segundo Método, puntuación diferencial en el primer método, se calcula sobre la media aritmética, de forma que si la media aritmética es sólo el promedio de las puntuaciones directas o frecuencias, o las probabilidades empíricas, en el momento que un sujeto u opción tenga un valor empírico inferior o superior a la media aritmética, dicho diferencial será compensado por uno o más sujetos u opciones cuyo valor empírico sea superior o inferior a la media aritmética, de forma que en la muestra siempre habrá el  mismo valor absoluto de magnitud de sesgo positivo y de sesgo negativo.

En el Segundo Método la suma de todos los todos sesgos positivos de la muestra siempre será idéntica a la suma del valor absoluto de todos los sesgos negativos de la muestra, lo que en el primer método sería equivalente a decir que la suma de las puntuaciones diferenciales de signo positivo de la muestra será de una magnitud equivalente a la suma de los valores absolutos de las puntuaciones diferenciales de signo negativo. Debido a la equivalente magnitud de los sesgos, positivos o negativos, o puntuaciones diferenciales, positivas o negativas, es por lo que el cálculo de la Desviación Media sólo puede hacerse sobre el sumatorio de los valores absolutos de las puntuaciones diferenciales, en el primer método, o sumatorio de los valores absolutos de los Niveles de Sesgo en el Segundo Método, o bien, para neutralizar el efecto del signo dichos diferenciales se elevan al cuadrado para el cálculo de la Varianza, o la Desviación Típica, raíz cuadrada de la Varianza.

En la medida que de no sumarse los valores absolutos de los sesgos entonces el sumatorio sería igual a cero, dado que habría la misma magnitud de sesgo positivo que de negativo, esto lo que indica es que, sea el tipo de muestra que sea , si dividimos entre dos el sumatorio del valor absoluto de todos los sesgos, sería igual a la suma de todos los sesgos positivos, o la suma de todos los sesgos negativos, dado que, bajo esa estructuración del sesgo, de haber sólo en la muestra un solo sujeto u opción de sesgo positivo, y todos los demás, N menos uno, sesgo negativo, o viceversa, de haber en la muestra un solo sujeto u opción de sesgo negativo, y todos los demás, N menos uno, sesgo positivo, el sesgo de ese único sujeto u opción sería igual a dividir entre dos el sumatorio de los valores absolutos de todos los sesgos, siendo dicho sumatorio el Sesgo Total.

Máximo Sesgo Empírico Posible = Σ / ( p(xi) – 1/N ) / : 2

Σ / ( p(xi) – 1/N ) / = Sesgo Total

 

Los estudios de sesgo, a diferencia de los estudios de igualdad de oportunidades, serán aquellos en donde el objetivo ideal  de la política científica es la identificación de valores diferenciales  en el comportamiento de la naturaleza o la sociedad.

Los estudios de sesgo en Introducción a la Probabilidad Imposible se explican con más detalle en el apartado 10, si bien a lo largo de toda la obra se exponen diferentes modelos de crítica racional para este tipo de estudios, ya sea a nivel intramedicional e intermedicional, así como modelos de crítica racional en la predicción empírica, ya sea en forma de proyecciones o pronósticos, según se estudie sobre variaciones posibles o reales, apartado 17.

Dentro de Probabilidad Imposible se identifican los siguientes modelos de estudios de sesgo, en función sea en modelos normales o modelos omega.

Modelos normales son aquellos donde la dispersión empírica puede oscilar entre cero o máxima, en donde la dispersión empírica tiende a cero entonces es un modelo de tendencia a igualdad de oportunidades, y si la dispersión empírica tiende a máxima entonces es un modelo de máxima dispersión. Dentro de los modelos normales habrá que diferenciar entre aquellos estudios que tengan por objeto el estudio del sesgo positivo de un sujeto u opción ideal, mientras los demás tienden a probabilidad empírica cero, por ejemplo, en una batería de ítems si por cada ítem sólo hay una opción correcta entonces lo ideal es que esa opción ideal sea la única que tenga probabilidad empírica distinta de cero, mientras todas las demás deberían tender a cero. A mayor incremento de la probabilidad empírica del sujeto u opción ideal, en detrimento de los demás sujetos u opciones, la dispersión empírica tenderá a Máxima Desviación Media Teórica Posible, luego a Máxima Varianza Teórica Posible y a Máxima Desviación Típica Teórica Posible.

En relación a los estudios de sesgo negativo en modelos normales, en los estudios normales del sesgo positivo que integren un solo sujeto u opción ideal, al mismo tiempo que se estudia el sesgo positivo del ideal, compaginar el estudio de sesgo positivo con el estudio de la evolución del sesgo negativo de los demás sujetos u opciones no ideales.

Y otro modelo muy diferente de estudio de sesgo negativo serían las muestras de ceros, aquellos en donde el ideal de la política científica sea la probabilidad empírica cero de toda cualidad o variable no ideal en toda una muestra, por ejemplo, en farmacología experimental lo ideal es que ante un nuevo fármaco todos los pacientes de una muestra bajo medicación desarrollen cero síntomas de la enfermedad que están siendo tratados, luego si el tratamiento es el adecuado al final del estudio la probabilidad empírica de desarrollo de síntomas en todos los pacientes debería ser igual a cero, el resultado final debería ser una muestra de cero síntomas, una muestra de ceros.

En este tipo de estudios, en donde lo ideal sea la muestra de ceros, la complejidad radica en que a medida que la muestra tiende a cero, simplemente con que halla el más mínimo sujeto u opción que tenga probabilidad empírica distinta de cero, entonces la dispersión empírica sería máxima. Únicamente se estabilizaría la dispersión en inversión de N cuando la probabilidad empírica de absolutamente toda la muestra fuera igual a cero, porque entonces la Desviación Media sería igual a inversión de N, tal como se explica en el apartado 9 de Introducción a la Probabilidad Imposible.

Los estudios de muestras de ceros se consideran estudios de sesgo negativo porque si se alcanza una muestra de ceros, la Desviación Media siempre será igual a inversión de N, porque el Nivel de Sesgo de todo sujeto u opción sería igual a menos inversión de N,” - 1/N”.

Los modelos omega serían aquellos en donde dada una muestra de N sujetos u opciones no necesariamente tiene porque haber un único sujeto u opción ideal a incrementar el sesgo positivo, habiendo en los modelos omega la posibilidad de más de un sujeto u opción ideal, siempre y cuando la magnitud de sujetos u opciones ideales sea superior a uno e inferior a N. Modelos omega son aquellos en donde la magnitud de sujetos u opciones ideales puede variar entre dos y N menos uno.

El motivo por el cual los ideales en N de los modelos omega es a partir de dos sujetos u opciones ideales es porque si sólo hubiera uno entonces sería un modelo normal de dispersión máxima, y si toda N fuera igual de ideal sería un modelo normal de igualdad de oportunidades, de manera que siempre y cuando halla al menos un sujeto u opción no ideal en el cual se aumente el sesgo negativo, y un mínimo de dos sujetos u opciones ideales de aumento del sesgo positivo, una magnitud de ideales entre dos y N menos uno, será un modelo omega, en donde se podrá estudiar o bien el sesgo positivo de los sujetos u opciones ideales en función dela probabilidad ideal, o se podrá estudiar el sesgo negativo de los sujetos u opciones no ideales.

Los estudios de sesgo, sea en modelos normales o en modelos omega, se diferenciarán de los modelos de igualdad de oportunidades, en la medida que su objetivo final es el incremento de la dispersión, ya sea, en modelos normales,a dispersión máxima o igual a inversión de N en muestras de ceros, o dispersión ideal en los estudios omega. El aumento de la dispersión se medirá en función dela diferencia entre el comportamiento real de los elementos y lo que debería ser en igualdad de oportunidades, en donde dicha diferencia en el Segundo Método se estudia en el Nivel de Sesgo, probabilidad empírica de sujeto u opción menos teórica,  y en función del signo del diferencial se definirá el tipo de sesgo, positivo o negativo, habiendo diferentes modelos de estudio según los objetivos de la política científica, que dependiendo de la magnitud de sus ideales en N determinará el tipo de modelo, normal u omega.


Rubén García Pedraza, Madrid a 8 de marzo del 2014
 

https://books.google.es/books?id=lERWBgAAQBAJ&pg=PA51&dq=probabilidad+imposible&hl=es&sa=X&ei=KMnXVNiMFaXjsATZ6IHgAQ&ved=0CCIQ6AEwAA#v=onepage&q&f=false
 
 
 
http://probabilidadimposible.wordpress.com/