Se dice que se dan condiciones de correlación cuando entre dos o más variables se dan relaciones de simultaneidad o sucesión temporal directa o inversamente proporcionales, las directamente proporcionales cuando una o más variables producen una tendencia de aumento en la distribución de otra o más variables diferentes, y las inversamente proporcionales cuando una o más variables implican una tendencia a la baja en otras variables, en donde esas relaciones directas o inversas, positivas o negativas, se interpretan como modelos de causalidad probable, o simplemente correlaciones entre fenómenos mutuamente independientes, bien porque a priori cuenten con nexos o circunstancias comunes, o sea de forma total y absolutamente fortuita y arbitraria, aleatoria.
Se dirá que una correlación es positiva cuando se observa una relación directamente proporcional, y negativa cuando sea inversamente proporcional. Una correlación positiva será directamente proporcional porque si calculamos la tasa entre dos variables en dos momentos diferentes, la diferencia de la tasa de la segunda medición menos la primera medición será una diferencia positiva. Una correlación negativa será inversamente proporcional porque la diferencia de la tasa de la segunda medición menos la primera será una diferencia negativa. Cualquier diferencial entre tasas correlaciónales entre variables, sea positiva o negativa, siempre que sea igual o inferior a un margen de error, o igual o superior a un margen de fiabilidad, se aceptará como una explicación racional de la realidad en la prueba estadística de contraste de hipótesis.
Una correlación alta, positiva o negativa, puede ser una función de probabilidad de causalidad, o simplemente simultaneidad o sucesión de factores por un nexo común causal o determinadas circunstancias, o simplemente una coincidencia aleatoria.
El hecho que se observe una alta correlación entre dos o más factores en ningún momento debe explicarse por una relación necesariamente causal, en donde primero habrá que saber si se trata de fenómenos simplemente coincidentes o sucesivos en el tiempo o se puede apreciar algún tipo de función causa-efecto en al menos algún índice de probabilidad.
En el caso que dos fenómenos manifiesten una alta correlación sin que halla necesariamente una relación directamente entre ambos, será una alta correlación simplemente por simultaneidad o sucesión manifiesta, si bien dicha coincidencia o sucesión, puede deberse a que tengan en común algún hecho previo que los anteceda y provoque, nexo común o circunstancias comunes, o puede ser una simultaneidad o sucesión caótica.
En la introducción del apartado 17, sobre predicción y pronóstico, en Introducción a la Probabilidad Imposible, estadística de la probabilidad o probabilidad estadística, precisamente se aborda una de las cuestiones intrínsecas a las ciencias estocásticas.
El hecho de que cuando llueve hay más probabilidades de producirse los siguientes fenómenos, que salga el arco-iris y encontrar caracoles en el campo, implica dos fenómenos probables y posiblemente simultáneos o sucesivos en el tiempo, ya bien porque de forma simultánea salgan los caracoles y el arco-iris, o de forma sucesiva primero salga el arco-iris y luego los caracoles, o salgan los caracoles y después el arco-iris, pero salgan los caracoles y el arcoíris, de forma simultánea o sucesiva, es un fenómeno que carece entre sí de ninguna relación de causalidad, que salga el arco-iris y sea más fácil encontrar caracoles son dos fenómenos independientes. Al menos hasta el momento no se ha encontrado ningún motivo por el cual se pueda decir razonadamente que en función de la ausencia o presencia del arco-iris el comportamiento de los caracoles sea diferente, o que en función de si salen los caracoles hay variaciones en el comportamiento el arco-iris, son dos hechos correlacionados, pero simplemente por una alta probabilidad de simultaneidad o sucederse en el espacio-tiempo, pero directamente entre sí no hay relación alguna, o de haberla de momento no se ha detectado.
Ahora bien, aunque es cierto que no hay relación directa causa-efecto entre que salgan los caracoles y que salga el arcoíris, lo que sí es cierto es que se da una relación de causalidad probabilística entre, que llueva y posiblemente salgan los caracoles, y que llueva y posiblemente salga el arco-iris.
De forma directa no hay relación alguna entre que salgan los caracoles y el arco-iris, pero de forma indirecta sí se observa un elemento de mediación entre que salgan los caracoles y el arco-iris, ese factor indirecto de mediación entre ambos fenómenos es la lluvia.
Realmente los hechos de que salgan los caracoles y el arco-iris son independientes entre sí, pero mantienen una relación de función de probabilidad con la lluvia, luego, si bien el hecho que cuando llueve se dé una correlación fuerte y positiva entre los fenómenos: que salgan los caracoles y salga el arco-iris; muestra simplemente una alta correlación por mera coincidencia o sucesión temporal de ambos fenómenos en el espacio donde llueve, sin embargo, la observación de que cuando llueve hay probabilidades de que salga el arcoíris, si es una observación que denota una posible función probable de causalidad, y la observación de que cuando llueve los caracoles en el campo salen con más frecuencia igualmente implica una probable función de causalidad.
Que una serie de fenómenos tengan una alta correlación positiva, o bien no explica nada salvo un término de probabilidad en su ocurrencia simultánea o sucesiva de fenómenos independientes entre sí, o puede implicar algún tipo de relación de causalidad probable, y en tal caso dicha correlación será una probabilidad de causalidad , donde un factor actúe, o conjunto de factores actúen, de variable independiente, por ejemplo en el caso citado, la lluvia, y otro factor actúe, o varios factores actúen, de variable dependiente, ya sea que salgan los caracoles o que salga el arco-iris.
En este caso, de dase una situación en donde sea el factor A una variable independiente o conjuntos de variables independientes, y sea B una variable dependiente de A o conjunto de variables dependientes de A, de darse la situación que A entonces B, la correlación positiva entre A y B es la probabilidad de causalidad entre A y B.
En aquellas circunstancias en donde la correlación no implique causalidad probable, la correlación no será un término de probabilidad de causalidad, y denota simplemente un índice matemático de simultaneidad o sucesión de eventos independientes, ya sea por un nexo común o de forma aleatoria.
Es más, el hecho que dos variables sean independientes entre sí, que salgan los caracoles y el arco-iris, y sin embargo manifiesten una alta correlación positiva, salvo que sea producto caótico del azar, puede ser un signo de que, si bien ambos fenómenos son independientes entre sí, su elevada correlación positiva puede deberse a que ambos fenómenos sean variables dependientes de un factor común previo, o conjuntos de factores comunes previos en modelos más complejos multi-variable, que en ese mismo espacio los antecede en la historia siendo su causa más probable.
La correlación positiva por tanto es un índice matemático multifuncional, en donde o bien sólo manifiesta una alta probabilidad de coincidencia o sucesión en la historia de fenómenos independientes, o la manifestación de una probabilidad de causalidad entre una variable independiente o múltiples variables independientes frente otra variable dependiente u otras variables dependientes, en donde incluso dichas variables dependientes entre sí no tengan relación alguna y sean completa y absolutamente independientes, al menos en un principio, aunque manifiesten una alta correlación positiva de simultaneidad o sucesión en el tiempo.
En el caso de que la correlación sólo manifieste simultaneidad o sucesión de eventos independientes entre sí, sin que suponga probabilidad de causalidad, dicha simultaneidad o sucesión puede ser producto del más completo y absoluto caos aleatorio de la realidad, o producto de complejas interacciones variables, en donde, dichos eventos sean independientes entre sí, pero sean dependientes de un nexo o circunstancia en común y a priori que actúe de variable independiente o conjuntos de variables independientes. Siendo dichos eventos variables dependientes de aquel nexo común, en donde la correlación entre el nexo y los eventos manifestaría una correlación positiva sobre los eventos, aunque la correlación positiva de dichos eventos independientes entre sí, al menos en un principio, demarcaría simplemente un nivel de simultaneidad o sucesión en la historia.
Si observamos lo que sucede después de la lluvia en los diferentes ecosistemas y en las sociedades humanas, todas las variaciones del comportamiento natural o social que se producen a consecuencia de la lluvia, son variables dependientes de la lluvia, que sería la variable independiente, que ocasionaría una infinidad de variaciones dependientes, aunque, dicha infinidad de variaciones dependientes entre sí serían entre ellas total y absolutamente independientes, o al menos en su origen. El hecho de que cuando llueva hay más probabilidades que salga el arco-iris y más probabilidades de utilizar el paraguas, son fenómenos que tendrían una correlación alta: lluvia, arco-iris, paraguas; pero que se utilice más los paraguas es totalmente independiente de que salga el arco-iris.
Lo que sí se puede decir es que si bien las variaciones dependientes inmediatas a consecuencia de un nexo común, son variaciones inmediatas e independientes entre sí, a posteriori dichas variaciones pueden evolucionar a complejas relaciones de interactividad.
Que en el momento inmediato de iniciarse la lluvia, en el minuto uno, tenga por efecto social el aumento de la probabilidad del uso del paraguas es un efecto independiente a que en ese mismo minuto uno de iniciarse la lluvia aumenten los embotellamientos en las grandes ciudades y el aumento de la probabilidad de accidentes de tráfico. En principio, en el minuto uno de iniciarse la lluvia, el comportamiento del uso social del paraguas y los problemas de tráfico serían variables totalmente independientes entre sí.
En el minuto uno de iniciarse la lluvia si bien se produce un aumento en la probabilidad del uso del paraguas y un aumento en la probabilidad de embotellamientos y accidentes de tráfico, luego habría correlación positiva por simultaneidad de ambos sucesos, paraguas y problemas de tráfico, dicha correlación positiva en ningún momento supondría una función de causalidad. El aumento del uso del paraguas en el minuto uno de la lluvia es independiente al aumento de los embotellamientos y la siniestralidad, y el aumento de la siniestralidad y los embotellamientos es igualmente independiente al aumento del uso del paraguas, en el minuto uno de la lluvia. No hay relación causal entre ambos fenómenos siendo simultáneos en ese instante, luego tendrían una alta correlación positiva, aunque desprovista de causalidad entre sí, serían fenómenos mutuamente independientes.
Pero si la lluvia continua, el hecho de que aumente la probabilidad de embotellamientos y accidentes de tráfico puede tener por efecto secundario un aumento del uso del paraguas, si se da un aumento en la una tendencia a, en lugar de coger el coche, ir andando o utilizar el transporte público, guareciéndose de la lluvia con el paraguas mientras se hacen desplazamientos a pie o se espera al autobús, tren, metro, tranvía, y demás medios de transporte público, al aire libre.
Si la lluvia persiste y para evitar los problemas de circulación hay una tendencia social importante a ir andando o usar transporte público, utilizando el paraguas mientras se camina o espera en las estaciones, andenes y paradas, lo que sí podría observarse es una correlación negativa entre: uso del coche y uso del paraguas; una relación inversamente proporcional a favor del uso del paraguas en detrimento del coche, según la lluvia se mantiene, en la medida que según sigue lloviendo disminuye el uso del coche proporcionalmente aumenta el uso de paraguas.
En cualquier caso la correlación negativa entre coche y paraguas si la lluvia persiste, no sería una relación entre coche y paraguas directamente de causa y efecto, salvo inversamente porque la verdadera causa seguiría siendo la lluvia. De modo que la correlación negativa entre coche y paraguas de continuar la lluvia sería una correlación negativa que en ningún caso sería directa, salvo inversamente. La evolución en la distribución de la correlación negativa seguirá dependiendo de las posibles variaciones de la variable independiente inicial, la lluvia.
El uso del automóvil y el paraguas serían en todo caso variables independientes entre sí, únicamente ligadas por un nexo o circunstancia común, la lluvia, en donde según se produzcan variaciones en la variable independiente inicial, se producirán diferencias en el comportamiento de la tendencia de las variables dependientes, aunque dichas variables dependientes entre sí sigan siendo mutuamente independientes. Aunque, en la medida que si bien la causa original directa sea la lluvia, según aumente el uso del paraguas en detrimento del coche, se podría decir que, aunque originalmente las variables dependientes sean mutuamente independientes, sin embargo evolucionan a una compleja relación de dependencia, dado que se observa como dependiendo de la disminución del uso del coche hay un aumento en el uso del paraguas. De manera que en modelos complejos multi-variable variables en un principio mutuamente independientes pueden evolucionar a complejas relaciones de dependencia, directa o inversamente proporcional.
En los modelos complejos lo que se observa entonces es una compleja red de interacciones sistémicas en forma de funciones matemáticas de probabilidad, en donde si bien se producen correlaciones positivas o negativas a causa de simple coincidencia o sucesión, por un nexo común o de forma aleatoria, se pueden dar situaciones en donde una variable independiente, o complejos de variables mutuamente independientes, pueden generar a su vez nuevas relaciones de dependencia, incluso entre variables en un principio mutuamente independientes, que a medida que el modelo evoluciona y se hace más complejo, variables en principio mutuamente independientes se transforman en mutuamente dependientes o multi-dependientes, en donde finalmente, la ocurrencia de un suceso no se debe a una sola causa probable, pudiendo ser causada por diferentes causas probables, sean de forma directa o inversa.
En el minuto uno de la lluvia posiblemente no hay ninguna relación directa entre aumento de los problemas de tráfico y aumento del uso del paraguas, pero si la lluvia persiste, el aumento de riesgo de accidentes de tráfico puede ser un factor que produzca un aumento del uso del paraguas. De esta forma, si bien en principio la relación entre accidentes de tráfico y paraguas cuando llueve es una relación indirecta, dado que en el minuto uno no hay relación alguna entre accidentes de tráfico y paraguas, esta relación indirecta a causa de la lluvia se puede tornar en una relación inversa, en donde si la lluvia continua y aumenta el riesgo de accidentes de tráfico de forma inversamente proporcional se producirá un aumento del uso paraguas, y así eludir el coche en preferencia por ir andando con el paraguas, o el uso de transporte público utilizando el paraguas mientras espera al autobús, el tren, el tranvía o el metro, o cualquier otro medio de transporte público a la interperie.
El hecho de que aumente la tendencia en el uso social del paraguas cuando llueve, de esta forma, puede ser en parte causada directamente por la lluvia, pero indirectamente puede estar también motivada por otras posibles causas probables, relacionadas con la lluvia, pero que finalmente inciden en el uso del paraguas, por ejemplo, evitar los riesgos de usar el coche en un día de lluvia. Luego el aumento en el uso del paraguas puede estar motivada por diferentes causas probables, en donde de forma directa o indirecta pueden estar vinculadas a la lluvia, pero evolucionarán directa o inversamente a causas sociales más complejas.
Es más, la propia razón de por qué ese día llueve en lugar de cualquier otro, puede ser estar motivado por un complejo sistema multi-causal de infinidad de variables independientes interactuando entre sí, desde la formación de bajas presiones por razones diversas, desde astronómicas, la bajada de las temperaturas en ese lado del hemisferio terrestre a causa de la inclinación del eje de rotación de la tierra en la estación del invierno que produzca días más cortos y más fríos, a múltiples variables totalmente aleatorias como pudiera ser el simple aleteo de una mariposa.
Que salgan los caracoles, el arco-iris, uso del paraguas, y evitar el coche ese día y utilizar transporte público o ir andando, es parte de un sistema de fenómenos simultáneos o sucesivos en el tiempo, en un principio sin relación alguna entre sí, que posteriormente evolucionarán a interacciones complejas, y son a su vez efecto de un fenómeno que los precede, y que puede ser un factor de causa probable, la probabilidad de lluvia, una probabilidad de lluvia que por sí misma también es producto de la interacción caótica de múltiples variables.
Toda la teoría científica en las ciencias sintéticas gira en torno a la elaboración de hipótesis empíricas, posiblemente explicativas, que relacionan fenómenos, normalmente en función de categorías, por ejemplo del tipo causa y efecto, que permiten controlar y manipular la realidad, de manera que si sabemos que A produce o es causa de B entonces controlando A podemos manipular a B, ya sea A una variable independiente o conjuntos de variables independientes, sea B una variable dependiente o conjuntos de variables dependientes.
En el caso que A o B sean conjuntos de variables, la forma de estudiar la contribución A en B, habría diferentes modelos de estudio. Si A es múltiple y B es simple, la correlación, positiva o negativa, de cada variable de A sobre la variable B. Si A es simple y B es múltiple, la correlación, positiva o negativa, de A sobre las diferentes variables de B. Y si A y B son ambas múltiples, la correlación, positiva o negativa, de cada variable de A en cada variable de B. Y si A y B fueran ambas simples, el estudio se simplifica al término en que A correlaciona positiva o negativamente sobre B.
Dentro de una teoría de la probabilidad, hablar de causa y efecto implica hablar de palabras mayores cuando más que causalidad existen niveles de causalidad probable, en términos de probabilidad que el hecho que probablemente A produzca o reduzca B no tiene por qué entenderse en una función determinista en donde si A entonces B es de tal forma o magnitud, en tanto en cuanto al depender de una función estocástica se pueden dar situaciones en donde pueda darse A pero no implique necesariamente una determinada forma de B, precisamente esto es lo que diferencia los modelos indeterministas, estocásticos, de los modelos deterministas.
Aunque cuando llueve hay más probabilidad de utilizar el paraguas, hay culturas en donde el paraguas también se utiliza los días de mucho sol para evitar insolaciones, y evitar las molestias del implacable sol del verano, es más, incluso aunque llueva hay personas que en lugar de paraguas utilizan abrigos y chaquetes que tengan capuchas, o utilizan chubasqueros, e incluso puede haber personas que libremente decidan exponerse a la lluvia, luego no necesariamente porque llueva se debe utilizar el paraguas, o no necesariamente se utiliza el paraguas sólo porque llueva.
Este de tipo de relaciones de causalidad estocástica nos llevará al estudio del nivel de correlación entre fenómenos. De hecho tal como se explica en el apartado 2 de Introducción a la Probabilidad Imposible, estadística de la probabilidad o probabilidad estadística, la teoría de Probabilidad Imposible tiene su origen en la primavera del 2001, en la primera fase de Probabilidad Imposible, especialmente entre los años 2002-2004 el principal foco de atención de esta nueva teoría era el estudio de las correlaciones. Fue después en la segunda etapa, a partir del 19 de diciembre del 2009 cuando en Probabilidad Imposible se inició la investigación hacia modelos de crítica racional.
En un modelo determinista en donde la teoría causal no esta sujeta a ningún margen de incertidumbre y todo está determinado por determinados factores, de darse A es absolutamente necesario que se dé una magnitud de B para comprobarse la hipótesis. En un modelo estocástico, que es el que desarrolla Introducción a la Probabilidad Imposible, estadística de la probabilidad o probabilidad estadística, en donde lo que se trabajan son probabilidades, el hecho que ocurra A no tiene por qué implicar que, más allá de la probabilidad necesaria, sea B, de una forma particular, admitiéndose variaciones, es decir , más que causalidad en un sentido puro lo que se miden son correlaciones, en donde puede ser correlaciones aleatorias, correlaciones entre variables independientes, y correlaciones a causa de relaciones causales, por los cuales si se da A es probable una cierta magnitud de B pero no necesariamente.
En este caso, salvo que exista una hipótesis previa de posible causalidad, lo único que se puede decir es que todos los factores son simultáneos o sucesivos, salvo que exista una hipótesis previa que demuestre lo contrario, y es que alguno de ellos es causa probable de los demás, o es una cadena de probables relaciones causales, y aun en este caso habría un margen de duda de si realmente hay causalidad, o dicha aparente relación causal probable no lo sea, y su simultaneidad o sucesión sea mutualmente independiente y en realidad se deba a un nexo o circunstancia común de momento desconocida, o simplemente, dicha correlación, aparentemente causal, en realidad sea de naturaleza caótica.
El método científico racional es hipotético deductivo porque primero la política científica sobre unos márgenes de error debe establecer una hipótesis, asumible sólo si se da en esos márgenes de error y no en otro cualquiera, de forma que si se acepta la hipótesis se acepta provisionalmente verdadera, a falta de conocer lo que pueda suceder bajo alguna otra circunstancia dentro del margen de error que pueda demostrar de darse en el futuro que la hipótesis sea falsa .
Rubén García Pedraza, Madrid a 19 de abril 2014