Una variable es un factor de estudio mensurable, en tanto que medición de una cualidad,
de la cual se puede extraer un conjunto de muestras, por la medición de la
intensidad o grado de ocurrencia de esa misma cualidad en un conjunto de
sujetos u opciones, o repetidas mediciones en un mismo objeto de estudio
elaborando una muestra de puntuaciones directas o frecuencias, sobre la que
existe al menos en teoría la hipótesis, que no siendo constante, es un factor
al que se le atribuye un grado de causalidad en la sucesión de otros fenómenos,
denominados variables dependientes.
Desde
los modelos estadísticos clásicos de investigación experimental la variable
independiente era la variable de cuya manipulación por se estudiaban sus
efectos sobre las variables dependientes. De modo que la principal diferencia
entre variable independiente y dependiente, es que mientras la independiente
era de manipulación experimental, la variable dependiente era aquella sobre la
que se observaban sus efectos. En un estudio médico, la variable independiente
sería el tipo de tratamiento médico, la dependiente la evolución de la
sintomatología en el paciente. En un estudio pedagógico, la variable
independiente sería el tipo de método educativo, la dependiente el rendimiento
escolar. En un estudio de astrofísica la variable independiente el tipo de
manipulación sobre las partículas, la dependiente el tipo de comportamiento que
manifiesten las partículas. En líneas generales, la variable independiente es
aquella sobre la que opera el equipo de investigación, la dependiente aquella
de cuyos resultados se observan los efectos de la manipulación experimental.
Esta
definición clásica, variable independiente aquella objeto de manipulación,
dependiente aquella objeto de observación de sus efectos, es una definición
todavía hoy válida en determinados contextos en donde el método experimental
clásico sea útil, pero después de los avances en epistemología en el siglo XX
van apareciendo nuevas definiciones, acorde a los nuevos progresos en
metodología de investigación, uno de ellos la aparición del método
quasi-experimental, en ciencias sociales, y la aparición de nuevos paradigmas
que sobre conceptos como incertidumbre, relatividad, caos, complejidad, van
elaborando nuevas definiciones sobre los conceptos tradicionales que apuntan
hacia nuevos marcos interpretativos.
En
el caso de la estadística de la probabilidad o probabilidad estadística, en el
momento que se mueve en el terreno de las ciencias estocásticas, el
determinismo clásico de que para todo efecto hay una causa razonable se
desvanece en una nube de multicausalidad compleja, en donde la supuesta
linealidad se evapora en un cúmulo de factores multicausales, en donde a menudo
lo más acertado sería el estudio en todo caso de las causas probables de un
fenómeno, fuera de cualquier determinismo.
Frente
los modelos clásicos de la probabilidad de carácter determinista, el paradigma
claro esta Laplace, a lo largo del siglo XX aparecen nuevos modelos de
estadística y probabilidad que lejos del determinismo desarrollan nuevos esquemas indeterministas, en donde la supuesta secuencia lineal causa y efecto puede estar sujeta a
alteraciones en función de la propia naturaleza aleatoria en la distribución
caótica de los fenómenos.
De hecho
en el apartado 13 de Introducción a la Probabilidad Imposible, estadística dela probabilidad o probabilidad estadística, se parte de una concepción
cosmológica de la realidad en la que a partir de accidentes aleatorios hay
posibilidad de surgimiento de contingencias que den lugar a patrones de
regularidad estable: de múltiples accidentes en el universo por choques entre sí
de polvo cósmico y pedazos de materia en el espacio puede surgir cuerpos
celestes, galaxias, y planetas, contingencias que pueden lugar a patrones de
regularidad estable, sistemas planetarios bajo unas órbitas, cuerpos celestes
de cuyos accidentes dentro de sí pueden surgir diferentes contigencias,
dinámicas geológicas, atmosféricas, o en el planeta Tierra la aparición de la
vida, la biología, de cuya evolución, no exenta de accidentes aleatorios van
surgiendo diferentes combinaciones biológicas, que unido a diferentes
accidentes geológicos y atmosféricos, extinciones masivas, e impactos de
meteoritos, van formando un lugar donde es posible la aparición de la vida
humana, que a su vez, por diversos azares de la evolución va derivando a una
sociedad compleja. La historia social, fiel reflejo de la historia natural, es
la sucesión de accidentes aleatorios de los que sin embargo surgen
contingencias capaces de dar lugar a patrones de regularidad estable, al menos
hasta que otro accidente crea nuevas condiciones de posibilidad para nuevas
contingencias y nuevos patrones de movimiento regular y dinámico de la materia y
la energía en el tiempo y el espacio, en síntesis, lo que sería la historia.
En
un modelo indeterminista como Probabilidad Imposible, cualquier atribución de
causa absoluta o apodíctica a una variable independiente es cuestionable, entre
otras razones porque en un mundo regido por las leyes del azar, la ley natural,
siempre hay un margen de duda racional para el establecimiento de una ley
universal salvo la ley del azar, la ley de probabilidades. En este sentido, la
única relación lógica entre una variable y otra puede ser sólo en términos de
probabilidad, una relación no siempre causal, por cuanto pueden ser relaciones
simultaneidad o retroalimentación.
El
hecho que dos variables coincidan en el tiempo o coincida que una sea posterior
a la otra, aun en repetidas ocasiones, no implica que sean causa o efecto,
pueden ser simplemente simultáneas. Supongamos que en un estudio médico una vez
aplicado un tratamiento médico se observan dos efectos diferentes: salvo que
tengamos pruebas que lo demuestren, no hay razón suficiente para el
establecimiento de relaciones formales entre ambos efectos, y en todo caso la
relación entre los efectos y el tratamiento médico será dentro de un margen de duda
racional, proporcional a lo márgenes de error aceptados en la investigación
científica.
En
Probabilidad Imposible se distinguen dos tipos de error, el error de hecho y el
error racional. En Introducción a la Probabilidad Imposible, estadística de laprobabilidad o probabilidad estadística, se denomina error de hecho al error
que de hecho estamos aceptando cada vez que aceptamos una muestra, por cuanto
aceptar la realidad en sí ya de por sí es un error: al aceptar la muestra que
obtenemos de la realidad aceptamos el error de representatividad muestral,
igual a la inversión de la muestra. En universos de sujetos u opciones
infinitos la probabilidad de error de representatividad muestral es la propia
inversión de N, 1/N, y en universos de opciones limitadas la probabilidad de
error de representatividad muestral es igual a la inversión de la muestra de puntuaciones directas o frecuencias, 1/∑xi.
En
Probabilidad Imposible se denomina error racional el que racionalmente
aceptamos cuando se acepta la probabilidad crítica, en donde ya sea una
probabilidad crítica para el contraste de hipótesis en la prueba estadística,
en estadística inferencial, para la crítica racional de la realidad, sobre un
margen de fiabilidad igual a porcentaje X de fiabilidad, entre cien, por la
máxima tendencia, o margen de error igual a porcentaje X de error, entre cien,
por la máxima tendencia, en cualquier caso ya sea estudio de error o fiabilidad
siempre hay un margen de error racional, en estudio de error el porcentaje X de
error, en estudio de fiabilidad la diferencia entre cien menos el porcentaje X
de fiabilidad.
La
relación lógica entre el tratamiento médico y los efectos es de un nivel de
causalidad probable sujeto a un margen de incertidumbre proporcional al margen
de error, luego siempre hay espacio suficiente para la duda, luego la variable
independiente será aceptada racionalmente universal dentro de un marco de duda
razonable, en donde haya casos en donde la variable independiente no surta los efectos
deseados por diversos motivos.
Si
en un estudio de N sujetos u opciones en el tratamiento médico no se ha
incluido a pacientes con un determinado perfil genético, o determinadas
complejidades medicas previas, o que tengan determinadas alergias o
intolerancias a ciertos tratamientos médicos, en el momento que el tratamiento
sea suministrado a personas con este tipo de perfil, el grado de error del
tratamiento es muy elevado, luego no es completamente universal, luego su
aceptación universalmente racional es relativo a la probabilidad de error, de
hecho y racional.
Por
otro lado, cualquier atribución causal entre fenómenos simultáneos, o sucesivos
en el tiempo, sin suficientes pruebas racionales de alguna relación
probablemente causal sería infundada, algo que a menudo sucede en la ciencia,
la atribución causal a fenómenos que en realidad son sólo puras coincidencias
sin haber en realidad relación formal alguna.
De
otro lado otro tipo de relaciones que no tienen porque acomodarse al concepto
clásico de variable independiente son las relaciones de retroalimentación. Si
dos variables se retroalimentan entre sí, o por el contrario hay dinámicas de
entropía negativa, cualquier atribución de causa y efecto en un sentido clásico
carece de sentido. Si en un experimento educativo el desarrollo de la
inteligencia matemática mejora la comprensión lectora, la atribución causal de
la que la inteligencia matemática tiene por efecto la comprensión lectora
carecería de fundamento siempre y cuando no se testase además que, en un
experimento de mejora de la comprensión lectora mejora a su nivel el
rendimiento en matemáticas.
En diversas
investigaciones educativas se ha puesto de manifiesto como la mejora de las
capacidades matemáticas mejora la capacidad de comprensión simbólica del
alumno, lo que puede tener a su vez mejoras en la comprensión lectora, y
viceversa, la mejora de la comprensión lectora puede repercutir positivamente
en matemáticas por cuanto el alumno comprende mejor los enunciados de los
ejercicios de matemáticas. En síntesis, las capacidades matemáticas y
lingúisticas están interconectadas, habiendo relaciones de retroalimentación
entre sí.
Hoy
en día aunque todavía en libros de estadística siga apareciendo en su noción
experimental clásica, es la variable objeto de manipulación cuyos efectos se
observan en la variable dependiente, hay que entenderlo en un sentido más
amplio. De hecho hoy en día este concepto de variable independiente escapa al
método experimental.
Si
estudiamos como las tormentas solares afectan a determinados fenómenos
atmosféricos y climáticos en nuestro planeta, la variable independiente serían
las tormentas solares, y la variable dependiente serían sus efectos sobre la
Tierra, sin que en ningún momento al variable independiente pudiera ser objeto
de manipulación científica.
Si
estudiamos el efecto de la población de abejas sobre la biodiversidad de la
flora de un bosque, y estudiamos el efecto de la biodiversidad de la flora del
bosque sobre la fauna, y se establecen correlaciones de, en proporción a la
población de abejas, proporción de biodiversidad en flora y faura, estamos haciendo un estudio estadístico y de
probabilidad en donde la base de la cadena es la población de abejas, sin que
la población de abejas fuera necesariamente una variable objeto de manipulación
experimental, salvo que un equipo de zoólogos aumentara la población de abejas
por traer abejas de otros sitios, o se llevara a cabo un estudio experimental
de cómo aumentar artificialmente la población de abejas utilizando técnicas de
apicultura.
En
definitiva, hoy en día por variable independiente no se entiende sólo la
variable experimental o variable objeto de manipulación, hoy en día la variable
independiente es la variable de la que se quiere estudiar su efecto sobre otras
variables, denominadas dependientes. En donde ademá se da la complejidad que la
variable independiente es sólo una causa probable, entre otras muchas, de modo
que en realidad la variable independiente puede ser una covariable que actúe
junto a otros en el resultado de un efecto.
A
una variable independiente se la llamaría covariable de un efecto en un estudio
multicausal o multifactorial donde diferentes variables interactuarían en la
aparición de un fenómeno, de modo que podría atribuirse a cada variable un
porcentaje de probabilidad causal en la ocurrencia del fenómeno.
Dentro
de la naturaleza se dan infinidad de circunstancias en donde un fenómeno es
producto de una combinación de diferentes factores, en donde en realidad lo que
mide la probabilidad empírica del fenómeno es la probabilidad de que esa
combinación se de en la naturaleza. Si estudiamos la probabilidad que surja el arcoíris
un día de lluvia estamos estudiando la probabilidad de que se dé una adecuada
combinación de lluvia y luz como para producir el efecto óptico del arcoíris.
Cuando
diferentes variables interactúan para dar lugar a un fenómeno, la probabilidad
del fenómeno es la probabilidad de que se dé la combinación de factores que lo
hacen posible. Si en estudio sobre factores de bienestar social como tasas de
empleo, renta per capita, nivel educativo… a factor se le atribuye un
porcentaje de contribución al bienestar, podría estudiarse como la combinación
de una serie de factores, donde cada factor contribuye en un determinado porcentaje,
que podría ser ponderado y estudiado de forma cuantitativa.
Si
en un estudio quasi-experimental quisiéramos estudiar el fenómeno del bienestar
social en diferentes países, unidades de análisis, habría que identificar los
factores que contribuyen a este fenómeno, y proceder a la comparación entre su
comportamiento en diferentes países, siendo las variables independientes de los
cuales queremos conocer su efecto en el bienestar de las unidades de análisis.