Una muestra es una prueba, sea de emociones, virtudes, o de verdad. De emociones cuando alguien expresa sus sentimientos, virtudes cuando hacemos gala de alguna habilidad, o de verdad como cuando para demostrar algo enseñamos algo que lo demuestre. En cualquier caso, el concepto de muestra siempre remite al mismo concepto, la mostración a otras personas de pruebas que demuestren lo que sentimos, hacemos, o pensamos.
En el caso de la ciencia una muestra es aquella prueba que verifique la verdad de una proposición, ya sea una proposición inducida de una colección de hechos empíricos, o sea una proposición verificada a la luz de la crítica racional de una serie de fenómenos, en cualquier caso, a esa colección de hechos empíricos o serie de fenómenos se le llamará muestra, en la medida que es la muestra que demuestra las conclusiones lógicas de la inducción, o la verificación de la hipótesis empírica, elaborada por un científico o equipo científico.
Dentro de la epistemología cuantitativa uno de los métodos de análisis de datos para el estudio de conjuntos será la estadística y la probabilidad, de cuya fusión la teoría de Probabilidad Imposible desarrolla el campo de la estadística de la probabilidad o probabilidad estadística, donde para la crítica racional de la realidad se elaborarán muestras extraídas del universo para su explicación y comprensión.
La muestra por tanto es aquel conjunto de sucesos u ocurrencias sobre cuya distribución, en estadística descriptiva, se llegara una descripción de una realidad, y en estadística inferencial el contraste de hipótesis para la crítica de la tendencia.
En el Segundo Método de Probabilidad Imposible se distinguirán dos tipos de universos, infinitos o limitados, y dos tipos de muestras, la muestra de sujetos u opciones, y la muestra de puntuaciones directas o frecuencias. Y sobre la inversión de las muestras los estadísticos teóricos, individuales y muestrales, para los diferentes universos.
Los universos de opciones limitadas serán aquellos que sobre una serie de opciones se estudia la distribución de la frecuencia entre las opciones. El número de opciones determina la magnitud N, siendo la muestra de N opciones, pudiendo ser opciones limitadas natural o socialmente, o según criterios de política científica en caso de N variable.
Un caso de universo de opciones limitadas naturalmente, si estudiamos la distribución de los elementos químicos en una muestra, sería un universo limitado a las opciones de la tabla periódica. Un caso de universo limitado socialmente, la distribución del tipo de persona jurídica de las empresas privadas, según sean, sociedades unipersonales, limitadas, o anónimas, o cualquier otro perfil de persona jurídica reconocida por la legislación. Estudios de magnitud N variable, por ejemplo estudios de categorías discretas, variando el número de categorías dependiendo de las que determine la política científica, aunque siempre deberán ser suficientemente representativas y significativas, tal como se explica en el apartado 10 de Introducción a la Probabilidad Imposible, estadística de la probabilidad o probabilidad estadística, recientemente actualizada en enero del 2015. Un ejemplo de magnitud variable de categorías discretas, la distribución de la población por categorías según ingresos económicos anuales, cualquier subdivisión en categorías sería una entre las infinitas, en función de las cuales se delimita la clase social de pertenencia.
Una de las principales diferencias del Segundo Método de Probabilidad Imposible y lo que sería la estadística tradicional, que en Probabilidad Imposible se llamará primer método, explicado en el apartado 4 de Introducción a la Probabilidad Imposible, estadística de la probabilidad o probabilidadestadística, es que, mientras N es el número de opciones en Probabilidad Imposible, para la estadística tradicional N es la frecuencia total. Siendo una diferencia esencial, por cuanto en función de cómo se defina N dependerán todas las posteriores definiciones de la estadística y la probabilidad.
En los universos de opciones limitadas, en el Segundo Método la muestra de opciones N será una muestra previamente delimitada, ya bien por el propio modelo empírico, natural o social, o la política científica, luego la verdadera selección muestral no será N, la verdadera selección muestral será la muestra de puntuaciones directas o frecuencias: si hacemos un estudio de si sale cara o cruz al lanzar una moneda la verdadera selección muestral es el número de lanzamientos, si hacemos un estudio de la distribución de trabajadores por categorías profesionales, la verdadera selección muestral es la cantidad de trabajadores que se incluyan en el estudio, si es sólo en una empresa, o a toda la población, ya sea a nivel nacional, o la población mundial. A cada una de puntuaciones directas o frecuencia se la designará con el símbolo “xi”, luego la muestra de puntuaciones directas o frecuencias será igual al sumatorio de todas las puntuaciones directas o frecuencias, simbolizándose de la siguiente forma, “∑xi”, sumatorio de puntuaciones directas o frecuencias.
Los universos de sujetos u opciones infinitos serán aquellos en donde se estudia la distribución de las puntuaciones directas, a partir de la medición de una cualidad determinada que se quiere conocer del universo, entre los sujetos que son tratados estadísticamente como opciones, motivo por el cual se denominarán universos de sujetos u opciones, de los cuales cabe la hipótesis que tiendan a infinito. La muestra N será la muestra de N sujetos u opciones, siendo necesaria la selección muestral. Y también se englobarían en este tipo de universo los estudios poblacionales, dado que, aunque sea una población y no halla selección muestral en apariencia, en realidad, la propia población es la selección muestral, dado que se selecciona a una población en un momento determinado de su historia, siendo una muestra del comportamiento de la población en la historia.
Ya sea en universos de opciones limitadas, natural o socialmente, o de opciones variables, o sea un universo de sujetos u opciones infinitos, donde se integra el estudio de la distribución de puntuaciones directas en una población, la muestra N será siempre la muestra de sujetos u opciones, ya sea la muestra de opciones limitadas en universos limitados, o la muestra de sujetos u opciones en universos infinitos.
Y en función de la definición de N es cuando se puede empezar a definir los estadísticos teóricos, en la medida que N tendrá valor multifuncional, tanto para universos de sujetos u opciones infinitos y de opciones limitadas, por cuanto, independientemente del tipo de universo, la inversión de N será igual a la media aritmética de las probabilidades empíricas, siendo las probabilidades empíricas en todo universo igual al valor absoluto de la puntuación directa o frecuencia entre sumatorio de los valores absolutos de todas las puntuaciones directas o frecuencias. La media aritmética de las probabilidades empíricas en cualquier muestra de cualquier universo será siempre igual a inversión de N, 1/N, definiendo N en tanto que muestra de sujetos u opciones para todo tipo de universo.
La única excepción en que la inversión de N, 1/N, no será igual a media aritmética será en las muestras de ceros, aquellas muestras en donde absolutamente todas las probabilidades empíricas de todos los sujetos u opciones de la muestra sean igual a probabilidad cero, Probabilidad Imposible. El motivo por el cual, por ejemplo, en universos de sujetos u opciones, infinitos se puede dar el caso que una muestra sea una muestra de ceros, es porque la cualidad que miden las puntuaciones directas o frecuencias sea una cualidad negativa o no ideal. Por ejemplo si en el estudio del tratamiento de una enfermedad se descubre un fármaco que cura la enfermedad, un modo de verificar empíricamente que el fármaco es útil, es mediante demostrar que a través de la aplicación del fármaco, dada una muestra de N pacientes, la probabilidad empírica de síntomas por paciente se reduce a cero, es decir, cero probabilidad empírica de síntomas si se administra la medicación, luego sería una muestras de ceros.
En el caso de universos de opciones limitadas, si todas las opciones fueran negativas, lo ideal sería cero frecuencia en todas las opciones, aunque, para este tipo de casos, siempre que halla alguna gradación en la gravedad de las opciones, mejor que el Segundo Método sería el estudio a través del Impacto del Defecto explicado en apartado 21 de Introducción a la Probabilidad Imposible, estadística de la probabilidad o probabilidad estadística.
El motivo por el cual la inversión de N no actuaría de media aritmética en muestras de ceros, es porque mientras en el primer método, estadística tradicional, la media aritmética de cero puntuaciones o cero frecuencia es cero, luego dispersión cero, en el Segundo Método de Probabilidad Imposible, en tanto que N no es distinta de cero, entonces la inversión de N no es distinta de cero, luego independientemente que la muestra sea una muestra de ceros, los Niveles de Sesgo de sujeto u opción serán igual al valor absoluto de inversión de N, 1/N, luego la Desviación Media y la Desviación Típica serán igual a inversiónde N, 1/N.
La razón por la cual, incluso aunque se trata de muestras de ceros, la inversión de N, 1/N, sigue siendo distinta de cero, aunque la media aritmética sea cero, es porque, el hecho que la inversión de N, 1/N, normalmente mida la media aritmética, salvo en muestras de ceros, es un valor añadido a la verdadera función que cumple la inversión de N, 1/N, en la probabilidad estadística, su verdadera función es la de ser probabilidad teórica de ocurrencia en igualdad de oportunidades por azar, dado que, si en un momento la distribución de las puntuaciones directas o frecuencias de los sujetos u opciones fuera realmente por azar, entonces la tendencia normal de las probabilidades empíricas sería a inversión de N, 1/N.
De este modo, en función de la diferencia de si a N es la frecuencia total, o N son los sujetos u opciones, dependerá el resto de las definiciones de la probabilidad estadística. Mientras para la estadística tradicional N es la frecuencia total, en Probabilidad Imposible N será la muestra de sujetos u opciones en cualquier tipo de universo, infinito o limitado, y en función de esta definición las primeras funciones que desarrolla para cualquier universo la inversión de N, 1/N, es la de ser al mismo tiempo media aritmética, salvo para muestras de ceros, y probabilidad teórica de ocurrencia en igualdad de oportunidades por azar.
Además, para el caso particular de universos de sujetos u opciones inifinitos, la inversión de N, 1/N, tendrá asociadas funciones adicionales, probabilidad de dispersión teórica, dado que conforme la selección muestral N aumente en tendencia a infinito la inversión de N, 1/N, tiende a cero, luego la dispersión, individual o muestra, del Nivel de Sesgo normal de sujeto u opción o la Desviación Media y la Desviación Típica, tenderán a cero conforme N tienda a infinito.
Y al mismo tiempo que inversión de N, 1/N, es probabilidad de dispersión teórica en universos infinitos, para este mismo tipo de universo la inversión de N, 1/N, será igual a probabilidad de error de representatividad muestral, en la medida que conforme N tienda a infinito, e incluya en la selección muestral más casos concretos de sucesos u ocurrencias del universo, la muestra N tiende a ser más representativa, luego la probabilidad de error de representatividad muestral será igual a inversión de N, 1/N.
Mientras en los universos infinitos la probabilidad de dispersión teórica, y probabilidad de error de representatividad muestral, son funciones que realiza inversión de N, 1/N, en los universos de opciones limitadas, donde la verdadera selección muestral es la muestra de puntuaciones directas o frecuencias, ∑xi, las funciones de probabilidad de dispersión teórica y probabilidad de error de representatividad muestral serán ejercidas por la inversión de las puntuaciones directas o frecuencias, 1/∑xi. Aunque la inversión de N, 1/N, seguirá ejerciendo de modo universo, tanto en universos limitados e infinitos, de media aritmética de las probabilidades empíricas, y probabilidad teórica de igualdad de oportunidades al azar.
El motivo por el cual en universos de opciones limitadas la inversión de las puntuaciones directas o frecuencias es probabilidad de dispersión teórica, es porque, cuanto más aumente la muestra de puntuaciones directas o frecuencias se reduce la dispersión entre las opciones. Cuantos más lanzamientos hagamos de una moneda, la probabilidad empírica de cara o cruz tiende a equiparse, en una maternidad, cuantos más partos, más tendencia a equipararse la probabilidad empírica de nacimientos de niños y niñas, en unas elecciones normalmente a mayor participación democrática mayor tendencia a nivelarse las opciones políticas, bajo condiciones normales.
En universos de opciones limitadas la dispersión entre las probabilidades empíricas tiende a reducirse conforme aumenta la muestra de puntuaciones directas o frecuencias, luego la probabilidad teórica de dispersión en universos limitados es inversamente proporcional, a la muestra de puntuaciones directas o frecuencias, de modo que la inversión de las puntuaciones directas o frecuencias, 1/∑xi, es igual a la probabilidad teórica de dispersión en universos limitados, en condiciones normales.
Y al mismo tiempo que la inversión de puntuaciones directas o frecuencias, 1/∑xi , actúa de probabilidad teórica de dispersión en universos limitados, es simultáneamente probabilidad de error de representatividad muestral, por cuanto la representatividad muestral en un estudio de opciones limitadas será de igual modo inversamente proporcional a la muestra de puntuaciones dircetas o frecuencias, 1/∑xi.
De este modo, según se defina universo, sujeto u opción, y muestra, las definiciones en probabilidad estadística puede ser cualitativamente y cuantitativamente muy distintas, suponiendo cambios significativos en las operaciones matemáticas, en el caso de Probabilidad Imposible una redefinición de los conceptos tradicionales de la estadística, a la luz de una nueva perspectiva tendente a la síntesis metodológica de la estadística y la probabilidad.
Rubén García Pedraza, Madrid 14 de febrero del 2015