Novasinergia 2026, 9(1), 138-159. https://doi.org/10.37135/ns.01.17.08 http://novasinergia.unach.edu.ec
Artículo de Investigación
Modelo matemático en primera aproximación para la relación entre los
estadísticos de prueba de normalidad y el valor de p
A first-approximation mathematical model for the relationship between normality test
statistics and the p-value
José Mendoza Rodríguez1, Andrés Salazar Andrade2
1Departamento de Matemática, Unidad Educativa Joaquín Lalama, Ambato, Ecuador, 180150;
2Departamento de Ciencias, Unidad Educativa Balandra-Cruz del Sur, Guayaquil, Ecuador, 090150;
andreuspd0909@hotmail.com
*Correspondencia: mendo-10@hotmail.com
Citación: Mendoza, J. & Salazar,
A., (2026). Modelo matemático en
primera aproximación para la
relación entre los estadísticos de
prueba de normalidad y el valor de
p. Novasinergia. 9(1). 138-159.
https://doi.org/10.37135/ns.01.17.0
8
Recibido: 20 junio 2025
Aceptado: 12 noviembre 2025
Publicado: 08 enero 2026
Novasinergia
ISSN: 2631-2654
Resumen: Las pruebas de normalidad son consideradas como el punto de partida
para la estadística paramétrica; sin embargo, es importante comprender el
comportamiento de los estadísticos y el valor de p para tomar decisiones
significativas. El objetivo de la investigación fue diseñar un modelo matemático
que permita identificar patrones o tendencias existentes entre el estadístico y el
valor de p. La metodología utilizada consistió en aplicar las pruebas de
normalidad univariadas más comunes a variables como la precipitación, crudo y
temperatura, mediante un análisis de submuestras según las características de
cada prueba. Cada submuestra proporcionó el valor del estadístico y el valor de
p, los cuales fueron procesados mediante modelos de regresión clásicos como
primera aproximación: lineal, polinomial de grado 2 y 3, exponencial y
logarítmica. La validación de los modelos se realizó mediante el coeficiente de
determinación (R2), con valores de R2 más altos: en la prueba KS, para la variable
crudo (R2 = 0,9784); en la prueba AD, para la variable precipitación (R2 = 1); en la
prueba JB, para la variable temperatura (R2 = 0,8902); en la prueba CvM, para la
variable temperatura (R2 = 1); en la prueba M.KS, para la variable temperatura (R2
= 0,936); en la prueba P ², para la variable precipitación (R2 = 0,3798); en la prueba
SF, para la variable temperatura (R2 = 0,6019); y en la prueba SW, para la variable
crudo (R2 = 0,3712). Realizar este tipo de análisis preliminar permite a los
investigadores tomar decisiones más efectivas y óptimas al momento de
comprobar el supuesto de la normalidad univariadas en un conjunto de datos.
Palabras clave: Estadístico de prueba, Modelo matemático, Normalidad,
Regresión, valor de p.
Copyright: 2026 derechos otorgados
por los autores a Novasinergia.
Este es un artículo de acceso abierto
distribuido bajo los términos y
condiciones de una licencia de Creative
Commons Attribution (CC BY NC).
(http://creativecommons.org/licenses/b
y/4.0/).
Abstract: Normality tests are considered the starting point of parametric statistics;
however, it is essential to understand the behavior of test statistics and p-values to make
meaningful decisions. The objective of this study was to design a mathematical model
capable of identifying existing patterns or trends between the test statistic and the p-value.
The methodology consisted of applying the most common univariate normality tests to
variables such as precipitation, crude oil, and temperature, using a subsample analysis
tailored to each test. Each subsample provided both the test statistic and the p-value, which
were processed using classical regression models as a first approximation: linear, second-,
and third-degree polynomials, exponential, and logarithmic. Model validation was
performed using the coefficient of determination (R²), obtaining the highest values as
follows: in the KS test, for the crude oil variable (R² = 0.9784); in the AD test, for the
precipitation variable (R² = 1); in the JB test, for the temperature variable (R² = 0.8902);
in the CvM test, for the temperature variable (R² = 1); in the M.KS test, for the temperature
variable (R² = 0.936); in the P χ² test, for the precipitation variable (R² = 0.3798); in the
SF test, for the temperature variable (R² = 0.6019); and in the SW test, for the crude oil
variable (R² = 0.3712). Conducting this type of preliminary analysis enables researchers
to make more effective and optimal decisions when assessing the assumption of univariate
normality in a dataset.
Keywords: Test statistics, Mathematical model, Normality, Regression, p-value.
Novasinergia 2026, 9(1), 138-159 139
1. Introducción
Los datos pueden generar resultados incorrectos si no se realiza un análisis previo de
los mismos. En muchos casos, es importante aplicar un filtrado y limpieza de los datos con
la finalidad de que cumplan un formato específico y acorde a lo que se desea analizar,
corrigiendo o eliminando errores e inconsistencias en la base de datos, el objetivo es obtener
datos de calidad [1]. Es importante indicar que, si las técnicas de recolección de información
son eficientes, el tiempo de la preparación de los datos disminuye considerablemente y
resulta tomar decisiones s creíbles. En cambio, el uso de técnicas deficientes provocaría
incertidumbre y resultados ambiguos [2].
La elección de un gráfico estadístico depende en gran medida de las variables de estudio,
además, dicha representación debe adaptarse a las condiciones específicas y a la naturaleza
de cada una. Es importante comprender el comportamiento del tipo de variable para que
los datos a recolectar tengan mayor validez y puedan encajar en un gráfico cuya
interpretación sea significativa, enriquecedora y de fácil comprensión [3]. La visualización
se convierte en una herramienta indispensable para representar un conjunto de datos (data
set), a través de los gráficos estadísticos se pueden generar patrones, relaciones entre
variables, tendencias y posibles anomalías. La adaptabilidad es una de las características
importantes de los gráficos, se ajustan a las necesidades de las variables, sus datos y el tipo
de análisis a realizar, ya sea univariado, bivariado o multivariado [4].
La distribución normal también definida como una distribución gaussiana, tiene la finalidad
de verificar que los datos se ajusten a una nea de tendencia basado en la media poblacional
(μ) o muestral (x ) y a la desviación estándar poblacional (σ) o muestral (s) como medida de
tendencia central y dispersión respectivamente. Tiene como característica principal la
simetría de los datos donde existe una concentración en forma de campana de Gauss, lo que
indica que la mayoría de los valores se agrupan cerca del centro de la distribución,
reduciendo gradualmente hacia los extremos [5]. Si se refiere a una muestra, el criterio de
simetría se convierte en una condición ideal, conociendo que los datos son recolectados con
un error muy probable desde cómo se define la variable de estudio hasta su respectiva
medición. En otras palabras, la existencia de una asimetría (skewness) en los datos tiene
referencia a los sesgos o ligeros desvíos que se producen por los valores atípicos (outliers) o
por la propia naturaleza de los datos [6].
La importancia de la distribución normal interfiere en la capacidad de modelar fenómenos
en distintas áreas del conocimiento que son de base para la aplicación de técnicas de
inferencia estadísticas que permiten predecir o estimar sobre los resultados basados en la
normalidad. El tamaño de la muestra juega un papel crucial en la disminución del error
muestral, mientras mayor sea el tamaño de la muestra, mayor precisión de las estimaciones
y mejor representatividad con respecto a la población [7]. En muchos de los casos, los
grandes volúmenes de datos al ser procesados representan un costo computacional
significativo, por eso la importancia de trabajar con una muestra adecuada. En este contexto,
seleccionar un muestreo probabilístico es la mejor alternativa para que los datos sean
considerados en base a un criterio estadístico según las características propias de la
población [8].
Novasinergia 2026, 9(1), 138-159 140
Las pruebas de normalidad están sujetas en comprobar si la hipótesis nula cumple con la
normalidad de los datos en base a una muestra predefinida. Cada prueba de normalidad
proporciona o genera un valor de p, que representa la probabilidad de obtener un resultado
tan extremo basado en la suposición de que la hipótesis nula es verdadera [9]. El valor de p
toma valores distintos cuando los tamaños muestrales crecen o decrecen, es decir, que están
ligados por el tamaño de la muestra inicial. En muchos de los casos, la interpretación del
valor de p debe ser un punto de inflexión para seguir profundizando en el análisis, el valor
de p no debe ser la única vía para tomar decisiones en una investigación [10]. El valor de p
debe ser respaldado por otros parámetros estadísticos que evidencien el comportamiento
de una variable. Forzar en rechazar la hipótesis nula basado en un valor de p, puede
ocasionar un error en seleccionar una prueba estadística para realizar inferencia sobre
ciertas variables definidas en un estudio.
Al diseñar un modelo matemático en una primera aproximación, se pueden emplear
modelos o expresiones matemáticas comunes o de mayor utilidad, como los modelos
lineales, cuadráticas (polinomio de grado 2), cúbicas (polinomio de grado 3), exponenciales,
logarítmicas, entre otros. Este tipo de modelos se utilizan para realizar ajustes de curva a los
datos que provienen de una muestra. Además, son considerados como modelos iniciales o
introductorios que orientan al investigador en la exploración de patrones o
comportamientos de las variables.
La validación de un modelo es fundamental debido a que cada expresión matemática tiene
un comportamiento distinto que depende de los coeficientes definidos en el modelo. El uso
del coeficiente de determinación y la suma de los cuadrados de los errores son estadísticos
que permiten estimar la calidad del ajuste del modelo a los datos.
2. Metodología
El tipo de investigación se direccionó al modelado matemático, ya que el objetivo principal
fue diseñar una función o expresión matemática que relacione los estadísticos de prueba de
normalidad univariada con sus respectivos valores de p [11]. Además, se consideró de tipo
explicativo, dado que cada conjunto de datos seleccionados según las pruebas de
normalidad, genera ciertos valores de p en función al test aplicado.
El estudio en lo referente al nivel de investigación fue exploratorio debido a que la intención
era identificar patrones o relaciones en los datos como una primera aproximación [12].
Además, la finalidad de diseñar el modelo era encontrar la función o curva más adecuada
que se ajuste a su comportamiento, según los criterios de cada prueba de normalidad
univariada, ya sean estos direccionados en medir distancias o momentos, tomando como
referencia una distribución normal. Por tal razón, la exploración de los datos fue
indispensable para lograr un mejor ajuste y llevar el proceso de validación correspondiente.
La técnica utilizada fue la revisión documental mediante un análisis a profundidad de las
instituciones gubernamentales del Ecuador que recopilan y centralizan información
estadística. En particular, los datos se concentran en un Catálogo de Datos Abiertos donde
se permitió acceder a la información sin necesidad de seguir un proceso de solicitud de
acceso a la información pública. La finalidad de este catálogo es proporcionar criterios
Novasinergia 2026, 9(1), 138-159 141
técnicos y metodológicos a los usuarios para que puedan promover la investigación, el
emprendimiento y la innovación de la sociedad. De esta forma, se obtuvo los datos para el
desarrollo del estudio.
Para el diseño del modelo matemático en su primera aproximación se utilizaron diferentes
ajustes de curva según el comportamiento de los datos. Para definir el mejor ajuste se tomó
como referencia los valores del coeficiente de determinación (R2) y la suma de los cuadrados
de los errores SCE. R2 oscila entre 0 a 1, su interpretación indica que, mientras más cercano
sea el valor de R2 a 1, existe un mejor ajuste del modelo a la distribución de los datos. En
cambio, SCE indica que, si su valor es bajo, mejor es el ajuste o se considera más preciso el
modelo a un conjunto de datos.
Figura 1. Esquema relación R2 y SCE
Tabla 1. Umbrales referenciales de R2
R2
Interpretación
20,25R
Relación muy débil.
2
0,25 0,50R
Relación débil.
Relación moderada.
20,75R
Relación sustancial.
Nota. Adaptado de [13]
2.1. Población y muestra
Los datos considerados para el análisis estadístico fueron: la temperatura mínima
absoluta, la producción de petróleo mensual operativo y la precipitación, los mismos que
fueron descargados de la plataforma de datos abiertos del Ecuador
(https://www.datosabiertos.gob.ec/) y proporcionados por el Instituto Nacional de
Meteorología e Hidrología INAMHI y la Empresa Pública de Hidrocarburos del Ecuador
- EP PETROECUADOR.
En lo que concierne a la muestra, se empleó un muestreo no probabilístico por conveniencia,
dado que los datos provienen de fuentes oficiales y confiables. Esta elección permite realizar
un análisis estadístico válido y transparente, considerando que los datos son reales y cuya
disponibilidad es de acceso libre. Además, utilizar un muestreo no probabilístico responde
al propósito de caracterizar fenómenos observables a partir de datos recolectados, sin
intervención ni manipulación de las variables.
Novasinergia 2026, 9(1), 138-159 142
Para la temperatura mínima absoluta, se consideró como muestra el primer semestre del
año 2019 de las diferentes estaciones meteorológicas ubicadas en puntos estratégicos del
territorio, el objetivo fue obtener mediciones distintas y representativas. En lo que
corresponde a la producción de petróleo mensual operativo, se emplearon datos
comprendidos entre los años 2022 y 2025. Para la variable precipitación, se analizaron datos
registrados en los años 2018 y 2019. Las muestras específicas de cada variable se detallan en
la tabla 2.
Tabla 2. Descripción de variables y muestra
Variable
Descripción
Unidad de medida
Muestra
Temperatura
mínima absoluta
Datos sobre la temperatura
máxima absoluta de las
principales estaciones
meteorológicas del
INAMHI a nivel nacional.
Grado Celsius (°C)
418
Producción de
petróleo mensual
operativo
Datos sobre los volúmenes
de barriles Promedio por
mes (BPPM) por cada
activo.
Barriles
535
Precipitación
Datos sobre la
precipitación total mensual
de las principales
estaciones meteorológicas
del INAMHI a nivel
nacional.
Milímetros (mm)
669
Nota. Datos obtenidos de Datos Abiertos Ecuador: Producción de petróleo mensual operativo
(https://www.datosabiertos.gob.ec/dataset/produccion-mensual-petroecuador), temperatura mínima absoluta
(https://www.datosabiertos.gob.ec/dataset/temperatura-minima-absoluta) y precipitación
(https://www.datosabiertos.gob.ec/dataset/precipitacion-total-mensual).
2.2. Tratamiento Estadístico
Sobre la metodología aplicada, se estructuró en base al enfoque, diseño y nivel de
investigación. Se estableció un enfoque cuantitativo por la naturaleza que provienen los
datos. Segundo, se utilizó un diseño no experimental debido a que no se manipuló la
variable de estudio [14], mencionar que el objetivo fue analizar el comportamiento de la
variable enfocado en los valores de las pruebas estadísticas preestablecidas con respecto a
los valores de p. Finalmente, el nivel de investigación utilizado fue descriptivo debido a que
el conjunto de datos analizados (muestra total
n
) se estableció en subconjuntos de datos
(submuestras
Ak
) donde
k
es el valor incremental para cada iteración en base a un valor
muestral inicial,
n
es el tamaño de la muestra para las pruebas Kolmogorov Smirnov (KS),
Shapiro Wilk (SW), Anderson Darling (AD), Jarque Bera (JB), Cramér-von Mises (CvM),
Lilliefors (M.KS), Pearson Chi-Cuadrado (P ²) y Shapiro-Francia (SF).
Para las pruebas KS, AD, JB, CvM, M.KS, P ² y SF, se utilizó
50k
observaciones con
incrementos de una observación adicional para cada submuestra y para la prueba SW
50,49,48,...,3k
con un proceso inverso donde existe decrementos en una observación
para cada submuestra. Se fijó
50k=
para la primera submuestra según las características
Novasinergia 2026, 9(1), 138-159 143
propias de la prueba SW y las adaptaciones específicas en cuanto al tamaño muestral. Para
las pruebas KS, SW, AD, JB, CvM, M.KS, P ² y SF se definieron las muestras  
 según la variable de análisis.
Tabla 3. Valores mínimo y máximo para las iteraciones de cada submuestra
Prueba
Valor muestral
inicial
Submuestra
Mínimo y máximo
KS
51k=
Incrementos de una
observación hasta alcanzar
el valor de
.n
AD
JB
CvM
M.KS
( ) ( )
mín 51,máxk k n==
P ²
SF
SW
50k=
Decrementos de una
observación hasta alcanzar
el valor mínimo de 3.
( ) ( )
mín 3, máx 50kk==
Nota. Los valores mínimos y máximos para cada submuestra se establecieron siguiendo criterios de sensibilidad al
tamaño muestral reportados en estudios comparativos recientes sobre pruebas de normalidad univariada. Los
estadísticos de prueba y sus valores de p varían con el número de observaciones, lo que justifica los incrementos y
decrementos aplicados en cada caso [15], [16] y [17].
Para aplicar las pruebas de normalidad univariada se adoptó un nivel de significancia de
0,05
=
, valor definido para conocer si las variables siguen una distribución normal y que
es aceptado en la literatura estadística para determinar si existe o no diferencias
significativas [18].
En las pruebas KS, AD, JB, CvM, M.KS, P ² y SF con
n
designada
, , ,...,
1 2 3
x x x xn
, se definió
las submuestras
1 2 3
, , ,...,
kk
A x x x x=
, con
51,52,53,..., .kn
En el caso de la prueba SW se
establecieron bloques sistemáticos (
Bm
) como se indica en la ecuación 2 con
50,49,48,...,3k
. La finalidad de utilizar bloques fue cubrir la mayor cantidad de datos
hasta acercarse al valor de
n
. La forma ampliada para las pruebas las pruebas KS, AD, JB,
CvM, M.KS, P ² y SF se detallan a continuación:
1 2 3 51
1 2 3 51 52
1 2 3 51 52 53
1 2 3 51 52 53
k
n
x x x x
x x x x x
M x x x x x x
x x x x x x x
=








(1)
Donde
Mk
es una matriz de orden
50n
fila y
n
columnas, las filas representa la cantidad
de submuestras y las columnas indica el número de observaciones.
En la prueba SW, en lo referente a los bloques, cada bloque empieza con un total de 50
observaciones, luego se inicia el proceso de iteración hasta alcanzar el valor mínimo
establecido.
󰇛󰇜 󰇛󰇜 í󰇛󰇜 (2)
Novasinergia 2026, 9(1), 138-159 144
Donde
1,2,3,..., 50
n
m=


y 󰇛  󰇜garantiza que no se exceda el tamaño muestral de
cada variable de estudio.
Para cada bloque la ecuación 3 define su conjunto de observaciones que depende del
número de bloque y sus iteraciones de manera decremental. La forma ampliada se
representa en la ecuación 4.
 󰇛󰇜 󰇛󰇜 󰇛󰇜󰇛󰇜 (3)
1 2 3 50
1 2 3 49
1 2 3 48
,
1 2 3 3
mk
x x x x
x x x x
M x x x x
x x x x
=





(4)
Donde cada fila de la matriz
,mk
M
representa cada submuestra en base al bloque definido
y las columnas indica el número de observaciones.
Cada una de las pruebas según la cantidad de submuestras y bloques analizados
anteriormente, generan los estadísticos de prueba y los valores de p respectivos en cada
iteración, por lo tanto, cada valor obtenido se representó en forma de conjunto de pares
ordenados (
). Cada submuestra fue evaluada de forma independiente, este procedimiento
permitió analizar la variabilidad de los resultados según el tamaño muestral, identificando
posibles fluctuaciones en el comportamiento del estadístico y el valor de p.
( )
, 51,52,...,
KS kk
D p k n
=|
(5)
( )
2, 51,52,...,
AD k
k
A p k n
=|
(6)
( )
, 51,52,...,
JB kk
JB p k n
=|
(7)
( )
2, 51,52,...,
CvM k
k
W p k n
=|
(8)
( )
., 51,52,...,
M KS kk
D p k n
=|
(9)
( )
2, 51,52,...,
kk
PP p k n
=|
(10)
( )
, 51,52,...,
SF kk
W p k n
=|
(11)
( )
, 50,49,...,3
SW kk
W p k
=|
(12)
La información obtenida en la exploración de los datos, tanto en la visualización de gráficos
estadístico como de los resultados derivados de la inferencia estadísticas mediante la
aplicación de diferentes pruebas de normalidad univariada, fue procesada con el software
RStudio (versión 2024.12.1) utilizando los paquetes y librerías: readxl, ggplot2, nortest, tseries,
GGally, dplyr, tidyr y systemfonts [19].
Novasinergia 2026, 9(1), 138-159 145
3. Resultados
Las pruebas de normalidad con sus respectivos estadísticos están orientadas a medir
distancias o momentos estadísticos, dependiendo del enfoque con el que se analice el
conjunto de datos. Es importante explorar cada estadístico de forma individual para
identificar patrones o tendencia en su comportamiento según las variables de estudio. Sin
embargo, es adecuado, realizar una exploración por pares con el objetivo de evaluar la
correlación y afinidad entre estadísticos.
Si se habla de correlación se debe tener en cuenta que su estadístico está acotado entre
1,1
donde -1 indica una correlación perfecta negativa y 1 una correlación perfecta positiva. Para
la variable precipitación (ver Figura 2) mediante una matriz de correlación entre
estadísticos, se obtuvo que las pruebas KS, AD, CvM, M.KS, P ² y SF tienen una alta
correlación al compararse entre sí. El estadístico de la prueba JB tiene una correlación
moderada en comparación con los demás estadísticos, esto sucede, debido a que la prueba
JB está direccionado en medir el tercer y cuarto momentos estadístico (asimetría y curtosis)
y las otras pruebas se centran en medir distancias entre la distribución empírica y la teórica.
Por otro lado, en las pruebas KS y M.KS se obtuvo una correlación perfecta, esto se debe a
que la prueba M.KS es una modificación o adaptación de la prueba KS, la diferencia está en
el cálculo del valor de p.
Figura 2. Matriz de correlación para la variable precipitación
Para la variable producción de petróleo mensual operativo (ver Figura 3) el comportamiento
de los estadísticos difiere considerablemente. La prueba KS tiene una alta correlación con
las pruebas M.KS (correlación perfecta, como se explicó previamente) y SF, sin embargo, la
correlación es baja en los demás estadísticos. La prueba AD mantiene una alta correlación
con las pruebas CvM y P ², mientras que con el resto la correlación es baja y moderada. La
prueba JB presenta una correlación baja y moderada con respecto a los otros estadísticos
Novasinergia 2026, 9(1), 138-159 146
(evidente porque mide momentos). Por último, se observa una fuerte correlación entre las
pruebas CvM y P ².
Figura 3. Matriz de correlación para la variable crudo
La variable temperatura mínima absoluta (ver Figura 4) la correlación entre estadísticos
varía de moderada a alta, tanto positivas como negativas. Esto sugiere una consistencia o
mayor concordancia en las pruebas de normalidad, evidenciando un mejor comportamiento
general de los estadísticos al evaluar la distribución de esta variable.
Figura 4. Matriz de correlación para la variable temperatura
Es importante señalar que, en las figuras 2, 3 y 4, la matriz de correlación presenta, en la
diagonal principal, las funciones de densidad de cada estadístico según la variable
Novasinergia 2026, 9(1), 138-159 147
analizada. Debajo de la diagonal principal se encuentran los gráficos de dispersión entre
pares, mientras que en la parte superior se muestran los coeficientes de correlación de
Pearson correspondientes a cada par, indicando el grado de asociación entre estadísticos.
Esta representación gráfica permite obtener una visión más clara sobre la relación de los
estadísticos de las diferentes pruebas de normalidad univariada y así facilitar la
interpretación de los resultados, identificación de patrones que se ajustan a un modelo
determinado, corroboración de similitudes y diferencias entre pruebas que han sido
modificadas o reajustadas y observación del comportamiento de los datos cuando se
utilizan pruebas en medidas de distancia, en comparación con aquellas centradas en
momentos estadísticos.
Figura 5. Ajuste de curva valor de p y el estadístico D
En lo que corresponde a la prueba KS, las variables crudo y temperatura presentaron un
mejor ajuste de curva en su primera aproximación mediante modelos exponencial (ver
ecuación 13) y polinomial de grado 3 (ver ecuación 14) respectivamente. En el caso al
modelo exponencial, se produce un decrecimiento debido al exponente negativo, esto
significa que el valor de p disminuye exponencialmente a medida que el estadístico D
aumenta, y viceversa. Por otro lado, en el modelo polinomial de grado 3, la interpretación
de los coeficientes influye a medida que el estadístico D varía, el valor de p puede disminuir
o incrementar dependiendo del equilibrio de los términos lineales, cuadrático y cúbico. Los
modelos exponencial y polinomial de grado 3 están acotados con
0,0805;0, 4935D
y
0,0539;0,1610D
respectivamente.
110,0911
ˆ135,0617 D
pe
=
(13)
23
ˆ0,1621 3,1162 2,1967 0,2921p D D D= +
(14)
Novasinergia 2026, 9(1), 138-159 148
Figura 6. Ajuste de curva valor de p y el estadístico A2
En lo que respecta a la prueba AD, las variables precipitación y temperatura presentaron un
mejor ajuste de curva en su primera aproximación mediante modelos exponenciales (ver
ecuaciones 15 y 16) en ambos casos. En los modelos exponenciales, se produce un
decrecimiento debido al exponente negativo, esto significa que el valor de p disminuye
exponencialmente a medida que el estadístico A2 aumenta, y viceversa. Los modelos
exponenciales están acotados con
20,4227;45,2029A
y
20,5825;16,0537A
respectivamente. Es importante indicar que, la notación matemática del estadístico es A2, el
superíndice no indica que al estadístico se debe elevar al cuadrado.
( )
2
5,6865
ˆ3, 4294 A
pe
=
(15)
( )
2
5,6845
ˆ3,5297 A
pe
=
(16)
Figura 7. Ajuste de curva valor de p y el estadístico JB
Con respecto a la prueba JB, las variables precipitación, producción de petróleo mensual
operativo y temperatura mínima absoluta presentaron un mejor ajuste de curva en su
Novasinergia 2026, 9(1), 138-159 149
primera aproximación mediante modelos logarítmico (ver ecuación 17) y polinomial de
grado 3 (ver ecuaciones 18 y 19) respectivamente. En el caso al modelo logarítmico, el
coeficiente negativo que acompaña a la expresión logarítmica indica que, el valor de p
disminuye a medida que el estadístico JB aumenta, y viceversa. Por otro lado, en el modelo
polinomial de grado 3, la interpretación de los coeficientes influye a medida que el
estadístico JB varía, el valor de p puede disminuir o incrementar dependiendo del equilibrio
de los términos lineales, cuadrático y cúbico. Los modelos logarítmico y polinomial de
grado 3 están acotados con
2,394;3661,102 ,JB
4,565;165,741JB
y
3,670;42, 403JB
respectivamente.
( )
ˆ0,0567 0,0145logp JB=−
(17)
23
ˆ0,004 0,0704 0,0701 0,1207p JB JB JB= +
(18)
23
ˆ0,0352 0,6677 0,4426 0,3241p JB JB JB= +
(19)
Figura 8. Ajuste de curva valor de p y el estadístico W2
En lo que corresponde a la prueba CvM, las variables precipitación, crudo y temperatura
presentaron un mejor ajuste de curva en su primera aproximación mediante modelos
exponenciales (ver ecuaciones 20 a 22) en todos casos. En los modelos exponenciales, se
produce un decrecimiento debido al exponente negativo, esto significa que el valor de p
disminuye exponencialmente a medida que el estadístico W2 aumenta, y viceversa. Los
modelos exponenciales están acotados con
20,0597;8,1505 ,W
20,5255;6,4766W
y
20,0804;2,5972W
respectivamente. Es importante indicar que, la notación matemática del
estadístico es W2, el superíndice no indica que al estadístico se debe elevar al cuadrado.
( )
2
30,5783
ˆ2,3317 W
pe
=
(20)
( )
2
19,6693
ˆ0,0485 W
pe
=
(21)
( )
2
31,1508
ˆ2,4986 W
pe
=
(22)
Novasinergia 2026, 9(1), 138-159 150
Figura 9. Ajuste de curva valor de p y el estadístico D'
En lo que respecta a la prueba M.KS, la variable temperatura presentó un mejor ajuste de
curva en su primera aproximación mediante un modelo exponencial (ver ecuación 23). El
modelo produce un decrecimiento debido al exponente negativo, esto significa que el valor
de p disminuye exponencialmente a medida que el estadístico D' aumenta, y viceversa. El
modelo exponencial está acotado con
0,0539;0,1610D
.
( )
103,8542
ˆ93,6107 D
pe
=
(23)
Figura 10. Ajuste de curva valor de p y el estadístico P
Con respecto a la prueba P ², las variables precipitación y temperatura presentaron un
mejor ajuste de curva en su primera aproximación mediante modelos logarítmico (ver
ecuación 24) y polinomial de grado 3 (ver ecuación 25) respectivamente. En el caso al
modelo logarítmico, el coeficiente negativo que acompaña a la expresión logarítmica indica
que, el valor de p disminuye a medida que el estadístico P aumenta, y viceversa. Por otro
lado, en el modelo polinomial de grado 3, la interpretación de los coeficientes influye a
medida que el estadístico P varía, el valor de p puede disminuir o incrementar dependiendo
Novasinergia 2026, 9(1), 138-159 151
del equilibrio de los términos lineales, cuadrático y cúbico. Los modelos logarítmico y
polinomial de grado 3 están acotados con
2,296;601,453P
y
11, 28;390,59P
respectivamente.
( )
ˆ0,3598 0,0763logpP=−
(24)
23
ˆ0,0271 0,4353 0,3416 0,4059p P P P= +
(25)
Figura 11. Ajuste de curva valor de p y el estadístico W'
En lo referente a la prueba SF, la variable temperatura mínima absoluta presentó un mejor
ajuste de curva en su primera aproximación mediante un modelo polinomial de grado 3
(ver ecuación 26). En el modelo polinomial, la interpretación de los coeficientes influye a
medida que el estadístico W' varía, el valor de p puede disminuir o incrementar
dependiendo del equilibrio de los términos lineales, cuadrático y cúbico. El modelo
polinomial de grado 3 está acotado con
0,8965;0,9848W
.
( ) ( ) ( )
23
ˆ362,8148 1170,145 1257,5917 450,3867p W W W
= + +
(26)
Figura 12. Ajuste de curva valor de p y el estadístico W
Novasinergia 2026, 9(1), 138-159 152
En lo que respecta a la prueba SW, las variables precipitación, producción de petróleo
mensual operativo y temperatura mínima absoluta presentaron un mejor ajuste de curva en
su primera aproximación mediante un modelo polinomial de grado 3 (ver ecuaciones 27 a
29). En el modelo polinomial, la interpretación de los coeficientes influye a medida que el
estadístico W varía, el valor de p puede disminuir o incrementar dependiendo del equilibrio
de los términos lineales, cuadrático y cúbico. Las modelos polinomiales de grado 3 están
acotados con
0,6298;0,9959 ,W
0,1530;1,0000W
y
0,4128;1,0000W
respectivamente.
( ) ( ) ( )
23
ˆ72,4629 274,1903 342,7814 141,8534p W W W= + +
(27)
( ) ( ) ( )
23
ˆ1,6939 11,6496 22,4849 13,0778p W W W= + +
(28)
( ) ( ) ( )
23
ˆ4,5067 21,0047 31,5604 15,4017p W W W= + +
(29)
Tabla 4. Comparación de modelos
Prueba
Variable
Modelo
R2
SCE
Lineal
0,1634
17,9472
Polinomial de grado 2
0,1856
17,4715
KS
Precipitación
Polinomial de grado 3
0,1953
17,2635
Exponencial
0,1966
17,2356
Logarítmico
0,1834
17,5191
Lineal
0,1632
0,0027
Polinomial de grado 2
0,3798
0,002
Crudo
Polinomial de grado 3
0,5081
0,0016
Exponencial
0,9784*
1e-4
Logarítmico
0,3018
0,0022
Lineal
0,5326
8,5229
Polinomial de grado 2
0,7972
3,6974
Temperatura
Polinomial de grado 3
0,8019*
3,612
Exponencial
0,7857
3,908
Logarítmico
0,6438
6,4957
Lineal
0,0098
0,3926
Polinomial de grado 2
0,0245
0,3868
AD
Precipitación
Polinomial de grado 3
0,0523
0,3758
Exponencial
1*
0
Logarítmico
0,074
0,3672
Lineal
0,0394
0
Polinomial de grado 2
0,1394
0
Crudo
Polinomial de grado 3
0,2316
0
Exponencial
NA
NA
Logarítmico
0,1045
0
Lineal
0,1697
0,2354
Polinomial de grado 2
0,2793
0,2039
Temperatura
Polinomial de grado 3
0,4002
0,1697
Exponencial
0,9999*
0
Logarítmico
0,3442
0,1855
JB
Lineal
0,0072
0,8001
Polinomial grado 2
0,0224
0,7879
Precipitación
Polinomial grado 3
0,0322
0,78
Exponencial
NC
NC
Logarítmico
0,2003*
0,6445
Lineal
0,0568
0,0824
Polinomial grado 2
0,113
0,0775
Crudo
Polinomial grado 3
0,2797*
0,0629
Exponencial
NC
NC
Logarítmico
0,1732
0,0722
Lineal
0,5315
0,3931
Novasinergia 2026, 9(1), 138-159 153
Prueba
Variable
Modelo
R2
SCE
Polinomial grado 2
0,765
0,1972
Temperatura
Polinomial grado 3
0,8902*
0,0921
Exponencial
NC
NC
Logarítmico
0,7436
0,2151
CvM
Lineal
0,0126
0,6455
Polinomial de grado 2
0,028
0,6354
Precipitación
Polinomial de grado 3
0,0535
0,6188
Exponencial
1*
0
Logarítmico
0,0858
0,5977
Lineal
0,0701
0
Polinomial de grado 2
0,2161
0
Crudo
Polinomial de grado 3
0,3361
0
Exponencial
0,9998*
0
Logarítmico
0,1867
0
Lineal
0,1975
0,722
Polinomial de grado 2
0,3303
0,6025
Temperatura
Polinomial de grado 3
0,4664
0,4801
Exponencial
1*
0
Logarítmico
0,4172
0,5243
M.KS
Lineal
0,0257
3,0186
Polinomial de grado 2
0,0274
3,0133
Precipitación
Polinomial de grado 3
0,0275
3,0132
Exponencial
0,0272
3,0139
Logarítmico
0,0275
3,0131
Lineal
0,0408
0
Polinomial de grado 2
0,1053
0
Crudo
Polinomial de grado 3
0,162
0
Exponencial
NC
NC
Logarítmico
0,0834
0
Lineal
0,3773
1,2508
Polinomial de grado 2
0,7419
0,5184
Temperatura
Polinomial de grado 3
0,8585
0,2842
Exponencial
0,936*
0,1286
Logarítmico
0,5055
0,9933
P ²
Lineal
0,0637
8,9564
Polinomial de grado 2
0,1686
7,953
Precipitación
Polinomial de grado 3
0,3068
6,6308
Exponencial
NC
NC
Logarítmico
0,3798*
5,9327
Lineal
0,0049
0
Polinomial de grado 2
0,0191
0
Crudo
Polinomial de grado 3
0,0324
0
Exponencial
NC
NC
Logarítmico
0,0092
0
Lineal
0,1395
1,1687
Polinomial de grado 2
0,2254
1,052
Temperatura
Polinomial de grado 3
0,3467*
0,8873
Exponencial
NC
NC
Logarítmico
0,2829
0,9739
SF
Lineal
0,0106
0,4465
Polinomial de grado 2
0,0246
0,4402
Precipitación
Polinomial de grado 3
0,0435
0,4316
Exponencial
NC
NC
Logarítmico
0,01
0,4468
Lineal
0,0885
0
Polinomial de grado 2
0,193
0
Novasinergia 2026, 9(1), 138-159 154
Prueba
Variable
Modelo
R2
SCE
SF
Crudo
Polinomial de grado 3
0,2595
0
Exponencial
NC
NC
Logarítmico
0,0702
0
Lineal
0,3336
0,108
Polinomial de grado 2
0,5072
0,0799
Temperatura
Polinomial de grado 3
0,6019*
0,0645
Exponencial
NC
NC
Logarítmico
0,328
0,1089
SW
Lineal
0,15
28,6284
Polinomial de grado 2
0,2425
25,514
Precipitación
Polinomial de grado 3
0,3081*
23,3045
Exponencial
NA
NA
Logarítmico
0,1348
29,1406
Lineal
0,1431
20,3126
Polinomial de grado 2
0,2623
17,4858
Crudo
Polinomial de grado 3
0,3712*
14,9038
Exponencial
NC
NC
Logarítmico
0,0945
21,4644
Lineal
0,1133
6,5641
Polinomial de grado 2
0,1857
6,0284
Temperatura
Polinomial de grado 3
0,2442*
5,5952
Exponencial
NC
NC
Logarítmico
0,0944
6,704
Nota. El símbolo * indica el modelo con mejor ajuste. NC indica que el modelo no converge
4. Discusión
Para las variables precipitación, crudo y temperatura consideradas en el análisis, se
aplicaron las pruebas de normalidad univariadas KS, AD, JB CvM, M.KS, P ² y SF en base
a incrementos de una observación con muestra inicial de 50 hasta completar la muestra total
correspondiente a cada variable. Cada submuestra generó un par ordenado compuesto por
el estadístico de cada prueba y el valor de p.
Como primera aproximación, los modelos evaluados fueron: lineal, polinomio de grado 2 y
3, exponencial y logarítmica. La validación de cada modelo se realizó considerando el
coeficiente de determinación (R2), estableciendo un valor mínimo referencial (umbral
mínimo) de 0,2 para aceptar la expresión matemática obtenida. Los modelos con un R2
inferior a 0,2 no fueron considerados. El valor de R2 está acotado entre
0,1 ,
donde 0 indica
ausencia de relación entre las variables y 1 representa una relación perfecta o ajuste de curva
ideal (ver umbrales de R2 en la tabla 1).
El R2 ajustado resulta de mucha utilidad cuando se incorpora variables predictoras
(variables de entrada o independientes), las cuales no formaron parte en la presente
investigación. Además, en el análisis de cada variable según las pruebas de normalidad
aplicadas, los valores de R2 ajustado fueron inferiores a los de R2. Con respecto a la SCE, se
utilizó únicamente para verificar el comportamiento siguiendo el esquema relacional entre
R2 y SCE, como se muestra en la figura 1.
Novasinergia 2026, 9(1), 138-159 155
Para la prueba KS, las variables crudo y temperatura presentaron un mejor ajuste a los
modelos exponencial (
20,9784R=
) y polinomial de grado 3 (
20,8019R=
) respectivamente, al
analizar la relación entre el estadístico D y el valor de p, dichos resultados son considerados
como una relación sustancial. Por otro lado, en la prueba AD, las variables precipitación y
temperatura se ajustaron de mejor manera al modelo exponencial (
21R=
y
20,9999R=
respectivamente) en la relación entre el estadístico A2 y el valor de p, siendo los resultados
una relación sustancial.
En el caso de la prueba JB, las variables precipitación, crudo y temperatura presentaron un
mejor ajuste a los modelos logarítmicos (
20,2003R=
), polinomial de grado 3 en las dos
últimas variables (
20,2797R=
y
20,8902R=
), al relacionar el estadístico JB y el valor de p.
Estos resultados se interpretan como relaciones muy débil y sustancial según los valores
obtenidos. En lo referente a la prueba CvM, las variables precipitación, crudo y temperatura
se ajustaron adecuadamente al modelo exponencial en todos los casos (
21R=
,
20,9998R=
y
21R=
) respectivamente. Esto significa que el estadístico W2 y el valor de p tienen una
relación sustancial.
Con respecto a la prueba M.KS, la variable temperatura tuvo un mejor ajuste al modelo
exponencial (
20,936R=
), lo que indica que la relación entre el estadístico D' y el valor de p
es sustancial. Por otro lado, para la prueba P ², las variables precipitación y temperatura
mostraron un mejor ajuste a los modelos logarítmico (
20,3798R=
) y polinomial de grado 3 (
20,3467R=
) respectivamente. Estos resultados indican que la relación entre el estadístico P
y el valor de p es débil. Finalmente, para la prueba SF, la variable temperatura presentó un
ajuste adecuado al modelo polinomial de grado 3 (
20,6019R=
), lo que sugiere que la relación
entre el estadístico W' y el valor de p es moderada.
Finalmente, la prueba SW, las variables precipitación, crudo y temperatura (analizado por
bloques) mostraron un mejor ajuste al modelo polinomial de grado 3 en todos los casos con
20,3081R=
,
20,3712R=
y
20,2442R=
. Estos valores obtenidos de R2 indican que la relación
entre el estadístico W y el valor de p es débil y muy débil.
Diseñar un modelo matemático que relacione las pruebas de normalidad univariadas con
sus respectivos estadísticos y los valores de p constituye el primer paso para profundizar
en el criterio del nivel de significancia. El valor de p puede generar controversias en la toma
de decisiones, por ende, es importante tomar una posición metodológica rigurosa para que
el proceso de validar una hipótesis tenga sustento estadístico. Tener un valor de p menor
que 0,05 no garantiza que las variables de estudio estén relacionadas, más bien, depende en
gran medida del análisis previo de los datos que el investigador realice, a fin de que el
estudio sea más significativo. Lo mencionado coincide con lo señalado por [20], donde se
indica que realizar un estudio comparativo de las pruebas de normalidad, variando el
tamaño muestral, resulta de gran utilidad para argumentar que el mismo estadístico de
prueba puede producir valores de p muy distintos según el contexto y las variables
analizadas.
Al momento de utilizar las pruebas de normalidad univariadas es importante conocer la
forma de aplicación. Como se mencionó en apartados anteriores, algunas pruebas se basan
en medir distancias de cada observación con respecto a la media aritmética, donde el orden
Novasinergia 2026, 9(1), 138-159 156
de los datos es importante. En cambio, pruebas como la de Jarque-Bera está direccionada en
evaluar momentos estadísticos (asimetría y curtosis) sin importar el ordenamiento de los
datos.
La prueba de Jarque-Bera está disponible en el paquete "tseries", en la librería library(tseries)
de R donde viene incorporado por defecto el coeficiente de asimetría de Fisher clásico, por
esta razón, el estadístico JB genera valores excesivamente altos, afectando el
comportamiento de las variables sobre todo cuando existen valores atípicos. Por esta razón,
se propone reajustar el cálculo del estadístico JB mediante el uso del coeficiente de asimetría
de Fisher ajustado, lo cual permitiría corregir los sesgos existentes en un conjunto de datos
y podría mejorar la aproximación a la distribución normal.
Para reforzar el análisis de los estadísticos de las pruebas de normalidad univariada, sería
factible incorporar otro tipo de pruebas actualizadas, con el objetivo de comparar la utilidad
de los diferentes momentos estadísticos y evaluar el comportamiento del supuesto de
normalidad, así como su aplicabilidad en diferentes tipos de variables. Se recomienda
ampliar los tamaños muestrales mediante el incremento progresivo de submuestras para
verificar el comportamiento de los estadísticos de las pruebas de normalidad y los valores
de p, esto permitiría observar patrones o tendencias que contribuyan en obtener resultados
más eficientes, consistentes y robustos [21].
En estadística paramétrica, la verificación del supuesto de normalidad se ha convertido en
el punto de partida en los trabajos de investigación, especialmente cuando se emplean
variables continuas. Por ende, se recomienda diseñar un modelo matemático preliminar que
se ajuste adecuadamente a un conjunto amplio de datos, con el propósito de obtener valores
de p más consistente y significativo. Según [22], se evidencia que el estadístico de prueba
puede arrojar valores de p distintos a medida que el tamaño muestral aumenta o disminuye,
lo que refuerza la necesidad de aplicar el submuestreo para una interpretación precisa del
valor de p.
En lo que concierne a los modelos más sofisticados y flexibles que se pueden aplicar para
aumentar R2 y tener un mejor ajuste de curva, se recomienda aplicar los modelos de
regresión avanzada como: regresión spline (splines cúbicos, B-splines o P-splines) para
dividir el conjunto de datos en tramos y realizar un ajuste flexible con continuidad y
suavidad [23]; regresión local (LOESS o LOWESS) cuando el comportamiento de los datos
son no paramétricos y necesita realizar un ajuste local para cada dato, permitiendo
encontrar patrones complejos [24]; regresión polinomial con regularización (ridge o lasso)
para evitar sobreajuste en polinomios de grados superiores [25]; además se propone aplicar
modelos aditivos generalizados (GAM, por sus siglas en inglés) para modelar relaciones no
lineales entre las variables de manera flexible [26].
5. Conclusiones
Se utilizaron distintas pruebas de normalidad univariadas con el objetivo de verificar
el comportamiento de cada uno de los estadísticos y los respectivos valores de p. Este
análisis permitió encontrar patrones consistentes que se ajustaron a los modelos de
regresión clásicos para determinar la relación entre las variables.
Novasinergia 2026, 9(1), 138-159 157
Con la aplicación de los modelos clásicos como primera aproximación se logró un avance
significativo en el comportamiento de los estadísticos de las pruebas de normalidad
univariadas (KS, AD, JB CvM, M.KS, P ², SF y SW), así como los valores de p obtenidos en
cada iteración al incrementar o decrementar el tamaño de la muestra.
Los modelos que mostraron un mejor ajuste de curva a las variables precipitación,
producción de petróleo mensual operativo y temperatura mínima absoluta fueron los
exponenciales y polinomial de grado 3, presentando los valores de R2 más altos: en la prueba
KS, para la variable crudo (R2 = 0,9784); en la prueba AD, para la variable precipitación (R2 =
1); en la prueba JB, para la variable temperatura (R2 = 0,8902); en la prueba CvM, para la
variable temperatura (R2 = 1); en la prueba M.KS, para la variable temperatura (R2 = 0,936);
en la prueba P ², para la variable precipitación (R2 = 0,3798); en la prueba SF, para la variable
temperatura (R2 = 0,6019); y en la prueba SW, para la variable crudo (R2 = 0,3712).
Contribuciones de los autores
Conceptualización, J.M. y A.S.; metodología, J.M. y A.S.; software, J.M.; validación,
J.M.; análisis formal, J.M.; investigación, J.M.; recursos, J.M.; curación de datos, J.M.;
redacciónpreparación del borrador original, J.M. y A.S.; redacciónrevisión y edición,
J.M. y A.S.; visualización, J.M. Todos los autores han leído y aprobado la versión publicada
del manuscrito.
Conflicto de Interés
Los autores declaran que no existen conflictos de interés de naturaleza alguna con la
presente investigación.
Declaración sobre el uso de Inteligencia Artificial Generativa
En la preparación de este artículo, se utilizó ChatGPT para corrección gramatical y la
revisión de fragmentos de código de programación.
Referencias
[1] A. Ferencek y M. K. Borštnar, “Data quality assessment in product failure prediction
models,” Journal of Decision Systems, vol. 29, n. 1, pp. 7986, jun. 2020, doi:
10.1080/12460125.2020.1776927.
[2] R. H. Taplin, “Quantifying data quality after removing respondents who fail data quality
checks” Current Issues in Tourism, vol. 28, n. 16, pp. 2570-2581, jul. 2024, doi:
10.1080/13683500.2024.2378611.
[3] A. Inglis, A. Parnell, y C. B. Hurley, “Visualizing variable importance and variable
interaction effects in machine learning models,” Journal of Computational and Graphical
Statistics, vol. 31, n. 3, pp. 766778, ene. 2022, doi: 10.1080/10618600.2021.2007935.
[4] L. M. Hudiburgh y D. Garbinsky, “Data visualization: Bringing data to life in an introductory
statistics course,” Journal of Statistics Education, vol. 28, n. 3, pp. 262279, ago. 2020, doi:
10.1080/10691898.2020.1796399.
Novasinergia 2026, 9(1), 138-159 158
[5] C. Avram y M. Mărușteri, “Normality assessment, few paradigms and use cases,” Revista
Romana de Medicina de Laborator, vol. 30, n. 3, pp. 251260, jul. 2022, doi: 10.2478/rrlm-2022-
0030.
[6] M. Kumagai, Y. Ando, A. Tanaka, K. Tsuda, Y. Katsura, y K. Kurosaki, “Effects of data bias
on machine-learning–based material discovery using experimental property data,” Science
and Technology of Advanced Materials: Methods, vol. 2, n. 1, pp. 302309, ago. 2022, doi:
10.1080/27660400.2022.2109447.
[7] S. Pawel y L. Held, “Closed-form power and sample size calculations for Bayes factors”, The
American Statistician, vol. 79, n. 3, pp. 330344, abr. 2025, doi: 10.1080/00031305.2025.2467919.
[8] M. Javed y M. Irfan, “A simulation study: New optimal estimators for population mean by
using dual auxiliary information in stratified random sampling,” Journal of Taibah University
for Science, vol. 14, n. 1, pp. 557568, ene. 2020, doi: 10.1080/16583655.2020.1752004.
[9] Y. Pawitan, “Defending the p-value,” arXiv, 2020, doi: 10.48550/arXiv.2009.02099.
[10] L. P. M. Diaz-Ballve, “El valor p: un concepto estadístico-metodológico omnipresente en la
investigación biomédica. ¿Lo interpretamos correctamente?,” Argentinian Journal of
Respiratory & Physical Therapy, vol. 2, n. 1, feb. 2020, doi: 10.58172/ajrpt.v2i1.91.
[11] P. C. Austin, I. Eekhout, y S. van Buuren, “Evaluating the median p-value method for
assessing the statistical significance of tests when using multiple imputation,” Journal of
Applied Statistics, vol. 52, n. 6, pp. 11611176, oct. 2024, doi: 10.1080/02664763.2024.2418473.
[12] A. Ebbelind, “A functional view on language: a methodology for mathematics education to
study shifts in prospective teachers’ discursive patterns,” International Journal of Mathematical
Education in Science and Technology, vol. 54, n. 8, pp. 17311745, may. 2023, doi:
10.1080/0020739X.2023.2204506.
[13] J. F. Hair, C. M. Ringle, y M. Sarstedt, “PLS-SEM: Indeed a silver bullet,” Journal of Marketing
Theory and Practice, vol. 19, n. 2, pp. 139152, abr. 2011, doi: 10.2753/MTP1069-6679190202.
[14] E. E. Pinto Aragón, A. R. Villa Navas, y H. A. Pinto Aragón, “Estrés académico en estudiantes
de la Universidad de La Guajira, Colombia,” REV CIENC SOC-VENEZ, vol. 28, no. 5, pp. 87
99, may. 2022. Disponible en: https://dialnet.unirioja.es/servlet/articulo?codigo=8471675.
[15] V. Glinskiy, Y. Ismayilova, S. Khrushchev, A. Logachov, O. Logachova, L. Serga, A.
Yambartev y K. Zaykov, “Modifications to the Jarque–Bera test,” Mathematics, vol. 12, n. 16,
p. 2523, ago. 2024, doi: 10.3390/math12162523.
[16] B. O. Emmanuel, N. T. Maureen, y N. Wonu, “Detection of non-normality in data sets and
comparison between different normality tests,” Asian Journal of Probability and Statistics, vol.
5, n. 4, pp. 120, ene. 2020, doi: 10.9734/ajpas/2019/v5i430149.
[17] A. Kamath, S. Poojari, y K. Varsha, “Assessing the robustness of normality tests under
varying skewness and kurtosis: a practical checklist for public health researchers,” BMC
Medical Research Methodology, vol. 25, n. 1, p. 206, sep. 2025, doi: 10.1186/s12874-025-02641-y.
[18] S. Tenny y I. Abdelgawad, “Statistical Significance,” StatPearls [Internet], Treasure Island
(FL): StatPearls Publishing, Updated Nov. 23, 2023. Disponible en:
https://www.ncbi.nlm.nih.gov/books/NBK459346/
[19] R Core Team, R: A Language and Environment for Statistical Computing. r-project.org.
https://www.R-project.org/
[20] S. S. Uyanto, “An extensive comparisons of 50 univariate goodness-of-fit tests for normality,”
Austrian Journal of Statistics, vol. 51, n. 3, pp. 4597, ago. 2022, doi: 10.17713/ajs.v51i3.1279.
[21] S. Korkmaz y Y. Demir, “Investigation of some univariate normality tests in terms of type-I
errors and test power,” Journal of Scientific Reports-A, n. 52, pp. 376395, mar. 2023, doi:
10.59313/jsr-a.1222979.
Novasinergia 2026, 9(1), 138-159 159
[22] S. Demir, “Comparison of normality tests in terms of sample sizes under different skewness
and kurtosis coefficients,” International Journal of Assessment Tools in Education, vol. 9, n. 2, pp.
397409, jun. 2022, doi: 10.21449/ijate.1101295.
[23] J. Gauthier, Q. V. Wu, y T. A. Gooley, “Cubic splines to model relationships between
continuous variables and outcomes: a guide for clinicians,” Bone Marrow Transplant., vol. 55,
n. 4, pp. 675680, oct. 2019, doi: 10.1038/s41409-019-0679-x.
[24] Y. Xie, Z. Jing, H. Pan, X. Xu, y Q. Fang, “Redefining the high variable genes by optimized
LOESS regression with positive ratio,” BMC Bioinformatics, vol. 26, n. 104, abr. 2025, doi:
10.1186/s12859-025-06112-5.
[25] S. K. Safi, M. Alsheryani, M. Alrashdi, R. Suleiman, D. Awwad, y Z. N. Abdalla, “Optimizing
linear regression models with lasso and ridge regression: A study on UAE financial behavior
during COVID-19,” Migration Letters, vol. 20, n. 6, pp. 139153, sep. 2023, doi:
10.59670/ml.v20i6.3468.
[26] S. N. Wood, “Inference and computation with generalized additive models and their
extensions,” TEST, vol. 29, n. 2, pp. 307339, abr. 2020, doi: 10.1007/s11749-020-00711-5.