En un proceso, hay varios factores que pueden afectar a la calidad del producto final y muchos de estos factores se pueden controlar (temperatura, presión, velocidad, etc.)
ℹ️
Denominamos variables de control a estos factores que podemos controlar en un proceso
ℹ️
Todo proceso de experimentación en ingeniería se compone de cuatro etapas
Conjeturar una hipótesis sobre el proceso de producción
Experimentar para obtener la información sobre la conjetura
Analizar estadísticamente la información del experimento para ver si es significativa
Sacar conclusiones sobre si la conjetura inicial es cierta o hay que adaptarla a los resultados obtenidos y quizás realizar un nuevo experimentos
Introducción a los experimentos factoriales
🧪
Experimentos factoriales C=22
Los experimentos factoriales 22 son experimentos de 2 factores con 2 niveles por lo que cada muestra realizará 4 experimentos, representando cada posible combinación de factores y niveles. Estos niveles se etiquetan como alto (+) y bajo (-)
Todo experimento factorial define una variable de respuesta
🎯
El objetivo es analizar
Si la variable respuesta es afectada por los factores
Si existe interacción (dependencia)entre los factores
Tras realizar el experimentos, las diferentes combinaciones entre factores y niveles se suelen representar en una tabla donde cada una de estas combinaciones se representa con la siguiente simbología:
(1) → Ambos factores están en el nivel bajo
a → El factor A está en el nivel alto y el factor B está en el nivel bajo
b → El factor A está en el nivel bajo y el factor B está en el nivel alto
ab → Ambos factores están en el nivel alto
El experimento se suele repetir n veces (se toman n muestras)donde cada muestra toma datos de las 4 combinaciones
Estimar el efecto promedio de un factor
Para estimar el efecto de un factor, deberemos hacer la media de medias de aquellas combinaciones donde el factor de estudio está a nivel alto (yA+), y luego otra media de medias de aquellas combinaciones donde el factor de estudio está a nivel bajo (yA−)
Finalmente, si hacemos la diferencia entre estos dos resultados nos da el incremento de la media cuando pasamos de un nivel bajo a un nivel alto del factor seleccionado
A=yA+−yA−
Aunque también podríamos usar las fórmulas.
⚠️
Estas fórmulas se puden usar con las medias o las sumas totales de cada caso ((1) , a , b , ab).
💡 Podemos saber si hay que usar las medias o la sumas totales en la fórmula si miramos la fracción de delante
Usar la media → 21
Usar la suma total → 2n1
A=2n1[a+ab−b−(1)]B=2n1[b+ab−a−(1)]
Estimar la interacción promedio entre dos factores
En este caso la fórmula sería la media de los casos donde todos los factores están al mismo nivel, menos la media de los casos donde cada uno es´ta a un nivel distinto
O podemos hacer uso de alguna de estas fórmulas
Usando la suma total (opción 1)
AB=2n1[ab+(1)−a−b]
Siendo
n → El número total de combinaciones: 4
Los valores (1) , a , b , ab hacen referencia a la columna suma total
Usando la media (opción 2)
AB=21[ab+(1)−a−b]
Cualquiera de estas fórmulas nos dará como resultado la interacción promedio
💡
La formula de la interacción tiene una característica de conmutabilidad
Los experimentos 2k son como los de 22, es más, esos son un caso particular de los de 2k. Si además tenemos más de dos factores, entonces tendremos un experimento de C=rk
Experimentos factoriales y regresión
🧪
Modelo de regresión (no lineal)
Un modelo de regresión es básicamente una función formada por la suma de productos entre un factor β y una variable x, más un error ϵ
Cualquier experimento factorial 22 puede resolverse con un modelo de regresión tal que
Y=β0+β1x1+β2x2+β3x1x2+ϵ
Siendo
xi → El efecto promedio de un factor dividido por 2
β0 → La media de medias
βi → La interpretación de un factor {−1,1}
ϵ → Una variable para tener en cuenta el error
Los valores de β representar una interpretación concreta de la tabla (da valores a cada βi>0). Estos valores representan en nivel del factor correspondiente donde el valor 1 representa un nivel alto y el valor −1 representa un nivel bajo
La distribución X∼Tk se lee como: La variable X tiene una distribución t de Stundent con k grados de libertad
En la imagen anterior tenemos representada una función de densidad de probabilidad de una variable aleatoria t de Student con k grados de libertad
💡
Esta distribución es parecida a la normal, pero considera más probables la aparición de valores atípicos. Esta es normalmente más usada con muestras pequeñas
Media y varianza
μ=E(X)σ2=V(X)=k−2k
Aunque existe una función de densidad de probabilidad, existe una tabla para evitar tener que estar haciendo cálculos y saberse las fórmulas
💡
Relevancia de los coeficientes β
Dado un modelo de regresión no lineal
Y=β0+β1x1+β2x2+β3x1x2+ϵ
Podemos simplificar el modelo si no todos los coeficientes β son relevantes (distintos de cero)
Se plantean dos hipótesis para cada factor
H0:βi=0 El factor i es irrelevanteH1:βi=0 El factor i es relevante
0️⃣
Seguiremos los siguientes pasos para cada factor, siendo βi cada uno de los factores β del modelo e i∈{0,1,2,3}
Para resolver este contraste de hipótesis seguiremos los siguientes pasos
1️⃣ Calculamos σˆ2 (estimación de la varianza)
σˆ2=C1c=1∑Cσˆc2
Siendo
C → Número total de combinaciones entre los factores y los niveles
2️⃣ Calculamos el error estandar (desviación típica)
se(βi)=21nσˆ2
Siendo
n → Número de repeticiones del experimento
3️⃣ Caculamos el estadístico t0
t0=se(βi)βˆi
4️⃣ Calculamos el P-Valor
P-Valor=2⋅P(T0>∣t0∣)
Siendo
T0 una variable aleatoria t de Student con C×(n−1)
💡 El P-Valor es la probabilidad de equivocarnos si aceptamos la hipótesis H1
5️⃣ Comprobación de hipótesis
Si el P-Valor es menor o igual que el nivel de significación (a) entonces es relevante (aceptamos la hipótesis H1)
Si el P-Valor es mayor que el nivel de significación (a) entonces es no relevante (rechazamos la hipótesis H1)
💡
El nivel de significación(a) es el máximo valor que estamos dispuestos a aceptar respecto de la probabilidad de equivocarnos al aceptar la hipótesis H1
La prueba ANOVA es una técnica estadística para analizar las medias de varios grupos.
El contraste de hipótesis de estas pruebas consistirá en comprobar si un factor es significativos a través del análisis del P-Valor de un factor comprobando si es menor o igual que el nivel de significancia(α) para solicitado.
Si el P-Valor es menor o igual que α (se asume que este es 0.05)
Rechazamos la hipótesis nula y concluimos que el factor es significativo
Si el P-Valor es mayor que α
No rechazamos la hipótesis nula y concluimos que el factor es marginalmente significativo
💡
A no ser que se indique lo contrario, se suele usar los siguientes valores a la hora de concluir si un factor es significativo:
P-Valor≤0.05 → Valor límite para considerar un factor como significativo
P-Valor>0.1 → Valor límite para considerar un valor como marginalmente significativo
Ejemplo
Observando los siguientes resultados
Debemos mirar la columna Pr(>F) donde están los P-Valor de cada combinación de factor y nivel
Estos valores debemos compararlos con los niveles de significación que aparecen
Lenguaje tendría un nivel de significación de '*'
Velocidad tendría un nivel de significación de '.'
Lenguaje:Velocidad tendría un nivel de significación de ' '