Tema 7 - Diseño de experimentos en ingeniería
Diseño de experimentos y Control de la calidad
En un proceso, hay varios factores que pueden afectar a la calidad del producto final y muchos de estos factores se pueden controlar (temperatura, presión, velocidad, etc.)
Denominamos variables de control a estos factores que podemos controlar en un proceso
Todo proceso de experimentación en ingeniería se compone de cuatro etapas
- Conjeturar una hipótesis sobre el proceso de producción
- Experimentar para obtener la información sobre la conjetura
- Analizar estadísticamente la información del experimento para ver si es significativa
- Sacar conclusiones sobre si la conjetura inicial es cierta o hay que adaptarla a los resultados obtenidos y quizás realizar un nuevo experimentos
Introducción a los experimentos factoriales
Experimentos factoriales Ejemplos 50 y 51 - Introducción a los experimentos factoriales 2^2
Los experimentos factoriales son experimentos de 2 factores con 2 niveles por lo que cada muestra realizará 4 experimentos, representando cada posible combinación de factores y niveles. Estos niveles se etiquetan como alto (+) y bajo (-)
Todo experimento factorial define una variable de respuesta
El objetivo es analizar
- Si la variable respuesta es afectada por los factores
- Si existe interacción (dependencia) entre los factores
Tras realizar el experimentos, las diferentes combinaciones entre factores y niveles se suelen representar en una tabla donde cada una de estas combinaciones se representa con la siguiente simbología:
(1)
→ Ambos factores están en el nivel bajo
a
→ El factor A está en el nivel alto y el factor B está en el nivel bajo
b
→ El factor A está en el nivel bajo y el factor B está en el nivel alto
ab
→ Ambos factores están en el nivel alto
El experimento se suele repetir veces (se toman muestras) donde cada muestra toma datos de las 4 combinaciones
Estimar el efecto promedio de un factor
Para estimar el efecto de un factor, deberemos hacer la media de medias de aquellas combinaciones donde el factor de estudio está a nivel alto , y luego otra media de medias de aquellas combinaciones donde el factor de estudio está a nivel bajo
Finalmente, si hacemos la diferencia entre estos dos resultados nos da el incremento de la media cuando pasamos de un nivel bajo a un nivel alto del factor seleccionado
Aunque también podríamos usar las fórmulas.
Estas fórmulas se puden usar con las medias o las sumas totales de cada caso (
(1)
, a
, b
, ab
). 💡
Podemos saber si hay que usar las medias o la sumas totales en la fórmula si miramos la fracción de delante
- Usar la media →
- Usar la suma total →
Estimar la interacción promedio entre dos factores
En este caso la fórmula sería la media de los casos donde todos los factores están al mismo nivel, menos la media de los casos donde cada uno es´ta a un nivel distinto
O podemos hacer uso de alguna de estas fórmulas
Usando la suma total (opción 1)
Siendo
- → El número total de combinaciones:
4
- Los valores
(1)
,a
,b
,ab
hacen referencia a la columna suma total
Usando la media (opción 2)
Cualquiera de estas fórmulas nos dará como resultado la interacción promedio
La formula de la interacción tiene una característica de conmutabilidad
Experimentos factoriales
Los experimentos son como los de , es más, esos son un caso particular de los de . Si además tenemos más de dos factores, entonces tendremos un experimento de
Experimentos factoriales y regresión
Modelo de regresión (no lineal)
Un modelo de regresión es básicamente una función formada por la suma de productos entre un factor y una variable , más un error
Cualquier experimento factorial puede resolverse con un modelo de regresión tal que
Siendo
- → El efecto promedio de un factor dividido por
- → La media de medias
- → La interpretación de un factor
- → Una variable para tener en cuenta el error
Los valores de representar una interpretación concreta de la tabla (da valores a cada ). Estos valores representan en nivel del factor correspondiente donde el valor representa un nivel alto y el valor representa un nivel bajo
Ejemplo 52 - Modelo de regresiónInferencia sobre el modelo de regresión
Distribución de Student
La distribución se lee como: La variable tiene una distribución de Stundent con grados de libertad
En la imagen anterior tenemos representada una función de densidad de probabilidad de una variable aleatoria de Student con grados de libertad
Esta distribución es parecida a la normal, pero considera más probables la aparición de valores atípicos. Esta es normalmente más usada con muestras pequeñas
Media y varianza
Aunque existe una función de densidad de probabilidad, existe una tabla para evitar tener que estar haciendo cálculos y saberse las fórmulas
Relevancia de los coeficientes Ejemplo 54 - Distribución de Student respecto de el ejemplo 52
Dado un modelo de regresión no lineal
Podemos simplificar el modelo si no todos los coeficientes son relevantes (distintos de cero)
Se plantean dos hipótesis para cada factor
Seguiremos los siguientes pasos para cada factor, siendo cada uno de los factores del modelo e
Para resolver este contraste de hipótesis seguiremos los siguientes pasos
1️⃣ Calculamos (estimación de la varianza)Siendo
- → Número total de combinaciones entre los factores y los niveles
2️⃣ Calculamos el error estandar (desviación típica)Siendo
- → Número de repeticiones del experimento
3️⃣ Caculamos el estadístico
4️⃣ Calculamos el P-ValorSiendo
- una variable aleatoria de Student con
- 💡 El P-Valor es la probabilidad de equivocarnos si aceptamos la hipótesis
5️⃣ Comprobación de hipótesis
- Si el P-Valor es menor o igual que el nivel de significación entonces es relevante (aceptamos la hipótesis )
- Si el P-Valor es mayor que el nivel de significación entonces es no relevante (rechazamos la hipótesis )
El nivel de significación es el máximo valor que estamos dispuestos a aceptar respecto de la probabilidad de equivocarnos al aceptar la hipótesis
Contraste de hipótesis tras una prueba ANOVA
La prueba ANOVA es una técnica estadística para analizar las medias de varios grupos.
El contraste de hipótesis de estas pruebas consistirá en comprobar si un factor es significativos a través del análisis del P-Valor de un factor comprobando si es menor o igual que el nivel de significancia para solicitado.
- Si el P-Valor es menor o igual que (se asume que este es )
Rechazamos la hipótesis nula y concluimos que el factor es significativo
- Si el P-Valor es mayor que
No rechazamos la hipótesis nula y concluimos que el factor es marginalmente significativo
A no ser que se indique lo contrario, se suele usar los siguientes valores a la hora de concluir si un factor es significativo:
- → Valor límite para considerar un factor como significativo
- → Valor límite para considerar un valor como marginalmente significativo
Ejemplo
Observando los siguientes resultadosDebemos mirar la columnaPr(>F)
donde están los P-Valor de cada combinación de factor y nivelEstos valores debemos compararlos con los niveles de significación que aparecen
Lenguaje
tendría un nivel de significación de'*'
Velocidad
tendría un nivel de significación de'.'
Lenguaje:Velocidad
tendría un nivel de significación de' '