Expérience factorielle - Factorial experiment

Concevoir des expériences avec un plan factoriel complet (à gauche), une surface de réponse avec un polynôme du deuxième degré (à droite)

En statistique , une expérience factorielle complète est une expérience dont la conception se compose de deux ou plusieurs facteurs, chacun avec des valeurs ou «niveaux» possibles discrets, et dont les unités expérimentales prennent toutes les combinaisons possibles de ces niveaux pour tous ces facteurs. Un plan factoriel complet peut également être appelé un plan entièrement croisé . Une telle expérience permet à l'enquêteur d'étudier l'effet de chaque facteur sur la variable de réponse , ainsi que les effets des interactions entre les facteurs sur la variable de réponse.

Pour la grande majorité des expériences factorielles, chaque facteur n'a que deux niveaux. Par exemple, avec deux facteurs prenant chacun deux niveaux, une expérience factorielle aurait quatre combinaisons de traitement au total, et est généralement appelée un plan factoriel 2 × 2 .

Si le nombre de combinaisons dans un plan factoriel complet est trop élevé pour être réalisable sur le plan logistique, un plan factoriel fractionnaire peut être effectué, dans lequel certaines des combinaisons possibles (généralement au moins la moitié) sont omises.

Histoire

Les conceptions factorielles ont été utilisées au 19e siècle par John Bennet Lawes et Joseph Henry Gilbert de la station expérimentale de Rothamsted .

Ronald Fisher a soutenu en 1926 que les plans «complexes» (tels que les plans factoriels) étaient plus efficaces que l'étude d'un facteur à la fois. Fisher a écrit,

"Aucun aphorisme n'est répété plus fréquemment à propos des essais sur le terrain, que nous devons poser à la Nature quelques questions ou, idéalement, une question à la fois. L'écrivain est convaincu que ce point de vue est totalement erroné."

La nature, suggère-t-il, répondra le mieux à «un questionnaire logique et soigneusement réfléchi». Un plan factoriel permet de déterminer l'effet de plusieurs facteurs et même les interactions entre eux avec le même nombre d'essais que nécessaire pour déterminer l'un quelconque des effets par lui-même avec le même degré de précision.

Frank Yates a apporté des contributions significatives, en particulier dans l'analyse des conceptions, par l' analyse de Yates .

Le terme «factoriel» n'a peut-être pas été utilisé dans l'imprimé avant 1935, lorsque Fisher l'a utilisé dans son livre The Design of Experiments .

Avantages des expériences factorielles

De nombreuses personnes examinent l'effet d'un seul facteur ou variable. Par rapport à de telles expériences à un facteur à la fois (OFAT), les expériences factorielles offrent plusieurs avantages

  • Les plans factoriels sont plus efficaces que les expériences OFAT. Ils fournissent plus d'informations à un coût similaire ou inférieur. Ils peuvent trouver les conditions optimales plus rapidement que les expériences OFAT.
  • Les plans factoriels permettent d'examiner des facteurs supplémentaires sans frais supplémentaires.
  • Lorsque l'effet d'un facteur est différent pour différents niveaux d'un autre facteur, il ne peut pas être détecté par un plan d'expérience OFAT. Des plans factoriels sont nécessaires pour détecter de telles interactions . L'utilisation d'OFAT lorsque des interactions sont présentes peut conduire à de graves malentendus sur la manière dont la réponse change avec les facteurs.
  • Les plans factoriels permettent d'estimer les effets d'un facteur à plusieurs niveaux des autres facteurs, ce qui aboutit à des conclusions valables sur une gamme de conditions expérimentales.

Exemple d'avantages des expériences factorielles

Dans son livre, Improving Almost Anything: Ideas and Essays , le statisticien George Box donne de nombreux exemples des avantages des expériences factorielles. En voici un. Les ingénieurs du fabricant de roulements SKF voulaient savoir si le passage à une conception à «cage» moins coûteuse affecterait la durée de vie des roulements. Les ingénieurs ont demandé à Christer Hellstrand, un statisticien, de l'aider à concevoir l'expérience.

Diagramme de cube pour le roulement life.svg

Box rapporte ce qui suit. «Les résultats ont été évalués par un test de durée de vie accéléré.… Les essais étaient coûteux car ils devaient être effectués sur une ligne de production réelle et les expérimentateurs prévoyaient de faire quatre essais avec la cage standard et quatre avec la cage modifiée. Christer a demandé si il y avait d'autres facteurs qu'ils aimeraient tester. Ils ont dit qu'il y en avait, mais que faire des courses supplémentaires dépasserait leur budget. Christer leur a montré comment ils pouvaient tester deux facteurs supplémentaires "gratuitement" - sans augmenter le nombre de courses et sans réduire le précision de leur estimation de l'effet cage. Dans cet arrangement, appelé plan factoriel 2 × 2 × 2, chacun des trois facteurs serait exécuté à deux niveaux et les huit combinaisons possibles seraient incluses. Les diverses combinaisons peuvent être présentées comme suit: les sommets d'un cube ... "" Dans chaque cas, la condition standard est indiquée par un signe moins et la condition modifiée par un signe plus. Les facteurs modifiés sont le traitement thermique, l'osculation de l'anneau externe et conception de la cage. Les chiffres indiquent les durées de vie relatives des roulements. Si vous regardez [le diagramme de cube], vous pouvez voir que le choix de la conception de la cage n'a pas fait beaucoup de différence. … Mais, si vous faites la moyenne des paires de nombres pour la conception des cages, vous obtenez le [tableau ci-dessous], qui montre ce que les deux autres facteurs ont fait. … Cela a conduit à la découverte extraordinaire que, dans cette application particulière, la durée de vie d'un roulement peut être multipliée par cinq si les deux facteurs osculation de la bague extérieure et les traitements thermiques de la bague intérieure sont augmentés ensemble. "

Durée de vie du roulement par rapport à la chaleur et à l'osculation
Osculation - Osculation +
Chaleur - 18 23
Chaleur + 21 106

"En se souvenant que des roulements comme celui-ci sont fabriqués depuis des décennies, il est au début surprenant que cela puisse prendre si longtemps pour découvrir une amélioration aussi importante. Une explication probable est que, parce que la plupart des ingénieurs ont, jusqu'à récemment, utilisé un seul facteur à une expérimentation du temps, les effets d' interaction ont été manqués. "

Exemple

L'expérience factorielle la plus simple contient deux niveaux pour chacun des deux facteurs. Supposons qu'un ingénieur souhaite étudier la puissance totale utilisée par chacun des deux moteurs différents, A et B, fonctionnant à chacune des deux vitesses différentes, 2000 ou 3000 tr / min. L'expérience factorielle comprendrait quatre unités expérimentales: le moteur A à 2000 tr / min, le moteur B à 2000 tr / min, le moteur A à 3000 tr / min et le moteur B à 3000 tr / min. Chaque combinaison d'un seul niveau sélectionné à partir de chaque facteur est présente une fois.

Cette expérience est un exemple d' expérience factorielle 2 2 (ou 2 × 2), ainsi nommée car elle considère deux niveaux (la base) pour chacun des deux facteurs (la puissance ou l'exposant), ou #levels #factors , produisant 2 2 = 4 points factoriels.

Diagramme de cube pour la conception factorielle

Les conceptions peuvent impliquer de nombreuses variables indépendantes. Comme autre exemple, les effets de trois variables d'entrée peuvent être évalués dans huit conditions expérimentales représentées par les coins d'un cube.

Cela peut être effectué avec ou sans réplication, en fonction de son objectif et des ressources disponibles. Il fournira les effets des trois variables indépendantes sur la variable dépendante et les interactions possibles.

Notation

Expérience factorielle 2 × 2
UNE B
(1) - -
une + -
b - +
un B + +

La notation utilisée pour désigner les expériences factorielles transmet beaucoup d'informations. Lorsqu'un plan est noté factoriel 2 3 , cela identifie le nombre de facteurs (3); combien de niveaux chaque facteur possède (2); et combien de conditions expérimentales il y a dans la conception (2 3  = 8). De même, un plan 2 5 a cinq facteurs, chacun avec deux niveaux, et 2 5  = 32 conditions expérimentales. Les expériences factorielles peuvent impliquer des facteurs avec différents nombres de niveaux. Un plan 2 4 3 a cinq facteurs, quatre avec deux niveaux et un avec trois niveaux, et a 16 × 3 = 48 conditions expérimentales.

Pour économiser de l'espace, les points d'une expérience factorielle à deux niveaux sont souvent abrégés par des chaînes de signes plus et moins. Les chaînes ont autant de symboles que de facteurs, et leurs valeurs dictent le niveau de chaque facteur: conventionnellement, pour le premier (ou bas) niveau, et pour le deuxième (ou haut) niveau. Les points de cette expérience peuvent ainsi être représentés comme , , et .

Les points factoriels peuvent également être abrégés par (1), a, b et ab, où la présence d'une lettre indique que le facteur spécifié est à son niveau haut (ou deuxième) et l'absence d'une lettre indique que le facteur spécifié est à son niveau bas (ou premier) (par exemple, "a" indique que le facteur A est sur son réglage haut, tandis que tous les autres facteurs sont à leur réglage bas (ou premier)). (1) est utilisé pour indiquer que tous les facteurs sont à leurs valeurs les plus basses (ou premières).

Mise en œuvre

Pour plus de deux facteurs, une expérience factorielle de 2 k peut généralement être conçue de manière récursive à partir d'une expérience factorielle de 2 k −1 en répliquant l'expérience de 2 k −1 , en attribuant la première réplique au premier (ou bas) niveau du nouveau facteur, et le deuxième réplique au deuxième niveau (ou haut). Ce cadre peut être généralisé à, par exemple , la conception de trois répétitions pour trois facteurs de niveau, etc .

Une expérience factorielle permet d'estimer l'erreur expérimentale de deux manières. L'expérience peut être reproduite ou le principe de la rareté des effets peut souvent être exploité. La réplication est plus courante pour les petites expériences et constitue un moyen très fiable d'évaluer l'erreur expérimentale. Lorsque le nombre de facteurs est important (généralement plus d'environ 5 facteurs, mais cela varie selon l'application), la réplication de la conception peut devenir opérationnellement difficile. Dans ces cas, il est courant de n'exécuter qu'une seule réplique du plan et de supposer que les interactions de facteurs de plus d'un certain ordre (par exemple, entre trois facteurs ou plus) sont négligeables. Sous cette hypothèse, les estimations de ces interactions d'ordre élevé sont des estimations d'un zéro exact, donc en réalité une estimation de l'erreur expérimentale.

Lorsqu'il y a de nombreux facteurs, de nombreuses exécutions expérimentales seront nécessaires, même sans réplication. Par exemple, l'expérimentation de 10 facteurs à deux niveaux produit chacun 2 10 = 1024 combinaisons. À un moment donné, cela devient irréalisable en raison d'un coût élevé ou de ressources insuffisantes. Dans ce cas, des plans factoriels fractionnaires peuvent être utilisés.

Comme pour toute expérience statistique, les exécutions expérimentales dans une expérience factorielle doivent être randomisées pour réduire l'impact que le biais pourrait avoir sur les résultats expérimentaux. En pratique, cela peut être un défi opérationnel important.

Les expériences factorielles peuvent être utilisées lorsqu'il y a plus de deux niveaux de chaque facteur. Cependant, le nombre d'essais expérimentaux requis pour les plans factoriels à trois niveaux (ou plus) sera considérablement plus élevé que pour leurs homologues à deux niveaux. Les plans factoriels sont donc moins attractifs si un chercheur souhaite considérer plus de deux niveaux.

Analyse

Une expérience factorielle peut être analysée en utilisant une ANOVA ou une analyse de régression . Pour calculer l'effet principal d'un facteur «A», soustrayez la réponse moyenne de toutes les séries expérimentales pour lesquelles A était à son niveau bas (ou premier) de la réponse moyenne de toutes les séries expérimentales pour lesquelles A était à son niveau élevé (ou deuxième ) niveau.

D' autres outils d'analyse exploratoires utiles pour les expériences factorielles comprennent les principaux effets des parcelles, des parcelles d'interaction , des parcelles de Pareto , et un tracé de probabilité normale des effets estimés.

Lorsque les facteurs sont continus, les plans factoriels à deux niveaux supposent que les effets sont linéaires . Si un effet quadratique est attendu pour un facteur, une expérience plus compliquée doit être utilisée, comme une conception composite centrale . L'optimisation des facteurs qui pourraient avoir des effets quadratiques est le principal objectif de la méthodologie de surface de réponse .

Exemple d'analyse

Montgomery donne l'exemple suivant d'analyse d'une expérience factorielle:.

Un ingénieur souhaite augmenter le taux de filtration (rendement) d'un processus pour produire un produit chimique et réduire la quantité de formaldéhyde utilisée dans le processus. Les tentatives précédentes pour réduire le formaldéhyde ont abaissé le taux de filtration. Le taux de filtration actuel est de 75 gallons par heure. Quatre facteurs sont pris en compte: la température (A), la pression (B), la concentration de formaldéhyde (C) et la vitesse d'agitation (D). Chacun des quatre facteurs sera testé à deux niveaux.

À partir de maintenant, les signes moins (-) et plus (+) indiqueront si le facteur est exécuté respectivement à un niveau bas ou élevé.

Matrice de conception et taux de filtration résultant
UNE B C Taux de filtration
- - - - 45
+ - - - 71
- + - - 48
+ + - - 65
- - + - 68
+ - + - 60
- + + - 80
+ + + - 65
- - - + 43
+ - - + 100
- + - + 45
+ + - + 104
- - + + 75
+ - + + 86
- + + + 70
+ + + + 96

Les lignes non parallèles du graphique d'interaction A: C indiquent que l'effet du facteur A dépend du niveau du facteur C. Un résultat similaire est valable pour l'interaction A: D. Les graphiques indiquent que le facteur B a peu d'effet sur le taux de filtration. L' analyse de la variance (ANOVA) incluant les 4 facteurs et tous les termes d'interaction possibles entre eux donne les estimations des coefficients indiquées dans le tableau ci-dessous.

Résultats ANOVA
Coefficients Estimation
Intercepter 70,063
UNE 10.813
B 1,563
C 4,938
7,313
UN B 0,063
A: C −9,063
AVANT JC 1,188
UN D 8,313
B: D −0,188
CD −0,563
ABC 0,938
A: B: D 2,063
A: C: D −0,813
B: C: D −1,313
A B C D 0,688
Diagramme de Pareto montrant la grandeur relative des coefficients de facteur.

Puisqu'il y a 16 observations et 16 coefficients (intersection, effets principaux et interactions), les valeurs p ne peuvent pas être calculées pour ce modèle. Les valeurs des coefficients et les graphiques suggèrent que les facteurs importants sont A, C et D, et les termes d'interaction A: C et A: D.

Les coefficients pour A, C et D sont tous positifs dans l'ANOVA, ce qui suggérerait d'exécuter le processus avec les trois variables définies sur la valeur élevée. Cependant, le principal effet de chaque variable est la moyenne sur les niveaux des autres variables. Le graphique d'interaction A: C ci-dessus montre que l'effet du facteur A dépend du niveau du facteur C, et vice versa. Le facteur A (température) a très peu d'effet sur le taux de filtration lorsque le facteur C est au niveau +. Mais le facteur A a un effet important sur le taux de filtration lorsque le facteur C (formaldéhyde) est au niveau -. La combinaison de A au niveau + et C au niveau - donne le taux de filtration le plus élevé. Cette observation indique comment les analyses un facteur à la fois peuvent manquer des interactions importantes. Ce n'est qu'en faisant varier les deux facteurs A et C en même temps que l'ingénieur a pu découvrir que l'effet du facteur A dépend du niveau du facteur C.

Diagramme en cube pour l'ANOVA utilisant les facteurs A, C et D et les termes d'interaction A: C et A: D. Le graphique aide à visualiser le résultat et montre que la meilleure combinaison est A +, D + et C−.

Le meilleur taux de filtration est vu lorsque A et D sont au niveau haut et C est au niveau bas. Ce résultat satisfait également l'objectif de réduction du formaldéhyde (facteur C). Étant donné que B ne semble pas être important, il peut être supprimé du modèle. La réalisation de l'ANOVA en utilisant les facteurs A, C et D, et les termes d'interaction A: C et A: D, donne le résultat indiqué dans le tableau suivant, dans lequel tous les termes sont significatifs (valeur p <0,05).

Résultats ANOVA
Coefficient Estimation Erreur standard valeur t valeur p
Intercepter 70,062 1.104 63,444 2,3 × 10 −14
UNE 10,812 1.104 9,791 1,9 × 10 −6
C 4,938 1.104 4,471 1,2 × 10 −3
7,313 1.104 6,622 5,9 × 10 −5
A: C −9,063 1.104 −8,206 9,4 × 10 −6
UN D 8,312 1.104 7,527 2 × 10 −5

Voir également

Remarques

Les références

Liens externes