Différentiel d'une fonction - Differential of a function

En calcul , le différentiel représente la partie principale du changement dans une fonction y  =  f ( x ) par rapport aux changements dans la variable indépendante. Le différentiel dy est défini par

où est la dérivée de f par rapport à x , et dx est une variable réelle supplémentaire (de sorte que dy est une fonction de x et dx ). La notation est telle que l'équation

tient, où la dérivée est représentée dans la notation de Leibniz dy / dx , et cela est cohérent avec le fait de considérer la dérivée comme le quotient des différentiels. On écrit aussi

La signification précise des variables dy et dx dépend du contexte de l'application et du niveau de rigueur mathématique requis. Le domaine de ces variables peut prendre une signification géométrique particulière si le différentiel est considéré comme une forme différentielle particulière , ou une signification analytique si le différentiel est considéré comme une approximation linéaire de l'incrément d'une fonction. Traditionnellement, les variables dx et dy sont considérées comme très petites ( infinitésimales ), et cette interprétation est rendue rigoureuse en analyse non standard .

Historique et utilisation

Le différentiel a été introduit pour la première fois via une définition intuitive ou heuristique par Isaac Newton et approfondi par Gottfried Leibniz , qui considérait le différentiel  dy comme un changement infiniment petit (ou infinitésimal ) de la valeur  y de la fonction, correspondant à un changement infiniment petit  dx dans l'argument x de la fonction  . Pour cette raison, le taux de variation instantané de y par rapport à x , qui est la valeur de la dérivée de la fonction, est désigné par la fraction

dans ce qu'on appelle la notation de Leibniz pour les dérivés. Le quotient dy / dx n'est pas infiniment petit ; c'est plutôt un nombre réel .

L'utilisation des infinitésimaux sous cette forme a été largement critiquée, par exemple par le célèbre pamphlet The Analyst de l'évêque Berkeley. Augustin-Louis Cauchy ( 1823 ) définit la différentielle sans faire appel à l'atomisme des infinitésimaux de Leibniz. Au lieu de cela, Cauchy, à la suite d'Alembert , renverse l'ordre logique de Leibniz et de ses successeurs : la dérivée elle-même devient l'objet fondamental, défini comme une limite de quotients de différence, et les différentielles sont alors définies en ses termes. C'est-à-dire que l'on était libre de définir la différentielle dy par une expression

dans laquelle dy et dx sont simplement de nouvelles variables prenant des valeurs réelles finies, et non des infinitésimales fixes comme elles l'avaient été pour Leibniz.

Selon Boyer (1959 , p. 12), l'approche de Cauchy était une amélioration logique significative par rapport à l'approche infinitésimale de Leibniz car, au lieu d'invoquer la notion métaphysique d'infinitésimales, les quantités dy et dx pouvaient désormais être manipulées exactement de la même manière que toute autre quantité réelle de manière significative. L'approche conceptuelle globale de Cauchy aux différentiels reste la norme dans les traitements analytiques modernes, bien que le dernier mot sur la rigueur, une notion entièrement moderne de la limite, soit finalement dû à Karl Weierstrass .

Dans les traitements physiques, comme ceux appliqués à la théorie de la thermodynamique , la vision infinitésimale prévaut encore. Courant & John (1999 , p. 184) concilient l'utilisation physique des différentielles infinitésimales avec leur impossibilité mathématique comme suit. Les différentiels représentent des valeurs finies non nulles qui sont inférieures au degré de précision requis pour l'usage particulier auquel ils sont destinés. Ainsi, les « infinitésimaux physiques » n'ont pas besoin de faire appel à un infinitésimal mathématique correspondant pour avoir un sens précis.

À la suite des développements du vingtième siècle dans l'analyse mathématique et la géométrie différentielle , il est devenu clair que la notion de différentielle d'une fonction pouvait être étendue de diverses manières. En analyse réelle , il est plus souhaitable de traiter directement le différentiel comme la partie principale de l'incrément d'une fonction. Cela conduit directement à la notion que la différentielle d'une fonction en un point est une fonctionnelle linéaire d'un incrément Δ x . Cette approche permet à la différentielle (sous forme d'application linéaire) d'être développée pour une variété d'espaces plus sophistiqués, donnant finalement lieu à des notions telles que la dérivée de Fréchet ou de Gateaux . De même, en géométrie différentielle , la différentielle d'une fonction en un point est une fonction linéaire d'un vecteur tangent (un "déplacement infiniment petit"), qui la présente comme une sorte de forme unique : la dérivée extérieure de la fonction. Dans le calcul non standard , les différentielles sont considérées comme des infinitésimaux, qui peuvent eux-mêmes être mis sur une base rigoureuse (voir différentielle (infinitésimal) ).

Définition

Le différentiel d'une fonction ƒ ( x ) en un point  x 0 .

Le différentiel est défini dans les traitements modernes du calcul différentiel comme suit. La différentielle d'une fonction f ( x ) d'une seule variable réelle x est la fonction df de deux variables réelles indépendantes x et Δ x donnée par

Un ou les deux arguments peuvent être supprimés, c'est-à-dire que l'on peut voir df ( x ) ou simplement df . Si y  =  f ( x ), le différentiel peut aussi s'écrire dy . Puisque dx ( x , Δ x ) = Δ x il est conventionnel d'écrire dx  = Δ x , de sorte que l'égalité suivante est vérifiée :

Cette notion de différentiel est largement applicable lorsqu'une approximation linéaire d'une fonction est recherchée, dans laquelle la valeur de l'incrément Δ x est suffisamment petite. Plus précisément, si f est une fonction différentiable en x , alors la différence des valeurs y

satisfait

où l'erreur ε dans l'approximation satisfait εx  → 0 lorsque Δ x  → 0. En d'autres termes, on a l'identité approximative

dans lequel l'erreur peut être rendue aussi petite que souhaitée par rapport à x en contraignant Δ x à être suffisamment petit ; c'est-à-dire,

comme Δ x  → 0. Pour cette raison, le différentiel d'une fonction est connu comme la partie principale (linéaire) de l'incrément d'une fonction : le différentiel est une fonction linéaire de l'incrément Δ x , et bien que l'erreur puisse être non linéaire, il tend vers zéro rapidement lorsque Δ x tend vers zéro.

Différentiels dans plusieurs variables

Opérateur / Fonction
Différentiel 1: 2:

3:

Dérivée partielle
Dérivée totale

Suivant Goursat (1904 , I, §15), pour les fonctions de plus d'une variable indépendante,

le différentiel partiel de y par rapport à l'une quelconque des variables  x 1 est la partie principale du changement de y résultant d'un changement  dx 1 dans cette variable. Le différentiel partiel est donc

impliquant la dérivée partielle de y par rapport à  x 1 . La somme des différentiels partiels par rapport à toutes les variables indépendantes est le différentiel total

qui est la partie principale de la variation de y résultant des variations des variables indépendantes  x i .

Plus précisément, dans le contexte du calcul multivariable, à la suite de Courant (1937b) , si f est une fonction différentiable, alors par définition de la différentiabilité , l'incrément

où les termes d'erreur ε i tendent vers zéro lorsque les incréments Δ x i tendent conjointement vers zéro. Le différentiel total est alors rigoureusement défini comme  

Puisque, avec cette définition,

on a

Comme dans le cas d'une variable, l'identité approximative tient

dans lequel l'erreur totale peut être rendue aussi petite que souhaité par rapport à en limitant l'attention à des incréments suffisamment petits.

Application du différentiel total à l'estimation de l'erreur

Dans la mesure, l'écart total est utilisé dans l' estimation de l'erreur Δ f d'une fonction f sur la base des erreurs Δ x , Δ y , ... des paramètres x , y , .... En supposant que l'intervalle est suffisamment court pour que le changement soit approximativement linéaire :

Δ f ( x ) = f » ( x ) × Δ x

et que toutes les variables sont indépendantes, alors pour toutes les variables,

En effet, la dérivée f x par rapport au paramètre particulier x donne la sensibilité de la fonction f à une variation de x , en particulier l'erreur x . Comme ils sont supposés indépendants, l'analyse décrit le pire des cas. Les valeurs absolues des erreurs composantes sont utilisées, car après un calcul simple, la dérivée peut avoir un signe négatif. De ce principe découlent les règles d'erreur de sommation, multiplication, etc., par exemple :

Soit f( a , b ) = a × b ;
Δ f = f un Δ a + f b Δ b ; évaluer les dérivés
Δ f = b Δ a + a Δ b ; en divisant par f , qui est a × b
Δ f / f = Δ a / a + Δ b / b

C'est-à-dire qu'en multiplication, l' erreur relative totale est la somme des erreurs relatives des paramètres.

Pour illustrer comment cela dépend de la fonction considérée, considérons le cas où la fonction est f ( a , b ) = a ln b à la place. Ensuite, on peut calculer que l'estimation d'erreur est

Δ f / f = Δ a / a + Δ b / ( b ln b )

avec un facteur supplémentaire ' ln b ' introuvable dans le cas d'un produit simple. Ce facteur supplémentaire tend à réduire l'erreur, car ln b n'est pas aussi grand que a nu  b .

Différences d'ordre supérieur

Les différentiels d'ordre supérieur d'une fonction y  =  f ( x ) d'une seule variable x peuvent être définis via :

et en général,

De manière informelle, cela motive la notation de Leibniz pour les dérivés d'ordre supérieur

Lorsque la variable indépendante x elle-même est autorisée à dépendre d'autres variables, alors l'expression devient plus compliquée, car elle doit également inclure des différentiels d'ordre supérieur dans x lui-même. Ainsi, par exemple,

et ainsi de suite.

Des considérations similaires s'appliquent à la définition des différentiels d'ordre supérieur des fonctions de plusieurs variables. Par exemple, si f est une fonction de deux variables x et y , alors

où est un coefficient binomial . Dans plus de variables, une expression analogue est valable, mais avec un développement multinomial approprié plutôt qu'un développement binomial.

Les différentiels d'ordre supérieur dans plusieurs variables deviennent également plus compliqués lorsque les variables indépendantes sont elles-mêmes autorisées à dépendre d'autres variables. Par exemple, pour une fonction f de x et y qui peuvent dépendre de variables auxiliaires, on a

En raison de cette infélicité notationnelle, l'utilisation de différentiels d'ordre supérieur a été vivement critiquée par Hadamard 1935 , qui a conclu :

Enfin, que signifie ou que représente l'égalité
A mon avis, rien du tout.

C'est-à-dire : Enfin, qu'est-ce que l'égalité [...] ? A mon avis, rien du tout. Malgré ce scepticisme, les différentiels d'ordre supérieur ont émergé comme un outil important dans l'analyse.

Dans ces contextes, la différentielle d'ordre n de la fonction f appliquée à un incrément Δ x est définie par

ou une expression équivalente, telle que

où est un n ième différence directe avec incrément t Δ x .

Cette définition a également un sens si f est une fonction de plusieurs variables (par souci de simplicité pris ici comme un argument vectoriel). Alors la n ième différentielle ainsi définie est une fonction homogène de degré n dans l'incrément vectoriel x . De plus, la série de Taylor de f au point x est donnée par

La dérivée de Gateaux d' ordre supérieur généralise ces considérations aux espaces dimensionnels infinis.

Propriétés

Un certain nombre de propriétés de la différentielle découlent directement des propriétés correspondantes de la dérivée, de la dérivée partielle et de la dérivée totale. Ceux-ci inclus:

  • Linéarité : Pour les constantes a et b et les fonctions dérivables f et g ,

Une opération d avec ces deux propriétés est connue en algèbre abstraite comme une dérivation . Ils impliquent la règle du Pouvoir

De plus, diverses formes de la règle de la chaîne tiennent, à un niveau de généralité croissant :

  • Si y  =  f ( u ) est une fonction dérivable de la variable u et u  =  g ( x ) est une fonction dérivable de x , alors
Heuristiquement, la règle de la chaîne pour plusieurs variables peut elle-même être comprise en divisant les deux côtés de cette équation par la quantité infiniment petite dt .
  • Des expressions analogues plus générales sont valables, dans lesquelles les variables intermédiaires x i dépendent de plus d'une variable.

Formulation générale

Une notion cohérente de différentiel peut être développée pour une fonction f  : R nR m entre deux espaces euclidiens . Soit xx  ∈  R n une paire de vecteurs euclidiens . L'incrément de la fonction f est

S'il existe une matrice m  ×  n A telle que

dans laquelle le vecteur ε  → 0 comme Δ x  → 0, alors f est par définition dérivable au point x . La matrice A est parfois appelée matrice Jacobienne , et la transformation linéaire qui associe à l'incrément Δ x  ∈  R n le vecteur A Δ x  ∈  R m est, dans ce cadre général, appelée différentielle df ( x ) de f au point x . C'est précisément la dérivée de Fréchet , et la même construction peut être utilisée pour une fonction entre n'importe quel espace de Banach .

Un autre point de vue fructueux est de définir le différentiel directement comme une sorte de dérivée directionnelle :

c'est l'approche déjà adoptée pour définir les différentiels d'ordre supérieur (et c'est presque la définition énoncée par Cauchy). Si t représente le temps et la position x , alors h représente une vitesse au lieu d'un déplacement comme nous l'avons considéré jusqu'ici. Cela donne encore un autre raffinement de la notion de différentiel : qu'il devrait être une fonction linéaire d'une vitesse cinématique. L'ensemble de toutes les vitesses passant par un point donné de l'espace est connu sous le nom d' espace tangent , et donc df donne une fonction linéaire sur l'espace tangent : une forme différentielle . Avec cette interprétation, la différentielle de f est connue sous le nom de dérivée extérieure et a une large application en géométrie différentielle car la notion de vitesses et l'espace tangent ont un sens sur toute variété différentiable . Si, en plus, la valeur de sortie de f représente également une position (dans un espace euclidien), alors une analyse dimensionnelle confirme que la valeur de sortie de df doit être une vitesse. Si l'on traite le différentiel de cette manière, il est alors connu sous le nom de poussée en avant car il « pousse » les vitesses d'un espace source vers des vitesses dans un espace cible.

Autres approches

Bien que la notion d'avoir un incrément infinitésimal dx ne soit pas bien définie dans l' analyse mathématique moderne , il existe une variété de techniques pour définir le différentiel infinitésimal afin que le différentiel d'une fonction puisse être traité d'une manière qui n'entre pas en conflit avec la notation de Leibniz . Ceux-ci inclus:

Exemples et applications

Les différentiels peuvent être utilisés efficacement en analyse numérique pour étudier la propagation d'erreurs expérimentales dans un calcul, et donc la stabilité numérique globale d'un problème ( Courant 1937a ). Supposons que la variable x représente le résultat d'une expérience et que y soit le résultat d'un calcul numérique appliqué à x . La question est de savoir dans quelle mesure les erreurs dans la mesure de x influencent le résultat du calcul de y . Si x est connu à Δ x près de sa vraie valeur, alors le théorème de Taylor donne l'estimation suivante sur l'erreur Δ y dans le calcul de y :

ξ = x + θ Δ x pour un certain 0 < θ < 1 . Si Δ x est petit, alors le terme du second ordre est négligeable, de sorte que Δ y est, à des fins pratiques, bien approché par dy = f' ( xx .

Le différentiel est souvent utile pour réécrire une équation différentielle

sous la forme

en particulier lorsqu'on veut séparer les variables .

Remarques

  1. ^ Pour un compte rendu historique détaillé du différentiel, voir Boyer 1959 , en particulier page 275 pour la contribution de Cauchy sur le sujet. Un compte rendu abrégé apparaît dans Kline 1972 , chapitre 40.
  2. ^ Cauchy a explicitement nié la possibilité de quantités réelles infinitésimales et infinies ( Boyer 1959 , pp. 273-275), et a adopté le point de vue radicalement différent selon lequel « une quantité variable devient infiniment petite lorsque sa valeur numérique diminue indéfiniment de telle sorte que converger vers zéro » ( Cauchy 1823 , p. 12 ; traduction de Boyer 1959 , p. 273).
  3. ^ Boyer 1959 , p. 275
  4. ^ Boyer 1959 , p. 12 : "Les différentiels ainsi définis ne sont que de nouvelles variables , et non des infinitésimaux fixes..."
  5. ^ Courant 1937a , II, §9 : « Remarquons ici simplement en passant qu'il est possible d'utiliser cette représentation approximative de l'incrément Δ y par l'expression linéaire hf ( x ) pour construire une définition logiquement satisfaisante d'un « différentiel », comme l'a fait notamment Cauchy.
  6. ^ Boyer 1959 , p. 284
  7. ^ Voir, par exemple, les traités influents de Courant 1937a , Kline 1977 , Goursat 1904 et Hardy 1905 . Les sources tertiaires pour cette définition incluent également Tolstov 2001 et Itô 1993 , §106.
  8. ^ Cauchy 1823 . Voir aussi, par exemple, Goursat 1904 , I, §14.
  9. ^ Goursat 1904 , I, §14
  10. ^ Notamment à l' holomorphie dimensionnelle infinie ( Hille & Phillips 1974 ) et à l'analyse numérique via le calcul des différences finies .
  11. ^ Goursat 1904 , I, §17
  12. ^ Goursat 1904 , I, §§14,16
  13. ^ Eisenbud et Harris 1998 .
  14. ^ Voir Kock 2006 et Moerdijk & Reyes 1991 .
  15. ^ Voir Robinson 1996 et Keisler 1986 .

Les références

Liens externes