Théorème de Hahn-Banach - Hahn–Banach theorem

Le théorème de Hahn-Banach est un outil central en analyse fonctionnelle . Il permet l'extension des fonctionnelles linéaires bornées définies sur un sous-espace d'un espace vectoriel à l'ensemble de l'espace, et il montre également qu'il y a « assez » de fonctionnelles linéaires continues définies sur chaque espace vectoriel normé pour rendre l'étude de l' espace dual « intéressante ". Une autre version du théorème de Hahn-Banach est connue sous le nom de théorème de séparation Hahn-Banach ou théorème de séparation hyperplan , et a de nombreuses utilisations en géométrie convexe .

Histoire

Le théorème porte le nom des mathématiciens Hans Hahn et Stefan Banach , qui l'ont prouvé indépendamment à la fin des années 1920. Le cas particulier du théorème pour l'espace des fonctions continues sur un intervalle a été prouvé plus tôt (en 1912) par Eduard Helly , et un théorème d'extension plus général, le théorème d'extension de M. Riesz , à partir duquel le théorème de Hahn-Banach peut être dérivé , a été prouvé en 1923 par Marcel Riesz .

Le premier théorème de Hahn-Banach a été prouvé par Eduard Helly en 1921 qui a montré que certaines fonctionnelles linéaires définies sur un sous-espace d'un certain type d'espace normé ( ) avaient une extension de la même norme. Helly l'a fait en prouvant d'abord qu'il existe une extension unidimensionnelle (où la fonctionnelle linéaire a son domaine étendu d'une dimension), puis en utilisant l' induction . En 1927, Hahn a défini les espaces de Banach généraux et a utilisé la technique de Helly pour prouver une version préservant la norme du théorème de Hahn-Banach pour les espaces de Banach (où une fonctionnelle linéaire bornée sur un sous-espace a une extension linéaire bornée de la même norme à l'ensemble de l'espace). En 1929, Banach, qui ignorait le résultat de Hahn, le généralisa en remplaçant la version préservant la norme par la version d'extension dominée qui utilise des fonctions sublinéaires . Alors que la preuve de Helly utilisait l'induction mathématique, Hahn et Banach utilisaient tous deux l'induction transfinie .

Le théorème de Hahn-Banach est né de tentatives pour résoudre des systèmes infinis d'équations linéaires. Cela est nécessaire pour résoudre des problèmes tels que le problème des moments, où étant donné tous les moments potentiels d'une fonction, il faut déterminer si une fonction ayant ces moments existe et, si c'est le cas, la trouver en fonction de ces moments. Un autre problème de ce type est le problème des séries de cosinus de Fourier , dans lequel, étant donné tous les coefficients de cosinus de Fourier potentiels, il faut déterminer si une fonction ayant ces coefficients existe et, encore une fois, la trouver si c'est le cas.

Riesz et Helly ont résolu le problème pour certaines classes d'espaces (comme L p ([0, 1]) et C([ a , b ])) où ils ont découvert que l'existence d'une solution était équivalente à l'existence et à la continuité de certaines fonctionnelles linéaires. En effet, ils devaient résoudre le problème suivant :

( Le problème de vecteur ) Etant donné un ensemble de fonctionnelles linéaires sur un espace normé X et un ensemble de valeurs scalaires , déterminer s'il y a un xX tel que f i ( x ) = c i pour tout iI .

Pour résoudre cela, si X est réflexif alors il suffit de résoudre le problème dual suivant :

( Le problème fonctionnel ) Etant donné un ensemble de vecteurs dans un espace normé X et un ensemble de valeurs scalaires , déterminer s'il y a une fonction linéaire bornée f sur X telle que f ( x i ) = c i pour tout iI .

Riesz a ensuite défini L p ([0, 1]) ( 1 < p < ∞ ) en 1910 et les espaces l p en 1913. En étudiant ces espaces, il a prouvé un cas particulier du théorème de Hahn-Banach. Helly a également prouvé un cas particulier du théorème de Hahn-Banach en 1912. En 1910, Riesz a résolu le problème fonctionnel pour certains espaces spécifiques et en 1912, Helly l'a résolu pour une classe d'espaces plus générale. Ce n'est qu'en 1932 que Banach, dans l'une des premières applications importantes du théorème de Hahn-Banach, a résolu le problème fonctionnel général. Le théorème suivant énonce le problème fonctionnel général et caractérise sa solution.

Théorème  (Le problème fonctionnel)  -  Soit X un espace normé réel ou complexe, je un ensemble non vide, ( c i ) iI une famille de scalaires, et ( x i ) iI une famille de vecteurs dans X .

Il existe une forme linéaire continue f sur X telle que f ( x i ) = c i pour tout iI si et seulement s'il existe un K > 0 tel que , pour le choix des scalaires ( s i ) iI , où tous les mais un nombre fini de s i valent 0, on a nécessairement

On peut utiliser le théorème ci-dessus pour déduire le théorème de Hahn-Banach. Si X est réflexif, alors ce théorème résout le problème vectoriel.

Théorème de Hahn-Banach

Théorème (Hahn-Banach)  —  Définissez K comme R ou C et laissez X un K -espace vectoriel. Si f  : MK est une fonctionnelle K -linéaire sur un sous-espace K -linéaire M et p  : XR une fonction sublinéaire non négative telle que

| f ( m ) | ≤ p ( m )     pour tous les mM .

alors il existe un K -linéaire F  : XK tel que

F ( m ) = f ( m )     pour tous les mM ,
| F ( x ) | ≤ p ( x )     pour tout xX .

L'extension F n'est en général pas spécifiée de manière unique par f et la preuve ne donne aucune méthode explicite sur la façon de trouver F .

Il est possible de se détendre un peu l'état de sous - additivité sur p , ne nécessitant que pour tout x , yX et tous scalaires a et b satisfaisant | un | + | b | 1 ,

p ( ax + par ) ≤ | un | p ( x ) + | b | p ( y ) .

Il est en outre possible de relâcher les conditions d'homogénéité positive et de sous-additivité sur p , en exigeant seulement que p soit convexe.

Le projet Mizar a complètement formalisé et vérifié automatiquement la preuve du théorème de Hahn-Banach dans le fichier HAHNBAN.

Preuve

Dans le cas complexe, les hypothèses de C -linéarité exigent que M = N + Ni pour un espace vectoriel réel N . De plus, pour tout vecteur xN , f ( ix ) = si ( x ) . Ainsi, la partie réelle d'une fonctionnelle linéaire détermine déjà le comportement de la fonctionnelle linéaire dans son ensemble, et prouver le cas réel suffira.

Tout d'abord, notons le résultat initial de Helly : si M est de codimension 1, alors Hahn-Banach est facile.

Lemme  ( à une dimension théorème d'extension dominé)  -  Soit X un espace vectoriel réel, p  : XR une fonction sous - linéaire, f  : MR une fonction linéaire sur une bonne sous - espace vectoriel MX tel que fp sur M (ie f ( m ) ≤ p ( m ) pour tout mM ), et xX un vecteur non dans M . Il existe une extension linéaire F  : MR xR de f à MR x = £ { M , x } de telle sorte que F de p sur MR x .

Preuve  —

Pour prouver ce lemme, laissez m , nM . Par les propriétés de linéarité de nos fonctions,

p (− xn ) − f ( n ) p ( m + x ) − f ( m ) .

En particulier, laissez

et
On conclut alors à "l'inégalité décisive" que pour tout ab . Soit donc c [ a , b ] et définissons F ( m + rx ) = f ( m ) + rc ; alors
F ( m + rx ) ≤ p ( m ) + rcp ( m + rx )

L'inégalité inverse est similaire.

Appliquez maintenant le lemme de Zorn : les extensions possibles de f sont partiellement ordonnées par extension les unes des autres, il existe donc une extension maximale F . Par le résultat de codimension-1, si F n'est pas défini sur tout X , alors il peut être encore étendu. Ainsi F doit être défini partout, comme on le prétend.

Dans les espaces localement convexes

Dans la forme ci-dessus, la fonctionnelle à étendre doit déjà être bornée par une fonction sublinéaire. Dans certaines applications, cela pourrait être proche de poser la question . Cependant, dans les espaces localement convexes , toute fonctionnelle continue est déjà bornée par la norme , qui est sublinéaire. On a ainsi

Extensions continues sur des espaces localement convexes  —  Soit X un espace vectoriel topologique localement convexe sur K (soit R soit C ), M un sous-espace vectoriel de X , et f une fonctionnelle linéaire continue sur M . Alors f a une extension linéaire continue à tout X . Si la topologie sur X est issue d'une norme , alors la norme de f est conservée par cette extension.

En termes de théorie des catégories , le champ K est un objet injectif dans la catégorie des espaces vectoriels localement convexes.

Relation avec l'axiome du choix

La preuve ci-dessus utilise le lemme de Zorn, qui est équivalent à l' axiome du choix . On sait maintenant (voir ci-dessous) que le lemme de l' ultrafiltre (ou de manière équivalente, le théorème booléen idéal premier ), qui est légèrement plus faible que l'axiome de choix, est en fait assez fort.

Le théorème de Hahn-Banach est équivalent à ce qui suit :

(∗) : Sur toute algèbre booléenne B, il existe une « charge de probabilité », c'est-à-dire : une application finiment additive non constante de B dans [0, 1] .

(Le théorème idéal booléen premier équivaut à dire qu'il existe toujours des charges de probabilité non constantes qui ne prennent que les valeurs 0 et 1.)

Dans la théorie des ensembles de Zermelo-Fraenkel , on peut montrer que le théorème de Hahn-Banach est suffisant pour dériver l'existence d'un ensemble mesurable non-Lebesgue. De plus, le théorème de Hahn-Banach implique le paradoxe de Banach-Tarski .

Pour les espaces de Banach séparables , DK Brown et SG Simpson ont prouvé que le théorème de Hahn-Banach découle de WKL 0 , un sous - système faible d' arithmétique du second ordre qui prend une forme de lemme de Kőnig restreint aux arbres binaires comme axiome. En fait, ils prouvent que sous un ensemble faible d'hypothèses, les deux sont équivalents, un exemple de mathématiques inversées .

« Géométrique Hahn-Banach » (les théorèmes de séparation Hahn-Banach)

L'élément clé du théorème de Hahn-Banach est fondamentalement à la suite de la séparation des deux ensembles convexes: {- p (- x - n ) - f ( n ): nM } et { p ( m + x ) - f ( m ): mm }. Ce genre d'argument apparaît largement dans la géométrie convexe , la théorie de l'optimisation et l' économie . Les lemmes à cette fin dérivés du théorème original de Hahn-Banach sont connus sous le nom de théorèmes de séparation de Hahn-Banach .

Théorème  —  Soit X un espace vectoriel topologique réel localement convexe et A et B des sous-ensembles convexes non vides. Si Int A ≠ ∅ et B ∩ Int A = ∅ alors il existe une fonctionnelle linéaire continue f sur X telle que sup f ( A ) ≤ inf f ( B ) et f ( a ) < inf f ( B ) pour tout a ∈ Int A (un tel f est nécessairement non nul).

On suppose souvent que les ensembles convexes ont une structure supplémentaire ; c'est-à-dire qu'ils sont ouverts ou compacts . Dans ce cas, la conclusion peut être considérablement renforcée :

Théorème  —  Soit X un espace vectoriel topologique réel et choisissons A , B des sous-ensembles disjoints convexes non vides de X .

  • Si A est ouvert alors A et B sont séparés par un hyperplan (fermé) . Explicitement, cela signifie qu'il y existe une application linéaire continue f  : XK et sR tel que f ( a ) < sf ( b ) pour tout unA , bB . Si A et B sont ouverts, le côté droit peut également être considéré comme strict.
  • Si X est localement convexe, A est compact, et B fermé, alors A et B sont strictement séparés : il existe une application linéaire continue f  : XK et s , tR tel que f ( a ) < t < s < f ( b ) pour tout una , bb .

Si X est complexe, alors les mêmes affirmations sont vraies , mais pour la partie réelle de f .

Un corollaire important est connu sous le nom de théorème géométrique de Hahn-Banach ou théorème de Mazur .

Théorème (Mazur)  —  Soit M un sous-espace vectoriel de l'espace vectoriel topologique X . Supposons que K est un sous - ensemble ouvert convexe non vide de X avec KM = ∅ . Ensuite , il y a une fermeture hyperplan (sous - espace vectoriel codimension-1) NX qui contient M , mais il reste disjointe de K .

Pour voir que le théorème de Mazur découle des théorèmes de séparation de Hahn-Banach, notez que M est convexe et appliquez la première puce. Le théorème de Mazur précise que les sous-espaces vectoriels (même ceux qui ne sont pas fermés) peuvent être caractérisés par des fonctionnelles linéaires.

Corollaire  (Séparation d'un sous-espace et d'un ouvert convexe)  —  Soit X un espace vectoriel localement convexe, M un sous-espace vectoriel, et U un sous-ensemble ouvert convexe non vide disjoint de M . Il existe alors une fonction linéaire continue f sur X telle que f ( m ) = 0 pour tout mM et Re f > 0 sur U

Prise en charge des hyperplans

Puisque les points sont trivialement convexes , Hahn-Banach géométrique implique que les fonctionnelles peuvent détecter la frontière d'un ensemble. En particulier, soit X un espace vectoriel topologique réel et AX un convexe avec Int A ≠ ∅ . Si alors il y a une fonction qui est en train de disparaître à un 0 , mais a soutenu à l'intérieur de A .

Appelons un espace normé X lisse si en chaque point x de sa boule unité il existe un unique hyperplan fermé à la boule unité en x . Köthe a montré en 1983 qu'un espace normé est lisse en un point x si et seulement si la norme de Gateaux est dérivable en ce point.

Quartiers équilibrés ou en disque

Soit U être convexe équilibrée voisinage de 0 dans un localement convexe espace vectoriel topologique X et supposons xX n'est pas un élément de U . Alors il existe une fonctionnelle linéaire continue f sur X telle que

sup | f ( U ) | | f ( x ) | .

Applications

Le théorème de Hahn-Banach est le premier signe d'une philosophie importante en analyse fonctionnelle : pour comprendre un espace, il faut comprendre ses fonctionnelles continues .

Par exemple, les sous-espaces linéaires sont caractérisés par des fonctionnelles : si X est un espace vectoriel normé à sous-espace linéaire M (pas nécessairement fermé) et si z est un élément de X non dans la fermeture de M , alors il existe une application linéaire continue f  : XK avec f ( x ) = 0 pour tout x dans M , f ( z ) = 1 et || f || = dist( z , M ) -1 . (Pour voir cela, notez que dist(·, M) est une fonction sublinéaire.) De plus, si z est un élément de X , alors il existe une application linéaire continue f  : XK telle que f ( z ) = || z || et || f || 1 . Ceci implique que l' injection naturelle J d'un espace normé X dans son double dual V′′ est isométrique.

Ce dernier résultat suggère également que le théorème de Hahn-Banach peut souvent être utilisé pour localiser une topologie "plus agréable" dans laquelle travailler. Par exemple, de nombreux résultats en analyse fonctionnelle supposent qu'un espace est Hausdorff ou localement convexe . Cependant, supposons que X soit un espace vectoriel topologique, pas nécessairement Hausdorff ou localement convexe , mais avec un ouvert M non vide, propre, convexe . Alors Hahn-Banach géométrique implique qu'il existe un hyperplan séparant M de tout autre point. En particulier, il doit exister une fonctionnelle non nulle sur X — c'est-à-dire que l' espace dual continu X * est non trivial. Considérant X avec la topologie faible induite par X * , alors X devient localement convexe ; par la deuxième puce de Hahn-Banach géométrique, la topologie faible sur ce nouvel espace sépare des points . Ainsi X avec cette topologie faible devient Hausdorff . Cela permet parfois d'appliquer certains résultats d'espaces vectoriels topologiques localement convexes à des espaces non-Hausdorff et non localement convexes.

Équations aux dérivées partielles

Le théorème de Hahn-Banach est souvent utile lorsque l'on souhaite appliquer la méthode des estimations a priori . Supposons que nous souhaitions résoudre l'équation différentielle linéaire Pu = f pour u , avec f donné dans un espace de Banach X . Si nous contrôlons la taille de u en termes de et que nous pouvons considérer u comme une fonctionnelle linéaire bornée sur un espace approprié de fonctions de test g , alors nous pouvons considérer f comme une fonctionnelle linéaire par adjonction : . Dans un premier temps, cette fonctionnelle n'est définie que sur l'image de P , mais en utilisant le théorème de Hahn-Banach, on peut essayer de l'étendre à l'ensemble du codomaine X . La fonctionnelle résultante est souvent définie comme une solution faible de l'équation .

Caractériser les espaces réflexifs de Banach

Théorème  —  Un espace de Banach réel est réflexif si et seulement si chaque paire de sous-ensembles fermés convexes disjoints non vides, dont l'un est borné, peut être strictement séparé par un hyperplan.

Exemple de la théorie de Fredholm

Pour illustrer une application réelle du théorème de Hahn-Banach, nous allons maintenant prouver un résultat qui découle presque entièrement du théorème de Hahn-Banach.

Proposition  —  Supposons que X soit un TVS de Hausdorff localement convexe sur le corps K et que Y soit un sous-espace vectoriel de X qui soit TVS-isomorphe à K I pour un certain ensemble I . Alors Y est un sous-espace vectoriel fermé et complémenté de X .

Preuve  —

Puisque K I est un TVS complet , Y l' est aussi , et puisque tout sous-ensemble complet d'un TVS de Hausdorff est fermé, Y est un sous-ensemble fermé de X . Soit f = ( f i ) iI  : YK Je serai un isomorphisme TVS, de sorte que chaque f i  : YK est une constante linéaire surjective fonctionnelle. Par le théorème de Hahn-Banach, nous pouvons étendre chaque f i à une fonctionnelle linéaire continue F i  : XK sur X . Laissez F  : = ( F i ) iI  : XK I si F est une surjection linéaire continue telle que sa restriction à Y est F | Y = ( F i | Y ) iI = ( f i ) iI = f . Il s'ensuit que si nous définissons P  := f −1F  : XY alors la restriction à Y de cette application linéaire continue P | Y  : YY est l'application identité 1 Y sur Y , pour P | Y = f -1F | Y = f -1f = 1 Y . Ainsi , en particulier, P est une projection linéaire continue sur Y ( par exemple PP = P ). Ainsi Y est complémenté en X et X = Y ker P dans la catégorie des TVS. ∎

On peut utiliser le résultat ci-dessus pour montrer que tout sous-espace vectoriel fermé de R N est complémenté et de dimension finie ou bien TVS-isomorphe à R N .

Généralisations

Modèle général

Il existe maintenant de nombreuses autres versions du théorème de Hahn-Banach. Le modèle général pour les différentes versions du théorème de Hahn-Banach présenté dans cet article est le suivant :

X est un espace vectoriel, p est une fonction sublinéaire sur X (éventuellement une semi - norme ), M est un sous-espace vectoriel de X (éventuellement fermé), et f est une fonctionnelle linéaire sur M satisfaisant | f | ≤ p sur M (et éventuellement d'autres conditions). On conclut alors qu'il existe une extension linéaire F de f à X telle que | F | ≤ p sur X (éventuellement avec des propriétés supplémentaires).

Pour les semi-normes

Hahn-Banach pour seminormes  -  Si M est un sous - espace vectoriel de X , p est un seminorme sur M , et q est un seminorme sur X tel que pq | M , alors il existe une semi-norme P sur X telle que P | M = p et P de q .

Une preuve s'exécute comme suit :

Lemme  —  Soit M un sous-espace vectoriel d'un espace vectoriel réel ou complexe X , soit D un disque absorbant dans X , et soit f une fonctionnelle linéaire sur M telle que | f | ≤ 1 sur MD . Alors il existe une fonctionnelle linéaire F sur X prolongeant f telle que | F | 1 sur D .

laisser S soit l'enveloppe convexe de { mM  : p ( x ) ≤ 1} ∪ { xX  : q ( x ) ≤ 1} . Notez que S est un disque absorbant dans X , et appelez sa fonctionnelle de Minkowski q . Ensuite , p = P sur M et P de q sur X .

Séparation géométrique

Théorème sandwich Hahn-Banach  -  Soit S une partie quelconque d'un espace vectoriel réel X , que p une fonction sous - linéaire sur X , et que f  : SR soit une carte. S'il existe des nombres positifs a et b tel que pour tout x , yS ,

alors il existe une fonctionnelle linéaire F sur X tel que F de p sur X et fF sur S .

Extension linéaire maximale

Théorème  (Andenaes, 1970)  -  Soit M un sous - espace de vecteur d'un espace vectoriel réel X , p une fonction sous - linéaire sur X , f soit une fonction linéaire de M de telle sorte que fp sur M , et soit S une partie quelconque de X . Alors il existe une fonctionnelle linéaire F sur X qui prolonge f , vérifie F p sur X , et est (point par point) maximale au sens suivant : si G est une fonctionnelle linéaire sur X prolongeant f et satisfaisant Gp sur X , alors GF implique que G = F sur S .

Hahn–Banach à valeur vectorielle

Théorème  —  Soient X et Y des espaces vectoriels sur le même corps, M un sous-espace vectoriel de X , et f  : MY une application linéaire. Alors il existe une application linéaire F  : XY qui prolonge f .

Pour les fonctions non linéaires

Le théorème suivant de Mazur-Orlicz (1953) est équivalent au théorème de Hahn-Banach.

Théorème de Mazur–Orlicz  —  Soit T un ensemble quelconque, r  : TR une application quelconque à valeurs réelles, X un espace vectoriel réel ou complexe, v  : TX une application quelconque et p une fonction sublinéaire sur X . Alors les éléments suivants sont équivalents :

  1. il existe une valeur réelle fonctionnelle linéaire F sur X tel que F de p sur X et rFv sur T ;
  2. pour tout entier positif n , toute suite s 1 , ..., s n de nombres réels non négatifs, et toute suite t 1 , ..., t n d'éléments de T ,

Le théorème suivant caractérise lorsque toute fonction scalaire sur X (mais pas nécessairement linéaire) a une extension linéaire continue de l' ensemble de X .

Théorème  (Le principe d'extension)  —  Soit f une fonction scalaire sur un sous-ensemble S d'un espace vectoriel topologique X . Alors il existe une fonctionnelle linéaire continue F sur X prolongeant f si et seulement s'il existe une semi-norme continue p sur X telle que

pour tous les entiers positifs n et toutes les suites finies ( a i )n
je =1
des scalaires et des éléments ( s i )n
je =1
de S .

Converser

Soit X un espace vectoriel topologique. Un sous-espace vectoriel M de X a la propriété d'extension si toute fonctionnelle linéaire continue sur M peut être étendue à une fonctionnelle linéaire continue sur X , et nous disons que X a la propriété d'extension de Hahn-Banach ( HBEP ) si chaque sous-espace vectoriel de X a la propriété d'extension.

Le théorème de Hahn-Banach garantit que tout espace de Hausdorff localement convexe a le HBEP. Pour les espaces vectoriels topologiques métrisables complets, il y a une réciproque, due à Kalton : chaque TVS métrisable complète avec la propriété d'extension Hahn-Banach est localement convexe. D'autre part, un espace vectoriel X de dimension indénombrable, doté de la topologie vectorielle la plus fine , alors c'est un espace vectoriel topologique avec la propriété d'extension de Hahn-Banach qui n'est ni localement convexe ni métrisable.

Un sous-espace vectoriel M d'un TVS X a la propriété de séparation si pour tout élément de X tel que xM , il existe une fonctionnelle linéaire continue f sur X telle que f ( x ) ≠ 0 et f ( m ) = 0 pour tout mm . Clairement, l'espace dual continu d'un TVS X sépare des points sur X si et seulement si { 0 } a la propriété de séparation. En 1992, Kakol a prouvé que tout espace vectoriel de dimension infinie X , il existe des topologies TVS sur X qui n'ont pas le HBEP malgré avoir suffisamment de fonctionnelles linéaires continues pour que l'espace dual continu sépare les points sur X . Cependant, si X est un TVS, alors chaque sous-espace vectoriel de X a la propriété d'extension si et seulement si chaque sous-espace vectoriel de X a la propriété de séparation.

Voir également

Les références

Bibliographie