Teorema di Hahn-Banach

In matematica, in particolare in analisi funzionale, il teorema di Hahn-Banach è un teorema che permette di estendere operatori lineari limitati definiti su un sottospazio di qualche spazio vettoriale a tutto lo spazio, e mostra inoltre che ci sono sufficienti funzionali lineari continui definiti su ogni spazio normato tali da rendere lo studio dello spazio duale interessante. È così chiamato grazie a Hans Hahn e Stefan Banach, che provarono questo teorema indipendentemente l'uno dall'altro negli anni venti.

Il teorema

Sia V {\displaystyle V} uno spazio vettoriale sul campo K {\displaystyle K} (che può essere quello reale R {\displaystyle \mathbb {R} } o quello complesso C {\displaystyle \mathbb {C} } ). Una funzione f : V R {\displaystyle f:V\to \mathbb {R} } si dice sublineare se:

f ( γ x ) = γ f ( x ) γ R + x V {\displaystyle f(\gamma x)=\gamma f\left(x\right)\qquad \forall \gamma \in \mathbb {R} _{+}\quad \forall x\in V}
f ( x + y ) f ( x ) + f ( y ) x , y V {\displaystyle f(x+y)\leq f(x)+f(y)\qquad \forall x,y\in V}

Ogni seminorma su V {\displaystyle V} , ed in particolare ogni norma su V {\displaystyle V} , è sublineare.

Si dice inoltre che una funzione F {\displaystyle F} è l'estensione di una funzione f {\displaystyle f} se il dominio di F {\displaystyle F} contiene quello di f {\displaystyle f} e le funzioni coincidono in ogni punto del dominio di f {\displaystyle f} .

Enunciato

Il teorema di Hahn–Banach afferma che se N : V R {\displaystyle {\mathcal {N}}:V\to \mathbb {R} } è una funzione sublineare e φ : U R {\displaystyle \varphi :U\to \mathbb {R} } è un funzionale lineare su un sottospazio vettoriale U V {\displaystyle U\subseteq V} e φ {\displaystyle \varphi } è dominato da N {\displaystyle {\mathcal {N}}} su U {\displaystyle U} , ovvero:

φ ( x ) N ( x ) x U {\displaystyle \varphi (x)\leq {\mathcal {N}}(x)\qquad \forall x\in U}

allora esiste un'estensione lineare ψ : V R {\displaystyle \psi :V\to \mathbb {R} } di φ {\displaystyle \varphi } definita sull'intero spazio. In altri termini, esiste un funzionale lineare ψ {\displaystyle \psi } tale che:[1]

ψ ( x ) = φ ( x ) x U ψ ( x ) N ( x ) x V {\displaystyle \psi (x)=\varphi (x)\quad \forall x\in U\qquad \psi (x)\leq {\mathcal {N}}(x)\quad \forall x\in V}

L'estensione ψ {\displaystyle \psi } non è in generale unicamente determinata da φ {\displaystyle \varphi } , e la dimostrazione non fornisce un metodo per trovare ψ {\displaystyle \psi } nel caso di uno spazio a dimensione infinita V {\displaystyle V} , ma si appoggia al lemma di Zorn.

La condizione di sublinearità su N {\displaystyle {\mathcal {N}}} può essere leggermente indebolita assumendo che:[2]

N ( a x + b y ) | a | N ( x ) + | b | N ( y ) {\displaystyle {\mathcal {N}}(ax+by)\leq |a|{\mathcal {N}}(x)+|b|N(y)}

per tutti gli a {\displaystyle a} e b {\displaystyle b} in K {\displaystyle K} tali che | a | + | b | = 1 {\displaystyle |a|+|b|=1} .

Dimostrazione

Sia X {\displaystyle X} uno spazio vettoriale su R {\displaystyle \mathbb {R} } e sia p : X R {\displaystyle p:X\to \mathbb {R} } una funzione tale che:

p ( t x + ( 1 t ) y ) t p ( x ) + ( 1 t ) p ( y )   x , y X   t [ 0 , 1 ] {\displaystyle p(tx+(1-t)y)\leq tp(x)+(1-t)p(y)\qquad \forall \ x,y\in X\quad \forall \ t\in [0,1]}

Sia Y {\displaystyle Y} un sottospazio di X {\displaystyle X} e sia f : Y R {\displaystyle f:Y\to \mathbb {R} } una funzione lineare tale che:

f ( x ) p ( x )   x Y {\displaystyle f(x)\leq p(x)\qquad \forall \ x\in Y}

Allora esiste una funzione lineare F : X R {\displaystyle F:X\to \mathbb {R} } tale che:

F ( x ) = f ( x )   x Y {\displaystyle F(x)=f(x)\qquad \forall \ x\in Y}
F ( x ) p ( x )   x X {\displaystyle F(x)\leq p(x)\qquad \forall \ x\in X}

Per dimostrare questo fatto, sia z X Y {\displaystyle z\in X\setminus Y} e si consideri il sottospazio di X {\displaystyle X} definito nel modo seguente:

Y z { y + a z ,   y Y ,   a R } {\displaystyle Y_{z}\doteq \left\{y+az,\ y\in Y,\ a\in \mathbb {R} \right\}}

Si estende f {\displaystyle f} su tutto Y z {\displaystyle Y_{z}} ponendo:

f ~ ( y + a z ) f ( y ) + a f ~ ( z ) {\displaystyle {\tilde {f}}(y+az)\doteq f(y)+a{\tilde {f}}(z)}

dove f ~ ( z ) {\displaystyle {\tilde {f}}(z)} è un numero reale che viene determinato nel seguito. La funzione f ~ {\displaystyle {\tilde {f}}} è una estensione lineare di f {\displaystyle f} .

Siano ora y 1 , y 2 Y {\displaystyle y_{1},y_{2}\in Y} e a , b > 0 {\displaystyle a,b>0} . Si ha:

f ( a y 1 + b y 2 ) = a f ( y 1 ) + b f ( y 2 ) = ( a + b ) f ( a a + b y 1 + b a + b y 2 ) {\displaystyle f(ay_{1}+by_{2})=af(y_{1})+bf(y_{2})=(a+b)f\left({\frac {a}{a+b}}y_{1}+{\frac {b}{a+b}}y_{2}\right)\leq }
( a + b ) p ( a a + b y 1 + b a + b y 2 ) = {\displaystyle (a+b)p\left({\frac {a}{a+b}}y_{1}+{\frac {b}{a+b}}y_{2}\right)=}
( a + b ) p ( a a + b ( y 1 b z ) + b a + b ( y 2 + a z ) ) {\displaystyle (a+b)p\left({\frac {a}{a+b}}(y_{1}-bz)+{\frac {b}{a+b}}(y_{2}+az)\right)\leq }
a p ( y 1 b z ) + b p ( y 2 + a z ) {\displaystyle ap(y_{1}-bz)+bp(y_{2}+az)}

Pertanto risulta:

a ( f ( y 1 ) p ( y 1 b z ) ) b ( f ( y 2 ) p ( y 2 + a z ) ) {\displaystyle a\left(f(y_{1})-p(y_{1}-bz)\right)\leq -b\left(f(y_{2})-p(y_{2}+az)\right)}

e quindi:

1 b ( p ( y 1 b z ) + f ( y 1 ) ) 1 a ( p ( y 2 + a z ) f ( y 2 ) )   y 1 , y 2 Y , a , b > 0 {\displaystyle {\frac {1}{b}}\left(-p(y_{1}-bz)+f(y_{1})\right)\leq {\frac {1}{a}}\left(p(y_{2}+az)-f(y_{2})\right)\qquad \forall \ y_{1},y_{2}\in Y,\quad \forall a,b>0}

Quindi esiste c R {\displaystyle c\in \mathbb {R} } tale che:

sup a > 0 , y Y { 1 a [ p ( y a z ) + f ( y ) ] } c inf a > 0 , y Y { 1 a [ p ( y + a z ) f ( y ) ] } {\displaystyle \sup _{a>0,y\in Y}\left\{{\frac {1}{a}}\left[-p(y-az)+f(y)\right]\right\}\leq c\leq \inf _{a>0,y\in Y}\left\{{\frac {1}{a}}\left[p(y+az)-f(y)\right]\right\}}

Da tale disuguaglianza si evince che:

a c p ( y + a z ) f ( y )   y Y ,   a R {\displaystyle ac\leq p(y+az)-f(y)\qquad \forall \ y\in Y,\quad \forall \ a\in \mathbb {R} }

Si pone quindi:

f ~ ( z ) = c {\displaystyle {\tilde {f}}(z)=c}

Per ogni y Y {\displaystyle y\in Y} e per ogni a R {\displaystyle a\in \mathbb {R} } risulta:

f ~ ( y + a z ) = f ( y ) + a c p ( y + a z ) {\displaystyle {\tilde {f}}(y+az)=f(y)+ac\leq p(y+az)}

cioè:

f ~ ( x ) p ( x )   x Y z {\displaystyle {\tilde {f}}(x)\leq p(x)\qquad \forall \ x\in Y_{z}}

Sia ora E {\displaystyle E} l'insieme delle estensioni lineari e {\displaystyle e} di f {\displaystyle f} tali che e ( x ) p ( x ) {\displaystyle e(x)\leq p(x)} per ogni x {\displaystyle x} appartenente al dominio di definizione di e {\displaystyle e} . Per il punto precedente E {\displaystyle E} è un insieme non banale.

Si definisce in E {\displaystyle E} una relazione d'ordine dicendo che e 1 e 2 {\displaystyle e_{1}\leq e_{2}} se il dominio di definizione di e 1 {\displaystyle e_{1}} è contenuto nel dominio di definizione di e 2 {\displaystyle e_{2}} e e 1 {\displaystyle e_{1}} ed e 2 {\displaystyle e_{2}} coincidono sul dominio di definizione di e 1 {\displaystyle e_{1}} .

Si consideri un arbitrario sottoinsieme totalmente ordinato di E {\displaystyle E} , denotato con U = { e a , a A } {\displaystyle U=\left\{e_{a},a\in A\right\}} , dove A {\displaystyle A} è un arbitrario insieme di indici, e sia X a {\displaystyle X_{a}} il dominio di definizione di e a U {\displaystyle e_{a}\in U} . Si pone Y = a A X a {\displaystyle Y=\cup _{a\in A}X_{a}} e, dato y Y {\displaystyle y\in Y} , si definisce e ( y ) = e b ( y ) {\displaystyle e(y)=e_{b}(y)} , dove b A {\displaystyle b\in A} è un qualsiasi indice di A {\displaystyle A} tale che y X b {\displaystyle y\in X_{b}} . La definizione di e {\displaystyle e} è ben posta, ed e {\displaystyle e} è una estensione lineare di ogni e a U {\displaystyle e_{a}\in U} . Inoltre risulta e ( x ) p ( x )   x Y {\displaystyle e(x)\leq p(x)\ \forall x\in Y} .

Si deduce che e {\displaystyle e} è un limite superiore per U {\displaystyle U} . Essendo U {\displaystyle U} un arbitrario sottoinsieme totalmente ordinato di E {\displaystyle E} il lemma di Zorn implica che esiste un elemento massimale di E {\displaystyle E} denotato con F {\displaystyle F} . Sia Y ~ {\displaystyle {\tilde {Y}}} il dominio di definizione di F {\displaystyle F} . Se si mostra che Y ~ = X {\displaystyle {\tilde {Y}}=X} , il teorema è provato.

L'insieme Y ~ {\displaystyle {\tilde {Y}}} è un sottospazio di X {\displaystyle X} . Si supponga, per assurdo, che esista z X Y ~ {\displaystyle z\in X\setminus {\tilde {Y}}} . Applicando il primo punto al sottospazio:

Y ~ z { y + a z ,   y Y ~ ,   a R } {\displaystyle {\tilde {Y}}_{z}\doteq \left\{y+az,\ y\in {\tilde {Y}},\ a\in \mathbb {R} \right\}}

si può costruire una estensione non banale di F {\displaystyle F} che, per le proprietà dimostrate nel primo punto, contraddice la massimalità di F {\displaystyle F} su E {\displaystyle E} . Di qui l'assurdo che conclude la dimostrazione.

Conseguenze

Esistono alcune importanti conseguenze del teorema che talvolta vengono anch'esse chiamate "teorema di Hahn–Banach":

  • Se V {\displaystyle V} è uno spazio normato con sottospazio U {\displaystyle U} (non necessariamente chiuso) e se Φ : U K {\displaystyle \Phi :U\to K} è lineare e continua, allora esiste un'estensione Ψ : V K {\displaystyle \Psi :V\to K} di Φ {\displaystyle \Phi } che è anch'essa lineare e continua e che ha la stessa norma di Φ {\displaystyle \Phi } .
  • Se V {\displaystyle V} è uno spazio normato con sottospazio U (non necessariamente chiuso) e se z {\displaystyle z} è un elemento di V {\displaystyle V} non contenuto nella chiusura di U {\displaystyle U} , allora esiste un'applicazione lineare e continua Ψ : V K {\displaystyle \Psi :V\to K} con Ψ ( x ) = 0 {\displaystyle \Psi (x)=0} per ogni x U {\displaystyle x\in U} , Ψ ( z ) = 1 {\displaystyle \Psi (z)=1} , e Ψ = z 1 {\displaystyle \|\Psi \|=\|z\|^{-1}} .

Il Mizar project ha completamente formalizzato e controllato automaticamente la dimostrazione del teorema di Hahn–Banach nel file HAHNBAN.

Forme geometriche

Il teorema di Hahn-Banach ha due importanti corollari, noti anche come prima e seconda forma geometrica, la cui formulazione richiede alcune nozioni preliminari. Sia X {\displaystyle X} uno spazio vettoriale normato su R {\displaystyle \mathbb {R} } e sia f : X R {\displaystyle f:X\to \mathbb {R} } un funzionale lineare continuo non nullo. Dato a R {\displaystyle a\in \mathbb {R} } , l'insieme:

H { x X : f ( x ) = a } {\displaystyle H\doteq \left\{x\in X:f(x)=a\right\}}

si dice iperpiano in X {\displaystyle X} di equazione f = a {\displaystyle f=a} . Dati due sottoinsiemi A , B {\displaystyle A,B} di X {\displaystyle X} non vuoti e disgiunti, si dice che l'iperpiano H {\displaystyle H} separa A {\displaystyle A} e B {\displaystyle B} se risulta:

f ( x ) a   x A {\displaystyle f(x)\leq a\qquad \forall \ x\in A}

e:

f ( x ) a   x B {\displaystyle f(x)\geq a\qquad \forall \ x\in B}

Si dice che l'iperpiano H {\displaystyle H} separa A {\displaystyle A} e B {\displaystyle B} in senso stretto se esiste un numero ε > 0 {\displaystyle \varepsilon >0} tale che:

f ( x ) a ε   x A {\displaystyle f(x)\leq a-\varepsilon \qquad \forall \ x\in A}

e:

f ( x ) a + ε   x B {\displaystyle f(x)\geq a+\varepsilon \qquad \forall \ x\in B}

Valgono quindi i seguenti corollari del teorema di Hahn-Banach.

Prima forma geometrica del teorema di Hahn-Banach

Siano X {\displaystyle X} uno spazio vettoriale normato su R {\displaystyle \mathbb {R} } , A , B {\displaystyle A,B} due sottoinsiemi non vuoti, convessi e disgiunti di X {\displaystyle X} e si supponga che almeno uno di essi sia aperto. Allora esiste un iperpiano di equazione f = a {\displaystyle f=a} che separa A {\displaystyle A} e B {\displaystyle B} .

Seconda forma geometrica del teorema di Hahn-Banach

Siano X {\displaystyle X} uno spazio vettoriale normato su R {\displaystyle \mathbb {R} } , A , B {\displaystyle A,B} due sottoinsiemi chiusi non vuoti, convessi e disgiunti di X {\displaystyle X} e si supponga che almeno uno di essi sia compatto. Allora esiste un iperpiano di equazione f = a {\displaystyle f=a} che separa A {\displaystyle A} e B {\displaystyle B} in senso stretto.

Note

  1. ^ W. Rudin, Pag. 105.
  2. ^ Reed, Simon, Pag. 75.

Bibliografia

  • (EN) Walter Rudin, Real and Complex Analysis, Mladinska Knjiga, McGraw-Hill, 1970, ISBN 0-07-054234-1.
  • (EN) Michael Reed, Barry Simon, Methods of Modern Mathematical Physics, Vol. 1: Functional Analysis, 2ª ed., San Diego, California, Academic press inc., 1980, ISBN 0-12-585050-6.
  • (EN) Lawrence Narici, Edward Beckenstein, The Hahn–Banach Theorem: The Life and Times, Topology and its Applications, Volume 77, 2ª edizione (3 giugno 1997) Pagine 193-211. È disponibile un preprint in linea qui

Voci correlate

Collegamenti esterni

  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica