Fonction B-différentiable

En analyse mathématique, la B-différentiabilité est un concept de différentiabiité plus faible que celui de Fréchet, dans lequel l'opérateur dérivée n'est pas requis d'être linéaire et borné, mais seulement positivement homogène et borné. La lettre B fait référence à Bouligand. Cet affaiblissement important de la définition permet toutefois de préserver des propriétés importantes, telles que la B-différentiabilité en chaîne et la formule des accroissements finis. Contrairement à la Fréchet-différentiabilité, la B-différentiabilité n'est pas détruite par la prise du minimum ou du maximum d'un nombre fini de fonctions, ce qui est un atout dans certaines circonstances.

Cette notion est, par exemple, utilisée pour définir et interpréter des algorithmes de recherche de zéro de fonctions non différentiables dans un sens classique et en démontrer des propriétés de convergence. Il en est ainsi de certains algorithmes newtoniens en optimisation avec contraintes et en complémentarité.

Définition

Soient E {\displaystyle \mathbb {E} } et F {\displaystyle \mathbb {F} } deux espaces normés, dont les normes sont toutes deux notées {\displaystyle \|\cdot \|} .

B-différentiabilité — On dit qu'une fonction f : E F {\displaystyle f:\mathbb {E} \to \mathbb {F} } est B-différentiable en x E {\displaystyle x\in \mathbb {E} } , s'il existe un opérateur B f ( x ) : E F {\displaystyle Bf(x):\mathbb {E} \to \mathbb {F} } positivement homogène (de degré un) et borné, tel que

f ( x + h ) f ( x ) B f ( x ) h = o ( h ) . {\displaystyle f(x+h)-f(x)-Bf(x)\cdot h=o(h).}

L'opérateur B f ( x ) {\displaystyle Bf(x)} , nécessairement unique, est appelé la B-dérivée de f {\displaystyle f} en x {\displaystyle x} .

On dit que f : E F {\displaystyle f:\mathbb {E} \to \mathbb {F} } est B-différentiable sur un ouvert Ω E {\displaystyle \Omega \in \mathbb {E} } si f {\displaystyle f} est B-différentiable en tout point de Ω {\displaystyle \Omega } .

Cette définition requiert quelques éclaircissements et commentaires.

  • La notion de B-différentiabilité a été introduite par Robinson (1987)[1]. La lettre B fait référence à Georges Bouligand.
  • On dit qu'une fonction H : E F {\displaystyle H:\mathbb {E} \to \mathbb {F} } est positivement homogène (de degré un) si, quel que soit x E {\displaystyle x\in \mathbb {E} } et le réel t 0 {\displaystyle t\geqslant 0} , on a H ( t x ) = t H ( x ) {\displaystyle H(tx)=t\,H(x)} . Alors H ( 0 ) = 0 {\displaystyle H(0)=0} , clairement.
  • Un opérateur positivement homogène H : E F {\displaystyle H:\mathbb {E} \to \mathbb {F} } est dit borné si sa norme H {\displaystyle \|H\|} , définie ci-dessous, est finie :

    H := sup x 1 H ( x ) . {\displaystyle \|H\|:=\sup _{\|x\|\leqslant 1}\,\|H(x)\|.}

    Comme pour les opérateurs linéaires, il revient au même de dire que H {\displaystyle H} est continu en zéro.
  • On a noté B f ( x ) h F {\displaystyle Bf(x)\cdot h\in \mathbb {F} } la valeur de B f ( x ) {\displaystyle Bf(x)} en h E {\displaystyle h\in \mathbb {E} } .
  • On dit qu'une fonction φ : E F {\displaystyle \varphi :\mathbb {E} \to \mathbb {F} } est un petit o de h E {\displaystyle h\in \mathbb {E} } en zéro et on écrit φ ( h ) = o ( h ) {\displaystyle \varphi (h)=o(h)} si

    lim h 0 h 0 φ ( h ) h = 0. {\displaystyle \lim _{\scriptstyle h\to 0 \atop \scriptstyle h\neq 0}\;{\frac {\|\varphi (h)\|}{\|h\|}}=0.}

Exemples

  1. La fonction minimum composante par composante

    μ : R n × R n R n : ( x , y ) min ( x , y ) , avec [ min ( x , y ) ] i = min ( x i , y i ) {\displaystyle \mu :\mathbb {R} ^{n}\times \mathbb {R} ^{n}\to \mathbb {R} ^{n}:(x,y)\mapsto \min(x,y),\quad {\mbox{avec}}\quad [\min(x,y)]_{i}=\min(x_{i},y_{i})}

    est partout B-différentiable et sa B-dérivée est donnée par

    [ B μ ( x , y ) ( h , k ) ] i = { h i si   x i < y i min ( h i , k i ) si   x i = y i k i si   x i > y i . {\displaystyle {\bigl [}B\mu (x,y)\cdot (h,k){\bigr ]}_{i}=\left\{{\begin{array}{ll}h_{i}&{\mbox{si}}~x_{i}<y_{i}\\\min(h_{i},k_{i})&{\mbox{si}}~x_{i}=y_{i}\\k_{i}&{\mbox{si}}~x_{i}>y_{i}.\end{array}}\right.}

    On a un résultat analogue pour la fonction ( x , y ) max ( x , y ) = min ( x , y ) {\displaystyle (x,y)\mapsto \max(x,y)=-\min(-x,-y)} .
  2. Si on compose μ {\displaystyle \mu } avec deux fonctions f : R n R m {\displaystyle f:\mathbb {R} ^{n}\to \mathbb {R} ^{m}} et g : R n R m {\displaystyle g:\mathbb {R} ^{n}\to \mathbb {R} ^{m}} B-dérivables en x R n {\displaystyle x\in \mathbb {R} ^{n}} , on obtient une fonction

    φ : R n R m : x min ( f ( x ) , g ( x ) ) , {\displaystyle \varphi :\mathbb {R} ^{n}\to \mathbb {R} ^{m}:x\mapsto \min(f(x),g(x)),}

    qui est aussi B-dérivable en x {\displaystyle x} et dont la B-dérivée est donnée par

    [ B φ ( x ) ( h ) ] i = { [ B f ( x ) h ] i si   [ f ( x ) ] i < [ g ( x ) ] i min ( [ B f ( x ) h ] i , [ B g ( x ) h ] i ) si   [ f ( x ) ] i = [ g ( x ) ] i [ B g ( x ) h ] i si   [ f ( x ) ] i > [ g ( x ) ] i . {\displaystyle {\bigl [}B\varphi (x)\cdot (h){\bigr ]}_{i}=\left\{{\begin{array}{ll}[Bf(x)\cdot h]_{i}&{\mbox{si}}~[f(x)]_{i}<[g(x)]_{i}\\\min([Bf(x)\cdot h]_{i},[Bg(x)\cdot h]_{i})&{\mbox{si}}~[f(x)]_{i}=[g(x)]_{i}\\{}[Bg(x)\cdot h]_{i}&{\mbox{si}}~[f(x)]_{i}>[g(x)]_{i}.\end{array}}\right.}

    On a un résultat analogue pour la fonction x max ( f ( x ) , g ( x ) ) = min ( f ( x ) , g ( x ) ) {\displaystyle x\mapsto \max(f(x),g(x))=-\min(-f(x),-g(x))} .

Propriétés

Propriétés immédiates

  • Si f {\displaystyle f} est B-différentiable en x {\displaystyle x} , sa B-dérivée est unique.
  • L'ensemble des fonctions B-différentiables en x E {\displaystyle x\in \mathbb {E} } est un espace vectoriel et on a

    α 1 , α 2 R : B ( α 1 f 1 + α 2 f 2 ) ( x ) = α 1 B f 1 ( x ) + α 2 B f 2 ( x ) . {\displaystyle \forall \,\alpha _{1},\alpha _{2}\in \mathbb {R} :\qquad B(\alpha _{1}f_{1}+\alpha _{2}f_{2})(x)=\alpha _{1}Bf_{1}(x)+\alpha _{2}Bf_{2}(x).}

Liens avec d'autres concepts de différentiabilité

Les liens avec la différentiabilité au sens de Fréchet sont clairs. Ci-dessous, on note f ( x ) {\displaystyle f'(x)} la dérivée au sens de Fréchet.

Liens avec la Fréchet différentiabilité — 

  • Si f {\displaystyle f} est Fréchet différentiable en x {\displaystyle x} , alors f {\displaystyle f} est B-différentiable en x {\displaystyle x} et B f ( x ) = f ( x ) {\displaystyle Bf(x)=f'(x)} .
  • Si f {\displaystyle f} est B-différentiable en x {\displaystyle x} et si B f ( x ) {\displaystyle Bf(x)} est linéaire, alors f {\displaystyle f} est Fréchet différentiable en x {\displaystyle x} et f ( x ) = B f ( x ) {\displaystyle f'(x)=Bf(x)} .

Voici quelques liens avec la différentiabilité directionnelle (au sens de Dini). On note f ( x ; h ) {\displaystyle f'(x;h)} la dérivée directionnelle (au sens de Dini) en x E {\displaystyle x\in \mathbb {E} } dans la direction h E {\displaystyle h\in \mathbb {E} } . Si le fait qu'une fonction B-différentiable admette des dérivées directionnelles est clair, la réciproque, pour des fonctions localement lipschiziennes, l'est moins ; ce dernier résultat est dû à Shapiro (1990)[2].

Liens avec la différentiabilité directionnelle au sens de Dini — 

  • Si f {\displaystyle f} est B-différentiable en x {\displaystyle x} , alors f {\displaystyle f} admet des dérivées directionnelles (au sens de Dini) en x E {\displaystyle x\in \mathbb {E} } suivant toute direction h E {\displaystyle h\in \mathbb {E} } et f ( x ; h ) = B f ( x ) h {\displaystyle f'(x;h)=Bf(x)h} .
  • Si f {\displaystyle f} est lipschitzienne dans un voisinage de x {\displaystyle x} et si f {\displaystyle f} admet des dérivées directionnelles en x {\displaystyle x} suivant toute direction, alors f {\displaystyle f} est B-différentiable en x {\displaystyle x} .

En résumé, pour les fonctions localement lipschitziennes, la notion de B-différentiabilité est la même que celle de différentiabilité directionnelle (au sens de Dini).

Régularité de la B-dérivée

La lipschitzianité locale éventuelle de f {\displaystyle f} se transmet à sa B-dérivée.

Lipschitzianité de la B-dérivée — Si f {\displaystyle f} est lipschitzienne de module L {\displaystyle L} dans un voisinage de x {\displaystyle x} et B-différentiable en x {\displaystyle x} , alors B f ( x ) {\displaystyle Bf(x)} est lipschitzienne de module L {\displaystyle L} .

Mais en général, x B f ( x ) {\displaystyle x\mapsto Bf(x)} n'est pas lipschitzienne dans un voisinage de x {\displaystyle x} , ni même continue. Par exemple, si f : R R {\displaystyle f:\mathbb {R} \to \mathbb {R} } est définie par

f ( x ) = x + := max ( 0 , x ) , {\displaystyle f(x)=x^{+}:=\max(0,x),}

on a B f ( 0 ) h = h + {\displaystyle Bf(0)h=h^{+}} , si bien que B f ( 0 ) = 1 {\displaystyle \|Bf(0)\|=1} , alors que B f ( x ) = 0 {\displaystyle Bf(x)=0} pour x < 0 {\displaystyle x<0} .

B-dérivation en chaîne

Le succès de la B-dérivée doit beaucoup à sa stabilité par rapport à la composition de fonctions[1].

B-différentiabilité d'une composition — Soient E {\displaystyle \mathbb {E} } , F {\displaystyle \mathbb {F} } et G {\displaystyle \mathbb {G} } trois espaces normés. Si

  • f : E F {\displaystyle f:\mathbb {E} \to \mathbb {F} } est B-différentiable en x {\displaystyle x} ,
  • g : F G {\displaystyle g:\mathbb {F} \to \mathbb {G} } est B-différentiable en f ( x ) {\displaystyle f(x)} et lipschitzienne dans un voisinage de f ( x ) {\displaystyle f(x)} ,

alors la fonction composée ( g f ) {\displaystyle (g\circ f)} est B-différentiable en x {\displaystyle x} et sa B-différentielle est donnée par

B ( g f ) ( x ) = B g ( f ( x ) ) B f ( x ) . {\displaystyle B(g\circ f)(x)=Bg(f(x))\circ Bf(x).}

Formule des accroissements finis

Le résultat suivant est dû à Pang (1990)[3].

Formule des accroissements finis — Si

  • x {\displaystyle x} , y E {\displaystyle y\in \mathbb {E} } et [ x , y ] := { ( 1 t ) x + t y : 0 t 1 } {\displaystyle [x,y]:=\{(1-t)x+ty:0\leqslant t\leqslant 1\}} ,
  • f : E F {\displaystyle f:\mathbb {E} \to \mathbb {F} } est lipschitzienne dans un voisinage de [ x , y ] {\displaystyle [x,y]} et B-différentiable sur [ x , y ] {\displaystyle [x,y]} ,
  • H : E F {\displaystyle H:\mathbb {E} \to \mathbb {F} } est positivement homogène de degré 1 et borné,

alors

f ( y ) f ( x ) H ( y x ) sup z [ x , y ] ( B f ( z ) H ) ( y x ) . {\displaystyle \|f(y)-f(x)-H(y-x)\|\leqslant \sup _{z\in [x,y]}\|(Bf(z)-H)(y-x)\|.}

En prenant H = 0 {\displaystyle H=0} , on obtient la formule des accroissements finis

f ( y ) f ( x ) sup z [ x , y ] B f ( z ) ( y x ) . {\displaystyle \|f(y)-f(x)\|\leqslant \sup _{z\in [x,y]}\|Bf(z)(y-x)\|.}

Continue et forte B-différentiabilités

Définitions

Voici les définitions de continue et forte B-différentiabilités.

Continue B-différentiabilité — On dit que f : E F {\displaystyle f:\mathbb {E} \to \mathbb {F} } est continûment B-différentiable en x E {\displaystyle x\in \mathbb {E} } si elle est B-différentiable dans un voisinage Ω {\displaystyle \Omega } de x {\displaystyle x} et si B f {\displaystyle Bf} est continue comme application de Ω {\displaystyle \Omega } dans l'espace vectoriel normé des opérateurs positivement homogènes de degré 1 bornés.

On dit que f : E F {\displaystyle f:\mathbb {E} \to \mathbb {F} } est continûment B-différentiable sur une partie P E {\displaystyle P\subset \mathbb {E} } si elle est continûment B-différentiable en tout point de P {\displaystyle P} .

Forte B-différentiabilité — On dit que f : E F {\displaystyle f:\mathbb {E} \to \mathbb {F} } est fortement B-différentiable en x E {\displaystyle x\in \mathbb {E} } si elle est B-différentiable en x {\displaystyle x} et si

lim ( y 1 , y 2 ) ( x , x ) y 1 y 2 f ( y 2 ) f ( y 1 ) B f ( x ) ( y 2 y 1 ) y 2 y 1 = 0. {\displaystyle \lim _{\scriptstyle (y_{1},y_{2})\to (x,x) \atop \scriptstyle y_{1}\not =y_{2}}\,{\frac {f(y_{2})-f(y_{1})-Bf(x)(y_{2}-y_{1})}{\|y_{2}-y_{1}\|}}=0.}

Rappelons la définition analogue de la forte Fréchet différentiabilité.

Forte Fréchet différentiabilité — On dit que f : E F {\displaystyle f:\mathbb {E} \to \mathbb {F} } est fortement Fréchet différentiable en x {\displaystyle x} si elle est Fréchet différentiable en x {\displaystyle x} et si

lim ( y 1 , y 2 ) ( x , x ) y 1 y 2 f ( y 2 ) f ( y 1 ) f ( x ) ( y 2 y 1 ) y 2 y 1 = 0. {\displaystyle \lim _{\scriptstyle (y_{1},y_{2})\to (x,x) \atop \scriptstyle y_{1}\not =y_{2}}\,{\frac {f(y_{2})-f(y_{1})-f'(x)(y_{2}-y_{1})}{\|y_{2}-y_{1}\|}}=0.}

Cette dernière notion de forte Fréchet différentiabilité en un point ne se diffuse pas : en particulier on peut avoir une fonction B-différentiable qui soit fortement Fréchet différentiable en un pont x {\displaystyle x} mais pas en des points arbitrairement proches de x {\displaystyle x} [3].

Propriétés

Les notions de forte B-différentiabilité et de forte Fréchet différentiabilité sont en réalité équivalentes.

Équivalence entre forte B-différentiabilité et forte Fréchet différentiabilité — Une fonction f {\displaystyle f} est fortement B-différentiable en x {\displaystyle x} si, et seulement si, elle est fortement Fréchet différentiable en x {\displaystyle x} .

Si f {\displaystyle f} est B-différentiable dans un voisinage de x {\displaystyle x} , cette notion est très proche de la continue B-différentiabilité[3].

Continue et forte B-différentiabilité — Si f {\displaystyle f} est B-différentiable dans un voisinage de x {\displaystyle x} , alors les propositions suivantes sont équivalentes :

  1. f {\displaystyle f} est fortement B-différentiable en x {\displaystyle x} ,
  2. f {\displaystyle f} est lipschitzienne dans un voisinage de x {\displaystyle x} et B f {\displaystyle Bf} est continue en x {\displaystyle x} .

Annexes

Notes

  1. a et b (en) S.M. Robinson (1987). Local structure of feasible sets in nonlinear programming, part III: stability and sensitivity. Mathematical Programming Study, 30, 45-66.
  2. (en) A. Shapiro (1990). On concepts of directional differentiability. Journal of Optimization Theory and Applications, 66, 477–487.
  3. a b et c (en) J.-S. Pang (1990). Newton’s method for B-differentiable equations. Mathematics of Operations Research, 15, 311–341.

Articles connexes

  • icône décorative Portail de l'analyse