Try   HackMD

OCVX : La differentielle (le retour)

La differentielle en TOP-DOWN

La semaine derniere, vous avez cherche a generaliser la notion de derivabilite d'une fonction

ϕ:RR a celle de differentiabilite d'une fonction
f:RnR
.

Le point de vue aborde: on sait deriver le long d'un vecteur

vRn, cad qu'on sait deriver la fonction

tf(ale pt qu'oncherche a deriver+tv)

A partir de la on cherche a construire un objet multidimensional qui va remplacer la derivee dans le cas unidimensionnel.

On sait deriver une fonction de

RR
On sait donc deriver une fonction de
RnR
le long d'un vecteur
v
(en particulier le long des axes).
On regroupe les derivees le long des axes dans un objet qu'on appelle le gradient
Definition de la differentielle en un point

C'est la demarche BOTTOM-UP

Aujourd'hui

On va generaliser la notion de derivabilite d'une fonction de

RR a l'aide des normes sur
Rn

Analyser "l'objet differentiel" qu'on obtient et decrire une partie des proprietes qu'il a
retrouver les derivees partielles comme ecriture en coordonnnees de la differentielle en un point

C'est la demarche TOP-DOWN

Rappel sur
R

Etant donne une fonction

ϕ:RR on dit que
ϕ
est derivable en
aR
si
limhaϕ(a+h)ϕ(a)h
existe. Dans ce cas cette limite est appelee le nombre derivee de
ϕ
en
a
et on le note
ϕ(a)

De maniere equivalente

ϕ est derivable en
a
s'il existe un nombre reel
α
tel que pour
h
assez petit (h proche de 0)

ϕ(a+h)=ϕ(a)+αh+hε(h)ε(h)0h0

Dans ce cas

α est le nombre derivee de
ϕ
en
a
et on le note
ϕ(a)

Dans

R: si
ϕ
est derivable en
a
alors

h assez petitϕ(a+h)=ϕ(a)+ϕ(a)h+hε(h)

Proposition d'extension au cas d'une fonction
f:RnR

f est differentiable en

a si

hRn assez petitη>0 tq hB(0,η)f(a+h)=f(a)+λa(h)lineaire en h+hε(h)ε:RnRε(h)0h0pas lineaire en h

h varie de tel sorte a ce qu'on reste dans la boule
B(0,η)

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Definition: une fonction

f:RnR est differentiable en un point
aRn
s'il existe une application lineaire
λa:RnR
telle que

h assez petit:f(a+h)=f(a)+λa(h)+hε(h)ε(h)0h0\colororange(D1)

On ne precise pas la norme car elles sont equivalentes.

Question: Pour

f donne, combien y a-t-il d'applications lineaires qui satisfait
\colororangeD1
?

Il n'y a qi'une seule, qu'on appelle la differentielle en
a
.

Lemme: Si

λa existe, elle est unique.

Preuve

On suppose qu'il existe 2 applications lineaires

λa et
μa
qui satisfont
\colororange(D1)
, cad

h assez petit:f(a+h)=f(a)+λa(h)+hε1(h)f(a+h)=f(a)+μa(h)+hε2(h)(λaμa)Une app lineaire en hOn va montrer quec'est l'app lineaire nulle(h)=h(ε1(h)ε2(h)ε:RnRε(h)0h0)

On est dans la situation suivante:

hB(0,η) pour η>0ψlineaire(h)=hε(h)ε(h)0h0

Demonstration: Ma
ψ
est nulle

On va prendre un vecteur

vRnv=1, soit
t]η,η[
(donc
tvB(0,η)
)

On a:

ψ(tv)=tvε(tv)tψ(v)=tvε(tv)signe(t)ψ(v)v=ε(tv)

Si on se limite a

t[0,η[, on a
ψ(v)v=ε(tv)

Dans la relation

t[0,η]ψ(v)vconstant=ε(tv)ε(tv)0t0ψ(v)=0

Etant donne un vecteur

vRn,
v=1
,
ψ(v)=0
.
En particulier,
i{1,...,n}
;
ψ(ei)=0

Donc la matrice de
ψ
dans la base canonique est nulle, i.e.
ψ=0

Donc

λa=μa

Definition: On appelle differentielle de

f:RnR au point
a
, l'unique application lineaire (si elle existe) qui satisfait:

\colororangeDabs:f(a+h)=f(a)+Df(a)(h)+hε(h)ε(h)0h0

Dans ce contexte,

Df(a) a une matrice dans la base canonique de taille
(1,n)

Exemple

1.On note

f:RnRhAA est une matrice ligneh+n

f(a+h)=A(a+h)+b=Aa+Ah+b=(Aa+b)+Ah=f(a)+Ahlineaire en h+ohε(h)ε est nul la

D'apres la definition:

Df(a)(h)=AhDf(a):hAh

f:RnRxxTxf(a+h)=(a+h)T(a+h)=aTa+hTa+aTh+hThh2h2=f(a)+2aThlineaire en h+hε(h)

Definition (rappel):

h2+hTh

Remarque:

hTaR,
(hTa)T=hTaaThTT=aTh
car ce sont des reels.

Donc

Df(a):h2aTh

Dans le cas

n=1

f:xx2Df(a):hDf(a)(h)f(a)=2a

Proprietes usuelles

Les proprietes usuelles de derivabilites et de calcul des derivees s'etend au cas des fonctions de

RnR. Soient
f,g:RnR
et
aRn
, on suppose
f,g
differentiable en
a
.

h APf(a+h)=f(a)+Df(a)(h)+hε1(h)g(a+h)=f(a)+Dg(a)(h)+hε2(h)(+):(f+g)(a+h)=(f+g)(a)+(Df(a)+Dg(a)lineaire en h)(h)+h(ε1(h)+ε2(h)ε(h))

D(f+g)(a)=Df(a)+Dg(a)

(×):(fg)(a+h)=(fg)(a)+f(a)Dg(a)(h)+g(a)Df(a)(h)+Df(a)(h)Dg(a)(h)+hε1(h)Dg(a)(h)+hε2(h)Df(a)(h)+h2ε1(h)ε2(h)+h(ε1(h)g(a)+ε2(h)f(a))\colorredD(fg)(a)=f(a)Dg(a)+g(a)Df(a)\colororangeD(fg)(a):hf(a)Dg(a)(h)+g(a)Df(a)(h)

Matrice ligne

La differentielle de

f:RnR en
a
quand elle existe est une matrice ligne: comment en decrire les coeffs ?

Definition(temporaire): Quand

f est differentiable au point
a
on appelle gradient de
f
en
a
le vecteur
v
(colonne)
f(a)
dont la transposee est la marice de
Df(a)
dans les bases canoniques

On a donc: pour tout

h assez petit

f(a+h)=f(a)+f(a)Th+hε(h)ε(h)0h0

On est interesse par calculer

f(a)Tei
i{1,...,n}

Soit

tR

f(a+tei)=f(a)+f(a)T(tei)+teiε(tei)f(a+tei)f(a)=tf(a)Tei+teiε(tei)f(a+tei)f(a)t=f(a)Tei+eiε(tei)t0f(a)Tei=f(a+tei)tt0δeif(a)=δδxif(a)eiε(tei)t00

En prenant la limite on vient de constater (avec la definition temporaire de

f(a)) que
f(a)Tei=δδxif(a)

Cad que la ieme coordonnee de votre gradient c'est la derivee partielle par rapport a

xi

Defintion: Le gradient d'une fonctino

f en un point
aRn
c'est le vecteur
v
des derivees partielles:

f(a)=(δfδxi(a))1in

Les definitions "temporaire" et definitives de gradient ne sont pas equivalentes: on peut admettre des derivees partielles sans etre differentiable

Prop: Si une fonction

f:RnR admet un gradient en un point
a
, et si
xf(x)
est continue au voisinage de
a
, alors
f
est differentiable en
a
, cad qu'on peut ecrire

h assez petitf(a+h)=f(a)+f(a)Th+oa(h)

Remarque: si

f est differentiable en
a
:

δvf(a)\colorredderivee directionnelle de fen a le long de v=f(a)Tv

Derivee d'une composee

Pour parler de composee on va generaliser un petit peu le cadre avec lequel on a travaille jusque la.
On s'interesse donc aux fonctions

f:RnRn

On note

f1,...,fn les fonctions coordonnees de
f
,
f=(f1,...,fn)

Exemple

g:R2R3(x,y)(cos(xy)x2+y2y)g1:R2R(x,y)cos(xy)g2:R2R(x,y)x2+yg3:R2R(x,y)2y

Une fonction

f:RnRm va etre dite differentielle si on a une ecriture:

f(a+h)=f(a)+Df(a)differentielle de fen a,de matricedans les bases canoniquesde taille: (m,n)(h)+hune norme sur Rnε(h)ε:RnRmε(h)0h0

La matrice de

λf(a) dans les bases canoniques est appellee la jacobienne de
f
en
a
.

Jf(a)=(δf1(a)δx1δf1(a)δxnδfm(a)δx1δfm(a)δxn)=(f1(a)Tfm(a)T)=(f1(a),...,fm(a))T

Pour

f:RnRm si on est differentiable en
aRn

On a
h
AP:

f(a+h)=f(a)+Jf(a)h+oa(h)

Question:

Soit

f,g,
f:RnRm
,
g:RmRp
, si
f
et
g
sont differentiable respectivement
f
en
a
et
g
en
b=f(a)
alors

D(gf)(a)=Dg(\colorredf(a))Df(\colorreda)

Matriciellement:

Jgf(a)=Jg(f(a))×Jf(a)