Try   HackMD

OCVX: hyperplan d'appui

Rappels

  • Hyperplan d'appui a une partie
    A
    de
    Rn
    en un point
    pA
    , est un hyperplan affine de
    Rn
    qui laisse
    A
    dans un des deux demi-espaces definis par
    H

Etant donne un vecteur normal

ν definissant
HRn
et
p
un point dans
HA
on a

xA;<ν,xp>≤0

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

  • On a definit par ailleurs la notion de gradient d'une fonction differentiable
    f:RnR
    en un point
    a
    , determinee par la relation:

h assez petitf(a+b)=f(a)+f(a)Th+ε(h)hε(h)0h0

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Plan du cours

Objectif d'aujourd'hui

  1. Etendre la notion de droite tangente au graphe d'une fonction
    f:RR
    1. Au cas des fonctions
      ϕ:RnR
    2. au cas des parties de
      Rn
      decrites comme courbes de niveaux de fonctions
  2. Utiliser le point 1. pour obtenir une lieuristique, permettant de construire des methodes iteratives d'optimisation
  1. Revoir la notion de droite tangente dans le cas
    R
    (une dimension)
    • f:RR
    • Graphe
  2. On va definir une maniere de generaliser la notion de droite tangente
    • f:RR
    • Graphe
  3. On adapte cette definition au cas de courbes de niveaux
    • g:R2R
    • zeros de
      g
      (courbes de niveau de
      g
      )
  4. Conclusion pour le cas general
    • ϕ:RnR

Espace tangent

Le gradient en dimension 1 correspond a la notion de derivee, qui permet de definir la notion de droite tangente au graphe d'une fonction en un point. Dans ce contexte, l'interpretation geometrique de la notion de gradient est connue. En particulier le fait que vous soyez croissants ou decroissant vous est donne par le signe de votre gradient; cela vous permet de savoir dans quelle direction aller si vous cherchez des points ou votre fonction a des plus petite ou plus grandes valeurs.

Que signifie un nombre positif ou negatif pour un vecteur de

R ?
Si on est positif (resp. negatif), on est dans la moitie positive(resp. negative) de notre droite reelle.

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Q:minxRf(x)

On cherche a minimiser la fonction
f

Dans ce dessin, le signe de la derivee vous dit que si vous voulez chercher des points

x avec
f(x)f(a)
, il faut aller dans le sens oppose a
f(a)
.

La droite

Df,p est derivee parametriquement par

RλR2t(a+t,f(a)t+f(a))\colorgreen=(a,f(a))+t(1,f(a))\colorred=P

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

On est en train de dire que

Df,p est la droite passant par
p
, de direction
Vect((1,f(a)))

Cette notion de droite tangente ne semble pas, telle quelle, facilement generalisable au cas de fonctions de

RnR

Definition
Soit

A une partie de
Rn
, soit
pA
. On appelle
\colorredgerme d'une courbe (derivable) γ:]ε,ε[ε>0A tel que γ(0)=p
, la derivee de
γ
en
0

Cela correspond au vecteur vitesse en

p d'un point materiel passant par
p
a l'instant 0, si
γ
decrit la position de ce point en fonction du temps
t
.

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

L'ensemble des germes de courbes en

p definit un sous-espace vectoriel de
Rn
.
\colororangeOn le note TA,p, il s'appelle espace tangent a A en p
.

Que donne

\colororangeTA,p dans le cas du graphe de
f
?

Si

A est
Γf
(graphe de
f
) toute courbe passant par
p
γ:]ε,ε[Γf
est de la forme:

γ(t)=(ψ(t),f(ψ(t)))\colororangeψ(t),ϕ(t)pour ψ:]ε,ε[R
avec
ψ(0)=a

Si

γ est derivable en 0:

γ(0)=(ψ(0),ψ(0)f(a))=ψ(0)(1,f(a))

γ(0)Vect((1,f(a)))TA,pVect((1,f(a)))

Conclusion

TA,p=Vect((1,f(a)))

autrement dit:

Df,p=p+TA,p

Definition
Etant donne une partie

ARn et
pA
, on appelle espace tangent a
A
en
p
l'espace vectoriel
TA,p
compose des germes de courbes dans
A
passant par
p
.

Remarque: Geometriquement, on represente souvent

p+TA,p et non
TA,p

Notre prochaine etape est de reinterpreter

p+TA,p de maniere implicite de facon a faire apparaitre la notion de gradient d'une fonction
RnR
.

On a

Df,p:(a,f(a))+t(1,f(a)) pour
tR
.

Comment obtenir une ecriture implicite de

Df,p ?
Si
(x,y)Df,p
alors

{x=a+ty=f(a)+f(a)tf(a)(xa)=yf(a)

Questions

  1. Comment ecrit-on
    Γf
    comme zeros d'une fonction ?
  2. Quel est le gradient de cette fonction au point
    p
    ?
  3. Quel est
    de ce gradient au point
    p
    ?

Premiere question

Γf est zeros de la fonction:

ϕ:R2R(x,y)f(x)yz(ϕ)={(x,y)|f(x)y=0}={(x,y)|f(x)=y}={(x,f(x))|xR}=Γf

Deuxieme question

ϕ((a,f(a)))=(ϕx(a,f(a))ϕy(a,f(a)))=(f(a)1)ϕ(x,y)=f(x)y

Ce qui genere notre droite tangente c'est

(1,f(a)) et on a obtenu le vecteur
(f(a),1)
.

On a obtenu un vecteur orthogonal a notre droite tangente

Troisieme question

L'orthogonal a

ϕ(p) au point
p
:

ϕ(p)T(xayf(a))=(f(a)1)(xayf(a))=f(a)(xa)(yf(a))

ϕ(p):f(a)(xa)=yf(a) (
passant par
p
)

"Vectorialise":

f(a)x=yϕ(p)T(xy)=0

ϕ(p) nous donne
TΓf,p
, Autrement dit:

Df,p:p+ϕ(p)\colororangeTΓf,p

Prop
Soit

f:RnR une fonction differentiable en un point
pCf,r
. L'espace tangent a
Cf,r
au point
p
est donne par l'hyperplan orthogonal (
) a
f(p)
.

Question: Calculer l'espace tangent au point
(1,1)
de
Cf,r
pour
f:R2R(x,y)x2+y2

f(x,y)=(2x2y);f(1,1)T(xy)=02x+2y=0x+y=0

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Apport de la convexite

Rappel

Une fonction

f:RnR, differentiable, est convexe si
x,yRn

f(y)f(x)f(x)T(yx)(E)

Hypothese

Hypothese

f:RnR une fonction convexe

Dans ce cas

rR,
Cfr
est convexe
Rn

Ici,

yCf1v,
f(x)T(ya)0
. Donc
x+f(x)
est un hyperplan d'appui a
Cf1v

Convexite:

f(y)f(x)f(x)T(yx)

Donc le demi-espace positif est a exclure si l'on souhaite chercher un point

x+ tel que
f(x+)f(x)

On vient d'eliminier toute une partie de l'espace de nos recherches.

Question: Dans quelle direction chercher ?

Prop
Soit

f:URnR une fonction differentiable. Soit
xCf,r
, si
f(x)0
x+=x+Δx
tel que
f(x)f(x+)
detour, par un deplacement
Δx
a l'oppose de la direction de
f(x)

Remarques

  1. On ne connait pas a priori l'amplitude par laquelle on doit additioner
    f(x)
    a
    x
    , pour obtenir
    x+
  2. Ce resultat est vrai meme si
    f
    n'est pas convexe, on ne garantit plus la recherche d'un minimum global

Question: Il se passe quoi si
f(x)=0
?

Questions des eleves

J'ai pas compris la particule a une vitese constante sur x? Comment on défini la "vitesse"?

Tu images que la courbe gamma représente le déplacement de la particule le long de la courbe A -> gamma(t) = abscisse de la particule le long de la courbe. Avec en t=0, ta particule qui passe par le point p

La vitesse instantanée = dérivée de la position. Vitesse instantanée de la particule en p = dérivée de gamma en 0

Ta particule peut adopter plusieurs profils de vitesse le long de la courbe (accélérer, décélérer, etc), mais elle est contrainte de suivre le profile de la courbe

Donc la valeur du vecteur vitesse gamma'(0) peut effectivement varier selon le profil de vitesse

Mais la direction de ce vecteur vitesse sera toujours la même, et c'est ce qui défini l'espace tangent (en dim 1)

Mais du coup on fait tout ça juste pour trouver un vecteur qui appartient a l'espace tangent?

En fait cette idée est très générale, et indépendante de la dimension de l'espace dans lequel on travaille.
En dim 1, ça peut paraître un peu overkill de faire tout ça "juste" pour avoir la direction de la tangente.
Mais quand on va passer sur des dimensions supérieurs (donc des surfaces, etc), là tu auras plusieurs directions possibles de te balader sur la surface et d'approcher ton point p. Imagine

f(x,y)=x2+y2, donc une surface en forme de bol. En (0,0), tu as plusieurs directions pour approcher (0,0) en restant sur la surface. Pour chacune de ces courbes possibles, tu vas avoir un vecteur vitesse associé. Et c'est l'ensemble de ces vecteurs vitesse (enfin, l'espace généré par ces vecteurs vitesse) qui va définir le plan tangent

J'ai encore du mal à voir en quoi c'est différent d'une différentielle

Il y a effectivement un lien entre les deux notions, mais ce ne sont pas du tout les mêmes objets : une différentielle est une application linéaire, un espace tangent est une sous-partie de ton espace de travail.