Gradiente
Consideriamo la funzione R^2 -> R:
Grafico e curve di livello in [-6,6]×[-5,5]×[-2,2]:
Ottengo tutto con WolframAlpha introducendo: plot z=-6*x/(2+x^2+y^2), -6<=x<=6, -5<=y<=5
Gradiente di f:
è la funzione vettoriale che ha come componenti le due derivate parziali di f,
indicata con
∇f(x,y) = (∂f(x,y)/∂x, ∂f(x,y)/∂y).
Nel nostro caso:
In (√2,0) il gradiente, ossia le due derivate parziali si annullano. Lo stesso accade in (-√2,0). Questi sono i due punti di estremo (minimo e massimo). La cosa e' in accordo con le stime grafiche fattibili osservando le curve di livello.
Ottengo tutto con WolframAlpha introducendo: grad ( -6*x/(2+x^2+y^2) )
Nota. Nel nostro caso, invece di ∇f(x,y), avremmo anche potuto
scrivere
Il gradiente del campo scalare f (CAMPO scalare/vettoriale: grandezza scalare/vettoriale che dipende dalla posizione; nel nostro caso f(x,y) che dipende da (x,y)) e' il vettore (orizzontale) che indica la direzione in cui cresce piu' rapidamente f. Il suo modulo rappresenta la velocita' di questo aumento, ovvero la pendenza (positiva) della superficie lungo tale direzione. [nel caso "univariato" il gradiente corrisponde alla derivata, il suo modulo è il valore assoluto della pendenza del grafico, il segno della pendenza è il segno della derivata] Il gradiente (se diverso da 0) è perpendicolare alla curva di livello passante per (x,y). Le componenti del gradiente indicano la rapidita' della variazione nelle direzioni degli assi x e y. Le altre derivate direzionali (ossia le proiezioni del gradiente nelle altre direzioni) si trovano facendo i prodotti scalari del gradiente per i versori delle varie direzioni. La direzione di una curva di livello passante per un punto P indica la direzione lungo cui il gradiente si annulla. |
|
Come nel caso di una funzione in una variabile il fatto che la sua derivata in x sia nulla non e' sufficiente per
dedurre che in x vi sia un max o un min relativo (potrebbe esservi un flesso), cosi' nel caso di una funzione di due
variabili non basta che il gradiente in P sia nullo (ossia che P sia un punto stazionario) affinche' in P vi sia un estremo relativo.
Nel caso dell'esempio precedente per |
Un'altra funzione:
f:=(x,y) -> sin(x)*sin(y).
[a destra le curve di livello alle quote 0.9, 0.7, 0.5 (in blu), -0.9, -0.7, -0.5
(in rosso), 0 (in verde)]
Ottengo tutto con WolframAlpha introducendo: plot z=sin(x)*sin(y), -5<=x<=5, -5<=y<=5
Dove si azzera il gradiente,
In questo caso dal grafico capiamo che (0,0) [e gli altri punti che si ottengono "aggiungendo periodi"] non e' di max ne' di min (e' un punto di sella: è di minimo lungo la "cresta dei monti" e di massimo lungo la "starda del valico"), che (π/2,π/2) e il suo simmetrico rispetto (0,0) sono di max e che (-π/2,π/2) e il suo simmetrico rispetto a (0,0) sono di min. Nei punti di sella le curve di livello si intersecano; avvicinandosi a quelli di min/max tendono a ridursi ad un punto. Come si potrebbe procedere senza grafico?
Polinomio di Taylor
È utile approfondire qualche analogia col caso univariato (funzioni di una variabile).
Con Fissato x0, Nel caso bivariato, posto P0 = (x0, y0), |
|
Il termine ∇f(P) · (ΔP), che
rappresenta l'approssimazione della variazione della funzione f al variare di P di ΔP
che si ottiene considerando, invece di f, la funzione che ha per grafico il piano tangente in P,
viene chiamato il differenziale (totale) di f(x,y) e indicato |
Nel caso univariato, si può approssimare f invece che con una funzione lineare
con una funzione polinomiale di grado superiore. Queste approssimazioni si basano sul
concetto di polinomio di Taylor:
Δf = d f + d2f / 2 + d3f / 3!
+
dove d n f(x) =
Ricordiamo che:
− dxn
sta per (dx)n
− dx risulta essere uguale a Δx
−
−
Nel caso di f(x) = sin(x), df(x) = A lato sono rappresentate graficamente, oltre a f, sia l'approssimazione attorno a π/2 si ordine 1 (che coincide con quella di ordine 0 essendo |
|
Se Invece che ricorre all'esame di y = f(π/2)+ se f '(π/2)=0 e f "(π/2)>0, in π/2 si ha tangenza orizzontale con concavità verso il basso, se f '(π/2)=0 e f "(π/2)<0 in π/2 si ha tangenza orizzontale con concavità verso l'alto, se f '(π/2)=0, f "(π/2)=0 e se f '(π/2)=0, f "(π/2)=0, |
Nel caso bivariato, si può procedere in modo simile, tenendo conto che nel polinomio di Taylor
Δf = d f + d2f / 2 + d3f / 3!
+
− d f(x,y) = ∇f(P) · (ΔP) =
f 'x (x,y) Δx
+ f 'y (x,y) Δy
− d 2 f(x,y) =
d (d f(x,y) ) =
∇(f 'x (x,y) Δx
+ f 'y (x,y) Δy)
· (ΔP) =
f "xx (x,y) Δx Δx
+ f "xy (x,y) Δy Δx
+ f "yx (x,y) Δx Δy
+ f "yy (x,y) Δy Δy
=
f "xx (x,y) (Δx)2
+ 2 f "xy (x,y) Δx Δy
+ f "yy (x,y) (Δy)2
− d 3 f(x,y) =
Vediamo ad es. il comportamento di f(x,y) = sin(x) sin(y), già
considerata sopra, attorno a
d f(x,y) = cos(x)sin(y)Δx +sin(x)cos(y)Δy
f(x,y) = f(π/2,π/2) + cos(π/2)sin(π/2)Δx +sin(π/2)cos(π/2)Δy + ... = 1 + ...
d 2 f(x,y) =
− sin(x)sin(y)(Δx)2 + 2 cos(x)cos(y)Δx Δy
− sin(x)sin(y)(Δy)2
f(x,y) = 1 + (− sin(π/2)sin(π/2)(Δx)2 + 2 cos(π/2)cos(π/2)Δx Δy
− sin(π/2)sin(π/2)(Δy)2)/2 + ... =
1 −
Sotto sono rappresentate, attorno a (π/2, π/2), sia f che le funzioni polinomiali
corrispondenti ai polinomi di Taylor di ordini 1 e 2. Dal fatto che la seconda ha grafico con la concavità
verso il basso si può dedurre (omettiamo i dettagli della dimostrazione) che in
Attorno a (0,0), invece:
f(x,y) = f(0,0) + cos(0)sin(0)Δx + sin(0)cos(0)Δy + ...
= 0 + 0(x − 0) + 0(y − 0) + ... = 0 + ...
f(x,y) = 0 + (− sin(0)sin(0)(Δx)2 + 2 cos(0)cos(0)Δx Δy
− sin(0)sin(0)(Δy)2)/2 + ... =
x y + ...
z = 0 è tangente a z = f(x,y) in (0,0) ma la funzione polinomiale di 2°
grado che approssima f ha grafico (z = xy) che attorno al punto ha punti sia sopra che sotto al piano
tangente, per cui
Cerchiamo un modo rapido, analogo allo studio del segno della derivata seconda nel caso univariato,
per stabilire, di fronte a un punto P0 in cui il gradiente sia nullo,
se esso sia un punto di estremo.
Il suo grafico è una superficie simmetrica rispetto alla retta verticale passante per P0 (se cambio
segno a x-x0 e y-y0 ottengo un termine equivalente),
per cui le sue curve di livello (che corrispondono a eq. polinomiali di grado 2), a quote diverse da
Per stabilire il tipo di conica semplifichiamo la scrittura prendendo un sistema di riferimento X,Y,Z centrato in P0
in modo da descrivere la superficie con
Se vi è un asintoto con pendenza p, per X → ∞ o per X → -∞
lungo la curva Y/X tende a p; divido quindi per X2 e suppongo
che Y/X tenda a p; l'equazione diventa
− Se il discriminante
− se il discriminante è nullo le curve di livello sono coppie di rette: non possiamo decidere;
− se il discriminante è negativo le curve di livello sono ellissi,
e il punto è di estremo relativo;
− in tal caso, per decidere se le curve di livello stanno sopra o sotto al piano tangente basta vedere
quanto vale Z in un punto qualunque diverso da (0,0); prendo (1,0), in cui
Rivediamo f(x,y) = sin(x) sin(y).
Matrice Hessiana
Il discriminante
f "xy (x,y)2 − f "yy (x,y) f "xx (x,y)
può essere espresso in forma compatta come l'opposto del determinante della
matrice Hessiana così definita:
| = |
Si noti che la matrice è simmetrica (ossia è uguale alla sua trasposta) in quanto
Dunque, in un punto P in cui il gradiente è nullo (e in un intorno del quale il campo abbia derivate
seconde continue)
se il determinante di
Nel caso di f(x,y) = sin(x) sin(y) la matrice Hessiana è
e il suo determinante è:
Con WolframAlpha introduco: Hessian of sin(x)*sin(y)
Per ricordarsi la casistica, si può pensare alle due funzioni | ||
| ||
|
Campi scalari di 3 o più variabili
Abbiamo visto che d f(x,y) e più in generale
d f(P), con P =
La matrice Hessiana consente di scrivere
in forma compatta anche
Questa osservazione ci consente di utilizzare, per lo studio dei punti di estremo,
le proprietà delle forme quadratiche (vedi).
La cosa vale, più in generale, per
Anche per n > 2 la matrice Hessiana è simmetrica
(le derivate miste Di j e Dj i, se continue, come stiamo ipotizzando, coincidono).
Se (in un intorno di P in cui il gradiente si annulla) la matrice Hessiana ha autovalori positivi
la forma quadratica corrispondente, ossia
Analogamente, se la matrice Hessiana ha autovalori negativi
si ha un punto di massimo.
Se ha autovalori sia positivi che negativi, si ha un punto di sella.
Se gli autovalori sono tutti nulli, non si può concludere nulla. Occorrerebbe procedere
considerando
Nel caso di f(x,y) = sin(x) sin(y) la matrice Hessiana per (x,y) =
Esercizio. Determinare e classificare i punti critici di
Appendice
Sotto sono rappresentate graficamente una funzione di (x,y) e il suo polionomio di Taylor di ordine 2
in
Vedi qui per il calcoli con R.