•  Data f derivabile in a; in un suo intorno abbiamo:
f(x) = p(x) + o(x-a)   dove p(x) = f(a) + f '(a)(x-a).
p è la funzione polinomiale di primo grado che in a assume lo stesso valore che assume f e che ivi ha la stessa derivata; ossia ha per grafico la tangente al grafico di f nel punto di ascissa a.  La differenza tra p(x) e f(x) per x → a è un infinitesimo di ordine superiore rispetto a  x-a
   
Avremmo anche potuto scrivere: f(x+Δx) = f(x)+f '(x)Δx + o(Δx) indicando con x invece che con a il punto iniziale e con Δx la variazione.

f '(x)Δx viene indicato df(x) e rappresenta come varierebbe la funzione se proseguisse, tra x e x+Δx, mantenendo un andamento lineare. È un'approssimazione della differenza Δf(x) che effettivamente c'è tra f(x) e f(x+Δx), e viene chiamata differenziale di f in x (rispetto alla variazione Δx).

•  Posso usare questa approssimazione per rapide stime. Ad es. se so che per effetto di una dilatazione termica un dato oggetto sferico aumenta il raggio R da 10 cm a 10.05 cm posso stimare velocemente di quanto cresce il volume V (=4/3πR3):
ΔV =[circa] dV = 4πR2 ΔR, R=10 e ΔR = 0.05;
dV = 4π100·0.05 =[circa] 60 (cm3).

Vediamo come valutare l'errore con cui p(x) approssima f(x):
Errore = Approssimazione-ValoreEsatto = f(a)+f '(a)(x-a) - f(x); so che Errore = o(x-a) per x→a;
vedo se si comporta come (x-a)2; studio il limite per x→a di  Errore/(x-a)2.
Suppongo che f sia derivabile due volte in un intorno di a, o, almeno, che f sia derivabile in un intorno di a e che esista f "(a).  Allora (usando il teo. de l'Hopital) posso ricondurmi a:
(f '(a)-f '(x)) / (2(x-a))  e osservare che per x→a esso tende a -f "(a)/2;
se f "(a)=0 è un infinitesimo di ordine superiore a (x-a)2, altrimenti è dello stesso ordine.

Se uso la notazione   g(x) = O(h(x))  per x a
per indicare che g(x) è dello stesso ordine o è trascurabile rispetto ad h(x),
posso scrivere:   Errore = p(x)-f(x) = O((x-a)2)
Invece dell'errore spesso si considera il suo opposto, che viene chiamato "resto" in quanto è quanto resta da aggiungere a p(x) per ottenere f(x); indichiamolo con R(x):
  f(x) = p(x) + R(x).  Dunque R(x) = O((x-a)2)

•  Si può dimostrare qualcosa di più:
dato x appartenente ad un intervallo I contenente a, se f " è definita in I, o, almeno,
se f ' è continua in I e f " è definta tra a ed x, allora:
esiste c compreso strettamente tra a e x tale che R(x) = f "(c)/2·(x-a)2

Esercizio
Per x compreso tra -0.1 e 0.1 approssimo sin(x) con x. Valutare la precisione di questa approssimazione. Ossia, determinare un maggiorante del valore assoluto dell'errore, ovvero del resto.
In questo caso ho preso come "a" il numero 0.  sin(x) = x + R(x).
Per ogni x in [-0.1,0.1] esiste c tra 0 e x tale che:  R(x) = -sin(c)/2·x2
Quindi per x in [-0.1,0.1] ho: |R(x)| ≤ sin(0.1)/2·0.12 < 0.1/2·0.12 = 0.0005
(per x in [0,0.1] sin(x) è crescente e minore di x)

•  Quanto visto può essere generalizzato ai polinomi diTaylor (intorno ad a) di ordine N qualunque (p(x) diventa la funzione polinomiale di grado (al più) N tale che lei e tutte le sue derivate fino a quella di ordine N assumuno in a, ordinatamente, gli stessi valori di f e delle sue derivate):

se f derivabile, fino all'ordine N+1, in un intervallo I contenente a e
p(x) = f(a) + Σk=1..N f(k)(a)(x-a)k/k!  allora
    f(x) = p(x) + R(x)   con R(x) = O((x-a)n+1)
e per ogni x in I esiste c compreso strettamente tra a e x tale che
    R(x) = f(N+1)(c)(x-a)N+1 / (N+1)!
Nota 1. La prima relazione vale anche se f(N+1) esiste solo in a;
la seconda vale anche se f(N) è continua in I e f(N+1) esiste tra a e x.
Nota 2. Nel caso N=0 la seconda relazione non è altro che il "teorema del valor medio" (o, non a caso, "di Lagrange");
f(x) = f(a) + f '(c)(x-a) per c compreso strettamente tra a e x.
[le ipotesi del teo. del val. medio sono che f sia cont. in I e derivabile tra a e x]