I numeri complessi

  1. Richiami
  2. Dai vettori ai numeri complessi
  3. Le operazioni tra numeri complessi
  4. Le coordinate polari
  5. Numeri complessi e trasformazioni geometriche
  6. Polinomi rispetto a una variabile complessa
  7. Le radici dell'unità
  8. Esercizi
Sintesi

 

1. Richiami

    Abbiamo visto, studiando le funzioni polinomiali, che se con WolframAlpha fattorizzo il polinomio 7*x^4 + sqrt(3)*x^3 - x^2 + 2*x + 2/3 ottengo:

factor 7*x^4+sqrt(3)*x^3-x^2+2*x+2/3
7(x+0.294221)(x+0.732581)(x-(0.389683+0.53852i))(x-(0.389683-0.53852i))

    Abbiamo anche visto che se chiedo ad R di risolvere l'equazione polinomiale ottenuta eguagliando a 0 il termine precedente col comando polyroot (che sta per "radici del polinomio") ottengo:

  polyroot(c(2/3, 2, -1, sqrt(3), 7))
    -0.2942209-0.0000000i   -0.7325810+0.0000000i
     0.3896830-0.5385201i    0.3896830+0.5385201i

    Se con R traccio il grafico di F con F(x) uguale a tale polinomio ottengo il grafico a fianco, che evidenzia che le soluzioni di F(x)=0 sono -0.294… e -0.732….

   

    Sia da R che da WolframAlpha i numeri vengono scritti come "numeri complessi", che hanno la forma x + i y e che coincidono con gli usuali "numeri reali" quando y=0. Quindi, tra le soluzioni indicate da R, quelle reali sono quelle con il coefficiente della "i" uguale a 0, ossia  -0.2942209  e  -0.7325810.

    Lo "strano" prodotto  (x-(0.389683+0.53852i))(x-(0.389683-0.53852i))  ottenuto con factor potrei metterlo nella finestra di input di WolframAlpha e ottenere che esso equivale a  x^2-0.779366 x+0.441857  ossia che, senza ricorrere ai "numeri complessi", il polinomio può essere fattorizzato in  (x+0.294221)(x+0.732581)(x^2-0.779366 x+0.441857).

    Ma che cos'è questo i che compare? Che ruolo ha in matematica?  In questa scheda daremo una risposta a queste domande. Ad un primo livello ci si può fermare al paragrafo seguente e al successivo. Gli altri paragrafi, dal 4 al 6, sono da intendere come approfondimenti per alcuni tipi di scuole.

2. Dai vettori ai numeri complessi

    Abbiamo introdotto l'uso delle coppie di numeri per descrivere traslazioni (vedi qui la scheda La matematica e lo spazio - 1 o la voce Vettori negli Oggetti matematici), dopo che le avevamo già impiegate per descrivere punti dello spazio bidimensionale (piano cartesiano). Abbiamo introdotto anche una operazione di addizione tra tali coppie, per rappresentare la composizione di due traslazioni. Abbiamo poi introdotto la differenza tra coppie di numeri:  le figure seguenti ricordano come la differenza  (4,1) – (1,3) = (4–1, 1–3) = (3, –2) che rappresenta il vettore AB può essere interpretata sia come differenza tra i punti B e A, sia come differenza tra i vettori OB e OA (il vettore AB è quanto devo aggiungere al vettore OA per ottenere il vettore OB).

    La traslazione di una figura con passi Δx = 3, Δy = –2 può essere descritta come la applicazione della funzione  (x,y) → (x,y) + (3,–2) = (x+3, y–2)  a tutti i suoi punti.  Abbiamo visto (vedi qui la scheda La matematica e lo spazio - 3 o la voce Trasformazioni geometriche negli Oggetti matematici) come descrivere analogamente alcune particolari rotazioni attorno all'origine:
– il pesce della figura (A) seguente diventa il pesce di (B) mediante una rotazione di 90° (π/2) descrivibile come (x,y) → (–y, x)
– il pesce (A) diventa il pesce (C) mediante una rotazione di 180° (π) descrivibile come (x,y) → (–x,–y)
– il pesce (A) diventa il pesce (D) mediante una rotazione di 270° (3π/2), o –90°, descrivibile come (x,y) → (y,–x)

come si trasforma il vertice della prima pinna superiore

        Abbiamo considerato anche le simmetrie rispetto all'asse x e all'asse y e le trasformazioni di scala, come quella raffigurata a lato:
– si è ottenuto il pesce (E) mediante una trasformazione di scala monometrica (od omotetia di centro O) di fattore 2 descrivibile come (x,y) → 2(x, y) = (2x,2y) (moltiplicazione di (x,y) per il numero reale 2)

    Per semplificare la descrizione sia dei punti che delle trasformazioni geometriche (evitando l'uso delle parentesi e delle virgole) e, come vedremo, per trovare un modo semplice per descrivere anche le rotazioni di ampiezza diversa rispetto ai multipli di 90°, si introduce il seguente "trucco", che descriviamo riferendoci alla figura sotto a destra:

– posso pensare il punto P = (3,2), cioè il vettore OP, come somma del vettore (3,0) (il vettore di modulo 3 diretto come l'asse x) e del vettore (0,2) (di modulo 2 diretto come l'asse y):  (3,2) = (3,0) + (0,2).
– abbreviando, scrivo 3 al posto di (3,0) e, indicando con i il versore verticale, cioè il vettore (0,1), scrivo 2i al posto di (0,2); posso dunque scrivere:  (3,2) = 3 + 2i.
    In pratica descrivo la coppia come se fosse un termine numerico dato dalla somma di un numero reale (3) e il prodotto (2i) di un numero per il simbolo di costante i, che posso pensare come l'unità di misura degli spostamenti sull'asse verticale.
  

        i, in quanto simbolo di costante "inventato", che non corrisponde a un usuale numero, viene chiamato unità immaginaria, e le espressioni del tipo  x + iy,  somma di un numero reale e di un numero reale "moltiplicato per i", vengono dette numeri complessi.
    L'espressione "numeri reali" è stata introdotta dopo l'invenzione dell'uso di i, per precisare che si tratta di numeri usuali in cui non compare l'unità immaginaria.
    Quando si usano rappresentazioni grafiche come quelle illustrate sopra e a sinistra, gli assi delle ascisse e delle ordinate vengono chiamati anche asse reale e asse immaginario. E, dato il numero complesso, x + iy, a cui corrisponde il punto (x,y), x viene detta sua parte reale e y sua parte immaginaria.  In simboli:  x = Re(x + iy), y = Im(x + iy).

    Sopra sono rappresentati vari numeri complessi. Tra questi vi è anche un numero con parte reale nulla (–2i, rappresentato da un vettore verticale) e uno con parte immaginaria nulla (–1, rappresentato da un vettore orizzontale), ossia un numero complesso che è anche un numero reale.  Con le convenzioni usuali, –2–2i sta per –2+(–2)i, ossia ha –2 come parte immaginaria.

   

 1 
   A destra sono rappresentati graficamente cinque numeri complessi. Quanto valgono?

A:B:C:D:E:

3. Le operazioni tra numeri complessi

    L'insieme dei numeri complessi viene indicato con C. Ad esso posso estendere l'addizione e la moltiplicazione di R in modo che si mantengano molte delle loro proprietà, come la possibilità di riordinare somme e prodotti e la proprietà distributiva.
    L'addizione non è altro che quella tra vettori: (4 + 6 i) + (2 + 3 i) diventa la somma dei vettori rappresentati da 4, da 6i, da 2 e da 3i, che posso riordinare come voglio, per cui posso ottenere:

(4 + 6 i) + (2 + 3 i) = 4+2 + (6i+3i) = 6 + 9i.

    Per trasformare 6 i + 3 i in 9 i ho fatto:  6 i + 3 i = 6(0,1) + 3(0,1) = (0,6) + (0,3) = (0+0, 6+3) = (0,9) = 9 i.

    Effettuando la moltiplicazione tra due generici numeri complessi in modo che valga la proprietà distributiva ho, ad es.:

(7 + 10 i) · (4 + 3 i)  =  7·4 + 10·4 i + 7·3 i + 10·3 i·i  =  28 + 61 i + 30 i·i.

    Per completare il calcolo trasformando il risultato in una espressione del tipo x+iy devo stabilire quanto fa i·i.   
    Provo a interpretare geometricamente la moltiplicazione per i:
  1 per i  so che fa i;  quindi il "vettore 1" è stato ruotato di 90°
  –1 per i  so che fa –i;  quindi il "vettore –1" è stato ruotato di 90°
    Definisco in modo analogo "i per i":   i, ossia (0,1), ruotato di 90° diventa il vettore (–1,0), che ho rappresentato col numero complesso –1.

    Posto  i·i = –1  la moltiplicazione precedente diventa:

(7 + 10 i) · (4 + 3 i)  =  28 + 61 i + 30(–1)  =  –2 + 61 i

    Indichiamo con z un generico numero complesso e con x e y le sue parti reale e immaginaria (z = x+iy). La figura sotto a sinistra illustra la interpretazione geometrica delle trasformazioni z → z+(4+3i) e z → z·(4+3i).

 
  z → z + (4+3i), in quanto (x+iy)+(4+3i) = x+4+(y+3)i, trasforma ogni punto (x,y) in (x+4,y+3): è la traslazione di vettore (4,3) che trasforma il quadrato F nel quadrato F1;
z → z · (4+3i) trasforma i punti del segmento OA nei punti del segmento OP; infatti O = 0+0i rimane invariato, A = 1+0i diventa 4+3i, ossia P; il punto medio di OA, ossia 0.5+0i, diventa 4/2+3/2i, cioè (4/2,3/2) che è il punto medio di OP, e così via. Facendo i calcoli in generale si ottiene:
  z · (4+3i) = (4x–3y) + (4y+3x)i;
quindi B = (1,1) diventa Q = (1,7), C = (0,1) diventa R = (–3,4); è facile verificare che il poligono OPQR è un quadrato: è il quadrato F2 che si ottiene da F mediante la stessa rotazione attorno ad O e la stessa omotetia (trasformazione di scala monometrica) che trasformano il versore OA dell'asse reale (il numero 1) nel vettore OP (il numero 4+3i).  Qui trovi come verificare ciò con R.

    In sintesi, addizioni e moltiplicazioni tra numeri complessi si eseguono operando sulle espressioni che li rappresentano come si fa tra i numeri reali, a patto di operare la sostituzione di i² con –1.  E si ha che l'addizione di a+ib a x+iy trasla il vettore (x,y) con passi Δx=a e Δy=b e la moltiplicazione di x+iy per a+ib trasforma (x,y) con la stessa "roto-omotetia" che trasforma il vettore (1,0) in (a,b):  alla direzione di (x,y) viene addizionata la direzione di (a,b), il modulo di (x,y) viene moltiplicato per il modulo di (a,b).

    Viene chiamato modulo di a+ib, e indicato |a+ib|, il modulo del vettore (a,b), ossia √(a²+b²). Ad es. |4+3i| = √(16+9) = 5: è la lunghezza del segmento OP della figura precedente (ed è il fattore di scala dell'ingrandimento eseguito da z → z·(4+3i)).

    La direzione del vettore (a,b) viene invece chiamata anomalia o argomento di a+ib . Ad es. l'argomento di 4+3i è la direzione del vettore (4,3), ossia la direzione compresa tra 0° e 90° che ha come pendenza 3/4 = 0.75; per trovarne il valore posso usare ad es. una calcolatrice (0.75 fornisce 0.64350… = 36.869…°) o del software (ad es. con R ottengo: atan(0.75) = 0.6435011, atan(0.75)*180/pi = 36.8699):  36.870° è la direzione del segmento OP della figura precedente (ed è l'ampiezza della rotazione eseguita da z → z·(4+3i)).

    Osserviamo che, se z è reale,  |z| inteso come valore assoluto  e  inteso come modulo  coincidono in quanto √(x²+0²) = √(x²) = |x|. Del resto il modulo di OP indica la distanza di P da O, e, se P sta sull'asse x, questa non è altro che il valore assoluto dell'ascissa di P. 

    Come si possono effettuare i calcoli precedenti con R:

(4+6i)+(2+3i); (7+10i)*(4+3i)
  6+9i   –2+61i
z <- 4+3i; Re(z); Im(z); Mod(z)
  4   3   5
Arg(z); paste(Arg(z)/pi*180,"°",sep="")
   0.6435011   36.869897645844°

    Per calcolare le divisioni tra numeri complessi basta che stabiliamo, dato z = x+iy, quanto vale il reciproco 1/z. Infatti la divisione per z la possiamo interpretare come una moltiplicazione per 1/z.
    Dobbiamo, dunque, trovare a+ib tale che (a+ib)(x+iy)=1, ossia tale che:
ax–by + i(ay+bx) = 1, ossia:   ax–by=1 & ay+bx=0
    È un sistema di equazioni con incognite a e b che posso risolvere ad es. così:
a=–bx/y & (–bx2/y–by)=1     a=–bx/y & b(x2+y2)/y=–1
b=–y/(x2+y2) & a=x/(x2+y2)     Quindi:
1/z = 1/(x+iy) = (x–iy)/(x2+y2).
    Un modo più veloce (basato su ) per ottenere lo stesso risultato è il seguente:

1x–iy x–iyx–iy
——— = —————— =  ——— = ———
x+iy(x+iy)(x–iy) x²– i²y² x² + y²

Esempio: calcolo di  (–2 + 61 i) / (4 + 3 i).  Potremmo usare la "formula" vista sopra, ma procediamo direttamente:

–2 + 61 i = (–2 + 61 i)(4 – 3 i) = 175 + 250 i =  7 + 10 i
——————————————
4 + 3 i(4 + 3 i)(4 – 3 i)42 + 32

La divisione con R:   (–2+61i)/(4+3i)     7+10i

 2 
   Calcola a mano, sviluppando i passaggi, quanto vale  (–3 + 4 i) / (2 + 3 i).  Controlla il risultato con R (battendo il comando seguente) e con WolframAlpha.
  library(MASS); z <- (–3+4i)/(2+3i); z; fractions( c( Re(z),Im(z) ) )

 

4. Le coordinate polari

    Un vettore può essere individuato indicandone le componenti oppure indicandone direzione e modulo. Analogamente un numero complesso può essere individuato indicandone le parti reali e immaginaria oppure indicandone argomento e modulo. E tutto ciò è analogo alla possibilità di individuare un punto del piano mediante le sue coordinate cartesiane oppure mediante le sue coordinate polari (vedi qui la scheda La matematica e lo spazio - 2 o la voce Lo spazio negli Oggetti matematici). Queste sono comode, oltre che per rappresentare fenomeni, per descrivere figure.

    Ad es., usando ρ (lettera greca "ro") e θ (lettera greca "teta") per rappresentare rispettivamente la distanza da O e la direzione, il disco forato (corona circolare) illustrato a fianco, che in coordinate cartesiane è rappresentabile con 4 ≤ x²+y² ≤ 16, e che usando la variabile complessa z (=x+iy) può essere descritta con 2 ≤ |z| ≤ 4, usando le coordinate polari diventa  2 ≤ ρ ≤ 4: è la figura compresa tra i cerchi ρ=2 e ρ=4.
    Sono facilmente descrivibili le spirali (ne abbiamo visto esempi qui nella scheda La matematica e lo spazio - 2, o alla voce tangenti e curve degli OM).  Quella raffigurata a destra è ρ = θ (per θ=0 ho ρ=0: sono nell'origine; al crescere di θ, ossia ruotando, ρ, ossia la distanza da O, cresce; per θ=2π ho compiuto un giro e sono a distanza 2π da O; per θ=4π ho compiuto un secondo giro e sono a distanza doppia da O; …).
 

    La disequazione 135° ≤ θ ≤ 225° invece rappresenta un angolo. In forma cartesiana lo avremmo descritto con il sistema:  x ≤ 0 & h·x ≤ y ≤ k·x con h = tan(225°) e k = tan(135°).

    ρ varia sui numeri reali non negativi, mentre θ varia su tutti i numeri reali.

    Naturalmente due numeri θ1 e θ2 che differiscono di 2π (360°) sono da intendersi diversi come numeri ma uguali come direzioni (come visto qui nella scheda La matematica e lo spazio - 2).
    In alcuni casi si restringe θ a variare in [0,2π), cioè [0,360°), o in (–π,π], cioè (–180°,180°]. In questi casi le eventuali operazioni tra direzioni vengono interpretate in modo opportuno.

Le coordinate polari ρ e θ vengono chiamate spesso, rispettivamente, raggio vettore e anomalia (come viene spesso chiamato anche l'argomento del corrispondente numero complesso). L'origine del sistema di riferimento viene chiamata polo. Il termine anomalia deriva dall'aggettivo "anomalo" (strano, irregolare). Infatti tra i primi usi delle coordinate polari vi fu quello della descrizione del moto dei pianeti intorno al sole e la scoperta che la direzione del vettore Sole-Pianeta (ossia della anomalia) non variasse proporzionalmente al tempo (i pianeti descrivono un'orbita ellittica e "ruotano" più velocemente quando sono vicini al sole) era stata considerata una cosa "strana" rispetto all'idea allora predominante che i pianeti ruotassero attorno al sole in modo uniforme (ossia con il vettore Sole-Pianeta che varia direzione proporzionalmente al tempo).

    Se indichiamo con x, y, ρ, θ e con xn, yn, ρn, θn rispettivamente le parti reale e immaginaria, il modulo e l'argomento del numeri complessi z e zn, possiamo scrivere:

se z = z1· z2,   ρ = ρ1· ρ2  e   θ = θ1+ θ2;

se z = 1 / z1,   ρ = 1 / ρ1  e   θ = –θ1;

se z = z1/ z2,   ρ = ρ1/ ρ2  e   θ = θ1– θ2.

    Naturalmente, ρ = |z|.  Se la direzione di z viene espressa con un numero θ tale che 0≤θ<2π, tale numero viene indicato con Arg(z) e chiamato argomento principale di z. A volte si ricorre a una convenzione diversa: si assume come Arg(z) tra i possibili argomenti di z (ossia tra i numeri con cui se ne può esprimere la direzione) quello che cade in (–π,π]. A 0 non è assegnato un argomento principale (il vettore nullo non è caratterizzabile con una particolare direzione: se si pone ρ=0, per qualunque θ risulta individuato il punto (0,0): se parto da O con una qualunque direzione ed eseguo uno spostamento nullo, rimango in O).

    A lato è illustrato come le funzioni circolari mettono in relazione parti reale e immaginaria (coordinate cartesiane) con modulo ed argomento (coordinate polari).
    Mentre da ρ e θ a x e y si passa con la diretta applicazione di due formule, e lo stesso accade per il passaggio da x e y a ρ, per determinare θ occorre tener conto che la direzione con pendenza y/x fornita da atan (o arctan, la funzione inversa della funzione tangente, tan) potrebbe differire di 180° dal valore corretto:  il valore fornito è sempre compreso tra –π/2 e π/2, per cui se x<0 occorre aggiungere π:

   x=ρcos(θ)   y=ρsin(θ)     ρ=√(x2+y2)   tan(θ)=y/x
 

nel caso di 2+5i (figura A), ρ = √(4+25) = √29 = 5.3851…, θ = atan(5/2) = atan(2.5) = 1.1902… = 68.198…°
nel caso di –3+2i (figura B), ρ = √(9+4) = √13 = 5.3851…, θ0 = atan(–2/3) = –0.588002… = –33.690…°, che non è l'argomento di –3+2i, in quanto dovrebbe essere una direzione del 2° quadrante: dobbiamo aggiungere π: θ = –0.588002…+π = (–33.690…+180)° = 146.310°

    Se x = 0, non posso calcolare arctan(y/x). Ovviamente ho: θ = π/2 quando y > 0, θ = 3π/2 (o –π/2) quando y < 0.

    I calcoli effettuati con R:

z <- 2+5i; Mod(z); Arg(z); Arg(z)/pi*180
  5.385165   1.19029   68.19859
z <- –3+2i; Mod(z); Arg(z); Arg(z)/pi*180
  3.605551   2.55359   146.3099
z <- 0+2i; Mod(z); Arg(z); Arg(z)/pi*180
  2   1.570796   90
z <- 0–2i; Mod(z); Arg(z); Arg(z)/pi*180
  2   –1.570796   –90

Nota.  La parte "arco" della parola arcotangente deriva dal fatto che direzioni e angoli sono "quantificati" interpretandoli come lunghezze di archi di cerchio.  In modo simile sono chiamate le funzioni inverse di seno e coseno ("arcoseno", "arcocoseno").
 

   

5. Numeri complessi e trasformazioni geometriche

    L'uso dei numeri complessi consente di descrivere in modo compatto diversi tipi di figure.  Ad esempio il cerchio di centro C = (3,1) e raggio 2 può essere descritto dalla equazione  |z–3–i|=2  con la "variabile complessa" z (pari a x+iy) che traduce la condizione che il punto P = (x,y) ha distanza 2 da C, ovvero che il vettore CP ha modulo 2.  L'equazione  |z+1–2i| = |z–1.5–3i|  rappresenta invece l'asse del segmento di estremi (–1, 2) e (1.5, 3).  [vedi qui per tracciare le figure con R]

  

        Si è visto (in §2) che le trasformazioni geometriche tra figure piane possono essere descritte invece che come funzioni (x,y) → (x',y') da coppie di numeri reali a coppie di numeri reali anche come funzioni z → z' da numeri complessi a numeri complessi.
    A sinistra è illustrata la trasformazione del rettangolo A mediante una funzione F ottenuta componendo  z → z·(1+2i)  (la rotoomotetia che trasforma il versore dell'asse x nel vettore (1,2), e quindi i lati orizzontali di A, lunghi 2, in segmenti diretti e lunghi come il vettore (2,4))  e  z → z+1.5+3i  (la traslazione di passi 1.5 e 3).  In generale tutte le similitudini possono essere descritte come funzioni di variabile complessa del tipo z → z·z1+z2   [vedi qui per tracciare le figure con R]

 3 
   A destra, in basso, è raffigurata la stessa figura (un rettangolo) sopra trasformata mediante la funzione z → z·(1+2i)+1.5+3i.  Sopra di essa è rappresentato il suo trasformato mediante la nuova funzione z → z/(1.4+z)+3i.  Si tratta di una figura ottenuta congiungendo quattro archi.  Associa ad ogni arco il colore che ha il segmento di cui è il trasformato.  Controlla la risposta modificando opportunamente il programma per R a cui si accede nel modo indicato nel "qui" a destra della figura precedente.

   

        Dato z = x+iy, si pone = x–iy.  È il numero che si ottiene cambiando segno alla parte immaginaria di z; viene chiamato il coniugato di z. Geometricamente, z → è la simmetria rispetto all'asse x  (la trasformazione in forma polare è: ρ' = ρ, θ' = –θ).
    Invece z → –z = –x–iy è la simmetria rispetto a (0,0)  (in forma polare è: ρ' = ρ, θ' = θ+180°)..
    Le rotazioni attorno ad O sono un caso particolare delle trasformazioni richiamate sopra, prima del quesito 3: sono descrivibili come funzioni z → z·z1 dove z1 è un numero complesso di modulo 1, ossia un numero complesso che rappresenta un versore. Se voglio ruotare con ampiezza α moltiplico per il numero che rappresenta il versore di direzione α, ossia per  cos(α) + i sin(α)  (vedi qui la scheda La matematica e lo spazio - 2 o la voce Direzioni e funzioni circolari negli Oggetti matematici).

    Usando le coordinate cartesiane questa trasformazione diventa:

(x, y) → (x·cos(α)–y·sin(α), x·sin(α)+y·cos(α)),  infatti:

z · (cos(α) + i sin(α)) = (x+iy)(cos(α)+isin(α)) = x cos(α) – y sin(α) + i (x sin(α) + y cos(α))

    Non è una formula da imparare a memoria: la si ricava facilmente nel modo appena illustrato.

 4 
   Completa il programma per R a cui si accede cliccando qui in modo che con esso si ottenga la figura rappresentata a destra.

   

    Sotto è esemplificata l'azione di z → z²:  viene raddoppiato "θ" e viene elevato al quadrato "ρ", per cui ogni semicerchio centrato in O sopra all'asse x viene trasformato nel cerchio centrato in O con raggio elevato al quadrato, e lo stesso accade per il semicerchio simmetrico che sta sotto all'asse x.  [vedi qui e qui]

  

    Ad es. il punto (0,2), ossia 0+2i, viene trasformato nel punto (–4,0), ossia –4+0i: la direzione da 90° diventa 180° e il modulo da 2 diventa 4.  Ma anche il punto (0,–2) del semicerchio inferiore, ossia 0–2i, viene trasformato nel punto (–4,0): la direzione da –90° diventa –180°, ovvero da 270° diventa 540° che, "come direzione", è uguale a 540°–360° = 180°, e il modulo da 2 diventa 4.  Del resto, con i calcoli, abbiamo sia: (2i)² = 2² i² = 4·(–1) = –4, sia: (–2i)² = (–2)² i² = 4·(–1) = –4.
    Geometricamente (vedi figura (A) sotto) possiamo interpretare anche il fatto noto che non solo 1 ma anche –1 elevato al quadrato fa 1 (–1 ha θ=180°, per cui moltiplicare per –1 equivale a ruotare di 180°, e quindi –1 per sé stesso diventa 1).  In (B) è invece illustrato che sia i che –i al quadrato fanno –1 (i ha direzione 90°, il suo doppio è 180°, che è la direzione di –1;  –i ha direzione –90° il cui doppio è –180°, che è un altro modo di esprimere la direzione di 180°).  La figura (C) illustra in un modo alternativo che –i al quadrato fa –1 (la direzione di –i posso indicarla con 270° il cui doppio è 540° che, come si è già osservato, equivale a 180°).

    Più in generale ogni punto e il suo simmetrico rispetto ad O sono trasformati da z → z² nello stesso punto.

 5 
   I punti (1,0), (−1,0) e (0,−2) in che punti sono trasformati da z → z²?

 

    Come nel caso in cui x sia un numero reale positivo con √x (radice quadrata di x) si indica uno dei due numeri (quello positivo) che al quadrato fanno x, così, più in generale, se z è un numero complesso, con √z si indica uno dei numeri complessi che al quadrato fanno z, e precisamente quello con direzione in (–90°, 90°].  In particolare con √(–1) si indica i, non –i.

    E, per esempio, come √(–3/4), si prende 3/2i  [per le proprietà delle potenze, il suo quadrato è il quadrato di 3/2 per il quadrato di i, ossia 3/4·(–1) = –3/4],  non il suo opposto –√3/2i, che anch'esso al quadrato fa √(–3/4).  In pratica si procede così:

√(–3/4) = (3/4·(–1)) = √(3/4)·√(–1) = 3/2i.

    Posso, invece, dire che  z² = –3/4  ha come soluzioni entrambi i numeri, ossia ±√3/2i.

  

   

    Nella figura a sinistra si vede come una particolare funzione a input e output complessi trasforma un reticolato: si vede che cambia la forma ma che le linee tra loro perpendicolari si mantengono perpendicolari [vedi qui]. Quella di mantenere gli angoli con cui si incontrano le linee è una caratteristica delle trasformazioni descrivibili come z → z' con z' termine ottenuto componendo le quattro operazioni (e altri particolari tipi di funzione). È di questo genere anche la funzione considerata nel quesito 3.

Si può intuire come questo tipo di trasformazioni (chiamate "conformi", in quanto conservano la forma degli incroci) possano essere utili per studiare come cambia il flusso di un fluido al cambiare della forma di un canale, per studiare questioni di aerodinamica e altri fenomeni di tipo fisico:  una situazione in cui il comportamento di una grandezza vettoriale (una velocità, una forza, …) varia lungo certe linee può essere ricondotta ad una in cui le linee lungo cui agisce la grandezza siano più facili da rappresentare e, quindi, consentano di semplificare lo studio matematico del problema.

    A destra è si vede come  T: z → z² + z + 1  trasforma il cerchio di raggio 1 centrato nell'origine in una curva che forma un nodo in O.  In particolare il semicerchio rosso viene trasformato nella parte di curva blu, quello marrone nella parte di curva nera.  Il punto a=(1,0) viene trasformato in (3,0), b=(0,1) e c=(0,−1) vengono trasformati in sé stessi, d=(−1,0) viene trasformato in (1,0). Negli archi tra b e d e tra c e d vi devono essere due punti (evidenziati in giallo) che vengono trasformati in (0,0), ossia nel nodo.  Questi due punti rappresentano i due numeri complessi z tali che z² + z + 1 = 0.
   Questa trasformazione viene studiata meglio in uno degli esercizi proposti  [vedi qui come tracciare le curve con R].

   

 

6. Polinomi rispetto a una variabile complessa

    Quando per descrivere il piano invece delle coordinate cartesiane si usano i numeri complessi si parla di piano di Argand, dal nome del matematico francese che, verso la fine del XIX sec., ha avuto l'idea di usare i numeri complessi per descrivere figure e trasformazioni geometriche, e, in particolare, di rappresentare le rotazioni di 90° come moltiplicazioni per i.

    Ma i numeri complessi sono stati "inventati" nel XVI sec. come "trucco" per risolvere alcune equazioni polinomiali di 3° grado. Il procedimento è stato descritto in quegli anni dall'italiano Gerolamo Cardano, anche se probabilmente non è stato lui ad avere l'idea iniziale. Il termine numeri immaginari fu introdotto (circa 100 anni dopo) da Cartesio, e il simbolo i fu introdotto (dopo circa altri 100 anni) da Eulero (prima si usavano altri nomi e altre notazioni).

    Si era trovato (nel 16º secolo) che un'equazione del tipo  x³ + p x + q = 0  ha come soluzione rispetto ad x il numero  ³(R–q/2) – ³(R+q/2)  dove  R = √((p/3)³+(q/2)²)

    Ad esempio per  x³ + 6 x – 2 = 0  si trova  R = √(2³+1²) = √9 = 3  da cui  x = ³4 – ³2.  È possibile verificare (anche con una calcolatrice) che si tratta effettivamente di una soluzione.

   Ma per  x³ – 15 x – 4 = 0  si trova  R = √(–5³+2²) = √(–121), che non sarebbe definito, mentre si sa che una soluzione ci deve essere (le funzioni polinomiali di 3° grado assumono valori sia positivi che negativi quindi ci si aspetta che assumano anche il valore 0).  Si è allora provato a inventare i per indicare √(–1) e vedere se con qualche manipolazione algebrica si riesce a ricavare la soluzione.
√(–121) diventa 11i e la soluzione diventerebbe x = ³(2 + 11i) - ³(2 – 11i)
    Si trova che (2+i)³ = (2+i)(2+i)(2+i) = (4+4i–1)(2+i) = (3+4i)(2+i) = (6+11i–4) = 2+11i  e analogamente che (2–i)³ = 2–11i, per cui si ha:

x = ³(2 + 11i) − ³(2 – 11i) = 2+i – 2–i = 4

che è effettivamente una soluzione della nostra equazione.

    Dunque, i numeri complessi sono stati introdotti come "numeri fittizi" per potere estendere l'uso delle formule risolutive di alcune equazioni polinomiali e trovare i numeri reali che le risolvono.  Non c'era, invece, alcun interesse a trovare i numeri complessi che risolvono una equazione, interesse che è nato, invece, con gli usi dei numeri complessi descritti nei paragrafi precedenti, in cui si è avuto a che fare con equazioni polinomiali di variabile complessa, come la equazione z²+ z + 1 = 0 considerata sopra.  Si possono considerare complessi non solo la variabile, ma anche i coefficienti, come nel caso dell'equazione z² − i = 0, ossia z² = i (che ha come soluzioni cos(45°)+i sin(45°) e il suo opposto).

 6 
   L'equazione in z  z²−i = 0 può essere risolta in R e in WolframAlpha nei seguenti modi:  polyroot(c(-1i, 0, 1))  e  solve z^2-i=0 for z.  Risolvila con entrambi i software.
Risolvi poi, con entrambi i software, le seguenti equazioni rispetto a z, e verificane le soluzioni "a mano":  z²+1 = 0,  z²+z+1 = 0,  z²+3/4 = 0.

 

    Abbiamo visto come sia facile, usando il software, scomporre un polinomio di grado n in n polinomi di primo grado.
    Di fronte a  z4 − 3iz3 − 3z2 + iz  ecco che cosa possiamo ottenere, ad esempio, con R e con WolframAlpha:

polyroot( c(0, 1i, -3, -3i, 1) )     0+0i 0+1i 0+1i 0+1i
factor z^4-3*i*z^3-3*z^2+i*z = 0     z (z-i)^3          

    Trovo che il polinomio è fattorizzabile in  z·(z−i)³  ovvero che le sue radici sono 0 e i, dove i viene scritta da R tre volte per ricordare che si tratta di una radice tripla, ossia che è la soluzione del prodotto di tre equazioni che hanno i come soluzione.

    In realtà giustificare teoricamente, in generale, la scomponibilità di un polinomio di grado maggiore di 1 nel prodotto di polinomi di primo grado non è semplice. La cosa può essere provata ma la dimostrazione non è semplice.  Nel seguente riquadro trovi qualche approfondimento.

    Ai polinomi di variabile complessa si può applicare lo stesso algoritmo della divisione e lo stesso teorema del resto visti per quelli di variabile reale.

    In più per essi vale il cosiddetto teorema fondamentale dell'algebra, secondo il quale ogni equazione polinomiale di variabile complessa di grado maggiore o uguale a 1 ha almeno una soluzione.

    Ad esempio, x² + 1 = 0 se le si assegna come dominio R non ha soluzioni, se le si assegna come dominio C (caso in cui, in genere, verrebbe scritta come z² + 1 = 0) ha invece i come soluzione, e anche −i.

    Dal teorema del resto e dal teorema fondamentale deriva la possibilità di scomporre, nell'ambito dei numeri complessi, qualunque polinomio P(z) di grado n, con n  1, nel prodotto di n polinomi di grado 1.

    Infatti trovata una soluzione z1 posso dividere P(z) per z-z1 e, trovato Q1(z) come quoziente, scrivere P(z) come (z-z1)Q(z);  poi, trovata una soluzione z2 di Q1(z), posso scriverlo come (z-z1) (z-z2)Q2(z);  e così via fino a ottenere (z-z1) (z-z2)… (z-zn).

    Questo è il motivo per cui i programmi che svolgono calcoli simbolici in genere svolgono le loro manipolazioni operando nei numeri complessi:  in tale ambito è possibile fattorizzare i polinomi e, quindi, è più facile semplificare un'espressione complessa contenente termini polinomiali.

    Ciò, tuttavia, crea anche dei problemi.  Infatti può accadere che una semplificazione eseguita nell'ambito dei numeri complessi conduca a un termine che non è equivalente nell'ambito dei numeri reali.
    Ecco, sotto, un esempio di funzione F di cui viene tracciato il grafico anche in (-∞,0) anche se ivi F non è definita:  durante la tabulazione per tracciare il grafico il programma calcola la radice anche dei numeri negativi, trasforma "i/i" in 1 e trova un numero reale come valore della funzione  (ad esempio per  x = −1  trova  −1−1+√(−4)/√(−1) = 2+2i/i = −2+2 = 0).  Ciò è quello che accade con molti programmi di calcolo simbolico  (la evidenziazione mediante tratteggio della parte del grafico a sinistra dell'asse y è nostra).

    E se chiedo al programma di risolvere l'equazione F(x) = 0 dove F è la stessa funzione, ottengo come soluzione −1 anche se non lo sarebbe in quanto non appartiene al dominio della equazione, se pensata di variabile reale  (apparterebbe al dominio se considerassi l'equazione nell'ambito dei numeri complessi).
    Per il programma, infatti, l'equazione equivale a  x+1 = 0  in quanto considera  √(4x)/√x, ossia 2√x/√x, equivalente a 2 per ogni x diverso da 0, anche per x < 0.

  

Grafico di:

x -> x-1+√(4x)/√x

    WolframAlpha e, soprattutto, R si comportano meglio di gran parte dell'altro software.

    Ad esempio WolframAlpha con plot y=x-1+sqrt(4*x)/sqrt(x) dà il grafico anche per x negativo, ma con plot y=x-1+sqrt(4*x)/sqrt(x), 0 < x <= 10 ottengo il grafico corretto.  Per ottenere il garfico su un rettangolo cartesiano che comprenda ascisse non appartenenti al dominio posso usare il seguente trucco (in cui aggiungo un termine 1/q con q che si azzera al di fuori del dominio): 
plot y=x-1+sqrt(4*x)/sqrt(x) + 1/(sgn(x)+1), -2 < x < 10
    Anche per la soluzione di x−1+√(4x)/√x = 0 devo aggiungere le condizioni sul dominio di x: solve x-1+sqrt(4*x)/sqrt(x)=0 for x dà come soluzione −1 mentre solve x-1+sqrt(4*x)/sqrt(x)=0 for x, x > 0 dà correttamente "no solutions exist".

    L'applicazione R, invece, se eseguo:
 
f <- function(x) x-1+sqrt(4*x)/sqrt(x)
plot(f,-2,2, ylim=c(-1,3)); abline(h=0,v=0,col="blue")

 
traccia il grafico correttamente, solo per gli input positivi. Solo se specifico che gli input sono numeri complessi ottengo il grafico anche per gli input negativi:
 
g <- function(x) {z <- x+0i; f(z)}
plot(g, -2,2, add=TRUE, lty=3)
   

 

 7 
   Ecco un esempio dei problemi che si possono avere nel rappresentare graficamente alcune funzioni. A destra il grafico di F: x → √cos(x)·√tan(x) che si ottiene con R, sotto quelli che si ottengono con WolframAlpha selezionando diversamente l'opzione per il tracciamento, computando gli output tra i reali o tra i complessi. Qual è l'unico grafico "corretto"? Perché?

   
 

7. Le radici dell'unità

    È interessante osservare che le soluzioni di zn = 1, con z variabile complessa, corrispondono geometricamente ai vertici del poligono regolare centrato nell'origine e avente un vertice in (0,1).
    A lato è illustrato il caso z5 = 1: oltre a 1 (pallino arancione) è soluzione cos(360°/5) + i sin(360°/5) (pallino rosso) in quanto elevare alla 5 equivale a moltiplicare "θ" per 5 e quindi ottenere cos(360°) + i sin(360°) che è uguale ad 1;  ma è soluzione anche cos(360°/5·2) + i sin(360°/5·2) (pallino blu) in quanto 360°/5·2·5 = 360°·2 che, come direzione, equivale a 360°;  e così via.
  
    Ecco come realizzare l'immagine a fianco e come svolgere i calcoli con R.  Ricordiamo che  polyroot(c(a,b,c,...))  fornisce le radici del polinomio in x  a+bx+cx²+...

sol <- polyroot(c(-1,0,0,0,0,1)); sol
# 0.309017+0.9510565i -0.809017+0.5877853i -0.809017-0.5877853i
# 1.000000+0.0000000i 0.309017-0.9510565i

plot(c(-1,1),c(-1,1),type="n",xlab="", ylab="", asp=1)
symbols(0, 0, circles=1, inches=FALSE, add=TRUE, fg="red")
abline(h=0,v=0, lty=3)
lines(c(sol[1],sol[2])); lines(c(sol[2],sol[3])); lines(c(sol[3],sol[5]))
lines(c(sol[5],sol[4])); lines(c(sol[4],sol[1]))
lines(c(sol[1],O),lty=3,col="red"); lines(c(sol[2],O),lty=3,col="red")
lines(c(sol[3],O),lty=3,col="red"); lines(c(sol[4],O),lty=3,col="red")
lines(c(sol[5],O),lty=3,col="red")
points( Re(sol),Im(sol), col=c("red","blue","brown","orange","green"), pch=19)

 8 
   Completa la prima delle istruzioni seguenti in modo da ottenere la figura rappresentata qui a destra.
sol <- polyroot(c( ... )); sol
#  0+1i -1-0i  0-1i  1+0i
plot(c(-1,1),c(-1,1),type="n",xlab="", ylab="", asp=1)
symbols(0, 0, circles=1, inches=FALSE, add=TRUE, fg="red")
abline(h=0,v=0, lty=3); points( Re(sol),Im(sol), pch=19)

   

8. Esercizi

 e1 
    Rappresenta su un sistema monometrico i vettori OP con P rappresentato come numero complesso nei modi seguenti:  1−2i,  −2i,  2+3i,  −2,  −2−i,  −3+4i.
 

 e2 
    Quale tipo di trasformazione geometrica corrisponde ad una funzione da C in C del tipo z → u·z dove u è un numero complesso di modulo 1?
 

 e3 
    Trova i numeri complessi z che soddisfano la diseguaglianza  |z| ≤ |z+2|
 

 e4 
    Verifica che   (1 − i)/(1 + i) = −i = 1/i   e che   (−1/2 + i√3/2)3 = 1.
 

 e5 
   Determina le funzioni  (C → Cz → z1·z  e  z → z2·z  che, rispettivamente, trasformano il poligono A nel poligono B)  e)  il poligono B nel poligono A.

   

 e6 
    Siano O = (0,0), P = (1,1). Traccia il segmento OP e le sue immagini mediante le trasformazioni geometriche descritte dalle funzioni CC così definite:
  F(z) = i − z,  G(z) = i z,  H(z) = z³.
 

 e7 
    Esprimi  i / (2 + i√2)  nella forma  ParteReale + i ParteImmaginaria.
 

 e8 
    La relazione tra moltiplicazioni per un numeri complessi e rotazioni attorno ad O messa a punto nel §5 ci consente di ricavare facilmente alcune formule spesso utili quando si opera con funzioni circolari. Siano u e v due numeri complessi di modulo 1 e siano α e β i loro argomenti, ossia siano  u = cos(α) + i sin(α)  e  v = cos(β) + i sin(β). Dimostra che, allora:
u·v = cos(α)·cos(β)–sin(α)·sin(β) + i·(sin(α)·cos(β)+sin(β)·cos(α)).
D'altra parte u·v ha come argomento la somma di quelli di u e v, ossia u·v = cos(α+β) + i·sin(α+β).
Se ne deduce che:  cos(α+β) = cos(α)·cos(β) – sin(α)·sin(β),   sin(α+β) = sin(α)·cos(β) + sin(β)·cos(α).
[cliccando qui ottieni una figura che suggerisce una dimostrazione alternativa di tali relazioni]
Deducine che:  cos(2α) = cos(α)² – sin(α)² = 2cos(α)² – 1,  sin(2α) = 2 sin(α)·cos(α).
Ricavane che:  tan(α+β) = (tan(α)+tab(β)) / (1–tan(α)·tan(β))  e  tan(2α) = 2 tan(α) / (1–tan(α)²)
[le formule …(2α) sono note come formule di duplicazione - double-angle formulas]
Confronta le formule considerate in questo esercizio con quanto si trova in WolframAlpha alla voce addition formulas.
 

 e9 
   Alla fine di §5 abbiamo considerato  T: z → z² + z + 1  che trasforma il cerchio di raggio 1 centrato nell'origine (in rosso a fianco) in una curva (in blu) che forma un nodo in O.  Dimostra che (–1/2, √3/2) e (–1/2, –√3/2) sono i due punti che vengono trasformati nell'origine degli assi.  Traccia: rappresenta tali punti in coordinate polari, individua quali sono i loro trasformati mediante z → z², e quelli ottenuti trasformando questi con la traslazione "+z", e prova che questi infine, mediante la traslazione "+1", vengono trasformati in (0,0).

   

 e10 
   Sia F(z) = z2 + z. Individua le coordinate dei punti evidenziati nella figura a destra, che sono i trasformati mediante F dei punti evidenziati nella figura a sinistra.

   

1) Segna con l'evidenziatore, nelle parti della scheda indicate, frasi e/o formule che descrivono il significato dei seguenti termini:

  modulo (§2),  argomento (§3),  argomento principale (§4),  coniugato (§5),  piano di Argand (§6),  teorema fondamentale dell'algebra (§6)

2) Su un foglio da "quadernone", nella prima facciata, esemplifica l'uso di ciascuno dei concetti sopra elencati mediante una frase in cui esso venga impiegato.

3) Nella seconda facciata riassumi in modo discorsivo (senza formule, come in una descrizione "al telefono") il contenuto della scheda (non fare un elenco di argomenti, ma cerca di far capire il "filo del discorso").