• formante = concentrazione di energia in una banda frequenziale comprendente una o più componenti armoniche
  • Q = parametro variabile relativo a un intervallo frequenziale – campana – che ne indica visivamente la larghezza

 

fantvowred.gif

 

Alcuni aspetti interessanti della struttura formantica:

  • i primi due formanti contengono sufficienti informazioni affinchè il nostro sistema di audio-codifica identifichi e classifichi un timbro vocalico

  • ciascuna delle 7 vocali della lingua italiana prevede almeno 5 formanti, situati in zone frequenziali ben precise

  • la frequenza del primo formante F1 è in relazione con l’ampiezza dell’apertura della bocca
  • la frequenza del secondo formante F2 è determinata dalle diverse posizioni della lingua

Diamo ora un’occhiata a questa immagine:

vocali.jpg

sono raffigurate le frequenze dei primi due formanti di tutte e 7 le vocali, con relativo assetto del tratto vocale.

La cosa interessante è che per ogni vocale la posizione dei formanti non cambia pur variando la frequenza che si sta emettendo.vowp.gif

Ciò che fa la differenza è la diversa quantità di informazioni contenute in ciascun formante; nella figura qui a destra si nota come emettendo la stessa vocale <a> su frequenze diverse si determinino identici formanti ciascuno con una quantità diversa di componenti armoniche. Ciò avviene in quanto aumentando la frequenza, il primo armonico si sposta visivamente verso destra, e così tutti gli armonici successivi, che sono suoi multipli interi.

Questo è anche uno dei motivi per cui facciamo più fatica a notare differenze timbriche tra due soprani piuttosto che tra due bassi.

 

 

Tornando alla figura di sinistra, Mauro Uberti fa notare una cosa molto interessante: il picco del primo formante aumenta di frequenza dalla <i> fino alla <a>, per poi decrescere e tornare alla posizione di partenza dalla <a> alla <u>.

Il motivo è semplice quanto affascinante: F1 (primo formante) è in relazione anche con l’ampiezza della cavità faringea (dietro la lingua per intenderci), che in effetti, osservando la figura, prima diminuisce e in seguito aumenta.

Idem dicasi per le posizioni di F2 che si posiziona attorno ai 2700 nella <i> (cavità buccale piccola) e man mano scende fino ai 700 Hz nella <u> (cavità buccale ampia).

 

In quest’altra immagine abbiamo una chiara visione spettrografica di F1 e F2 e loro variazioni per ciascuna vocale:

1142.jpg

 

 

 

 

Uberti: le sette vocali della lingua italiana sintetizzate per chiarezza di esposizione come se fossero cantate da un basso sulla stessa nota fa1 (= 87,30 Hz): in alto lo spettrogramma dell’esempio vocale; nella colonna sinistra gli schemi degli atteggiamenti articolatori, ricavati da radiografie; nella colonna destra gli spettri delle sette vocali.

Nello spettro di ogni vocale si riconoscono facilmente i gruppi di armonici dall’aspetto di picchi montagnosi, chiamati “formanti”.

Nello spettrogramma le stesse formanti appaiono come annerimento degli stessi gruppi di armonici.

 

 

 

 

 

Per contro è interessante notare, come già menzionato, come al variare della frequenza di una medesima vocale i formanti cadano sempre nelle medesime bande frequenziali:

 

1143.jpg

 

In pratica la posizione invariabile dei formanti mi garantisce il riconoscimento e l’identificazione timbrico-vocale a prescindere dall’altezza del suono emesso; infatti se campionassimo una qualsiasi frequenza vocale e poi con la nostra bella tastierina MIDI suonassimo una bella scala ascendente dalla nota più bassa alla più acuta, sentiremmo un timbro che da muggito si trasforma in vocina da polmoni pieni di elio.

Ciò perchè mutando il pitch cambia anche la distanza frequenziale tra i formanti. Questo è uno dei motivi per cui uno strumento campionato deve essere costituito da un campione per ogni singola nota: si campiona un do suonato da un pianoforte e si assegna al tasto do corrispondente, poi si suona un do#, si campiona e si assegna al tasto do#, e via dicendo.

Ecco un esempio del comportamento formantico umano, prima con <i>, poi con <ò>, e le zone formantiche rimangono invariate, per finire col terzo esempio, una <i> compressa e dilatata digitalmente in modo progressivo, e le zone formantiche seguono l’andamento (gli esempi partono al 7° sec.):

Graficamente vi è un modo molto semplice per coordinare l’azione dei primi due formanti F1 e F2 il cui rapporto determinerà le diverse vocali, ovvero si prende un piano cartesiano e sull’asse x si dispongono le frequenze di F1 e sull’asse y le frequenze di F2, in questa maniera:

 

f1-f2.png

 

ho cerchiato in rosso molto approssimativamente le coordinate dei primi due formanti, nel senso che ad esempio la vocale <è> emessa da voce liricamente ben impostata potrebbe risultare come F1=1400 Hz e F2=1500 Hz.

Da questo diagramma si evince come per trasformare la <u> in <i> sia sufficiente spostare la banda di F2 da 800 Hz verso i 2300 Hz, mentre F1 rimane ancorato ai 350 Hz.

Riflettendoci appare chiaro, infatti nel passaggio da una vocale all’altra il vocal tract assume forme diverse grazie ai movimenti di labbra, lingua, palato molle e spostamenti della laringe e della mandibola, venendosi a creare quindi al suo interno cavità più o meno ampie, la dimensione delle quali determina il rinforzo di certi gruppi di armonici (formanti) piuttosto che di altri.

E qui viene il bello; F4, che contribuisce a quel rinforzo chiamato extra formante di canto di cui abbaiamo già accennato e di cui c’è ancora molto da dire, aumenta la sua intensità grazie all’abbassamento verticale della laringe, e io non mi stancherò mai di ripeterlo, non fino alla sensazione di sbadiglio ma di pianto.

14 thoughts on “L’importanza di F1 e F2

  1. Ciao!
    vorrei farti una domanda. Per caso avresti dei riferimenti bibliografici o dei materiali che trattano delle formanti?
    Grazie mille

  2. Gentile Marco,
    ho trovato degli esempi interessanti in internet,
    secondo questo sito:

    http://www.vocevista.com/elite2.html

    la formante di canto varia in ampiezza a seconda della vocale che si emette.. non dipende piuttosto dal livello tecnico del cantante?
    un bravo cantante dovrebbe far risuonare allo stesso modo le diverse vocali nei diversi registri, teoricamente?

  3. Ne avevo sentito parlare.
    Non ho dato un’occhiata attenta al sito, per cui per quel poco che ho letto mi sembra di capire che si tratti di software, e nemmeno free, che calcola sonogrammi, spettrogrammi e LPC come qualsiasi altro software free, con l’aggiunta però, nella versione plus, di poter effettuare l’elettroglottografia (EGG – misura la conduttanza, l’attitudine di un corpo ad essere percorso da corrente elettrica, delle pieghe vocali e la loro frequenza di vibrazione) con hardware apposito. Questo si che è veramente interessante!
    Credo che ci farò un pensierino…
    Grazie per la segnalazione.

    Precisa meglio le tue domande, non riesco a capire bene cosa mi chiedi.

    A presto.

  4. Sto tentando di affrontare il problema nell’ambito di una tesi, ma non riesco a capire in base a cosa siano identificati i primi due formanti (primi secondo quale criterio? Frequenza? Intensità?). Inoltre ho trovato per F1 ed F2 la definizione di”picchi armonici dei primi due formanti”: a questo punto ho il dubbio che si utilizzi il termine sia per esprimere la variazione di intensità in funzione della frequenza sia per i picchi di intensità raggiunti.
    Temo di aver fatto parecchia confusione.
    In secondo luogo, sei a conoscenza della ricerca pubblicata da Deborah Ross e colleghi nel 2007 (Musical intervals in speech? Verificano che sia nell’inglese che nel mandarino gli intervalli tra F1 ed F2 nelle diverse vocali tutti i 12 intervalli della scala cromatica.

  5. Ciao Damiano,
    scusa ma il tuo comm era finito nela mia spam directory, l’ho trovato per caso solo ora. In quanto argomento di interesse comune, ti rispondo con un post.

    Non conosco la teoria della Ross, darò un’occhiata.

  6. Posso fare una domanda che forse risulterà poco tecnica?Ma gli atteggiamenti articolari,che sono tipici per ogni vocale,hanno come risultato di provocarci la sensazione di percepire la stessa vocale nello stesso punto del palato indipendentemente dalla frequenza con la quale viene emessa,oppure é la frequnza della nota (quindi indipendentemente dalla vocale pronunciata) a determinare il punto del palato in cui la sentiamo “picchiare”? Detto questo io sono assolutamente affascinato dal tuo sito..dal tuo lavoro ed é ammirevole l’impegno e la passione che ci metti!Poi la parte dell’overtone singing…strepitosa..pian piano faccio progressi anche io..eheh!Grazie!

  7. Grazie a te Marko.
    E’ “anche” la frequenza della nota, e mi spiego meglio.
    Sappiamo che le sensazioni di risonanza del massiccio facciale e del cranio in genere sono appunto “sensazioni”. Ad esempio, la sensazione di “suono in maschera” tanto cara alla tecnica operistica non identifica un punto preciso e circoscritto, ma riguarda una zona relativamente estesa al cui interno oscilla un focus in relazione all’altezza frequenziale del suono emesso. Tendenzialmente tale concentrazione viene avvertita leggermente più in alto, ma sempre all’interno della “maschera”, con l’aumento della frequenza, e viceversa.

  8. Grazie mille!!Sapevo che avrei ricevuto una risposta esaustiva e chiarificatrice..sai essere tecnico esprimendoti in modo semplice e accessibile a tutti..é una qualità rara!Grazie!

  9. Ciao!
    Avrei una domanda…
    F1 cambia a seconda dei decibel a cui il suono è emesso?

  10. Ciao,
    ho una domanda, in parole povere cosa si intende per “formant tuning”?
    Grazie

  11. Quando io originariamente lasciato un commento sembra che fatto clic e adesso ogni volta che viene aggiunto un commento Ricevuta quattro email con lo stesso . Esiste un modo {puoi | puoi cancellarmi da quel servizio? Grazie mille !

Leave a comment