L’importanza di F1 e F2 (primi due formanti)

Ho riportato l’articolo precedente nella pagina EXTRA FORMANT, mi sembrava doveroso, ma vi consiglio di rileggerlo, ho aggiunto alcune considerazioni interessanti, un filmato e tagliato la parte su Madde. Lo trovate qui.

Advertisements

Madde e le formanti vocali

Trovo questo software semplicemente fantastico.
Se voglio giochicchiare con le formanti per sentire quanto il loro cambiamento possa influire sulla produzione delle vocali, non c’è di meglio.
Prima di dare un’occhiata al clip che ho realizzato, sono doverose alcune chiarificazioni:

  • formante = concentrazione di energia in una banda frequenziale comprendente una o più componenti armoniche
  • Q = parametro variabile relativo a un intervallo frequenziale – campana – che ne indica “visivamente” la larghezza
by hyperphysics

Alcuni aspetti interessanti della struttura formantica:

  • le prime due formanti contengono sufficienti informazioni affinchè il nostro sistema di audio-codifica identifichi e classifichi un timbro vocalico, ma non nella sua qualità
  • ciascuna delle 7 vocali della lingua italiana prevede almeno 5 formanti, situate in zone frequenziali ben precise
  • la frequenza della prima formante F1 è in relazione con l’ampiezza dell’apertura della bocca
  • la frequenza della seconda formante F2 è determinata dalle diverse posizioni della lingua
by Mauro Uberti

In quest’altra immagine abbiamo una chiara visione spettrografica di F1 e F2 e loro variazioni per ciascuna vocale:

Il commento di Mauro Uberti all’immagine precedente:

le sette vocali della lingua italiana sintetizzate per chiarezza di esposizione come se fossero cantate da un basso sulla stessa nota fa1 (= 87,30 Hz): in alto lo spettrogramma dell’esempio vocale; nella colonna sinistra gli schemi degli atteggiamenti articolatori, ricavati da radiografie; nella colonna destra gli spettri delle sette vocali. Nello spettro di ogni vocale si riconoscono facilmente i gruppi di armonici dall’aspetto di picchi montagnosi, chiamati “formanti”. Nello spettrogramma le stesse formanti appaiono come annerimento degli stessi gruppi di armonici.

 

Immagine a sinistra:

sono raffigurate le frequenze delle prime due formanti di tutte e 7 le vocali, con relativo assetto del tratto vocale.

La cosa interessante è che per ogni vocale la posizione delle formanti non cambia pur variando la frequenza che si sta emettendo.

Ciò che fa la differenza è la diversa quantità di informazioni contenute in ciascuna formante; nella figura qui sotto si nota come emettendo la stessa vocale <a> su frequenze diverse si determinino identiche formanti ciascuna con una quantità diversa di componenti armoniche. Ciò avviene in quanto aumentando la frequenza, il primo armonico si sposta visivamente verso destra, e così tutti gli armonici successivi, che sono suoi multipli interi.

Questo è anche uno dei motivi per cui facciamo più fatica a notare differenze timbriche tra due soprani piuttosto che tra due bassi.

Tornando alla figura di sinistra, Mauro Uberti fa notare una cosa molto interessante: il picco della prima formante aumenta di frequenza dalla <i> fino alla <a>, per poi decrescere e tornare alla posizione di partenza dalla <a> alla <u>.

Il motivo è semplice quanto affascinante: F1 (prima formante) è in relazione anche con l’ampiezza della cavità faringea (dietro la lingua per intenderci), che in effetti, osservando la figura, prima diminuisce e in seguito aumenta.

Idem dicasi per le posizioni di F2 che si posiziona attorno ai 2700 nella <i> (cavità buccale piccola) e man mano scende fino ai 700 Hz nella <u> (cavità buccale ampia).

 

 

 

 

 

 

 

 

Per contro è interessante notare, come già menzionato, come al variare della frequenza di una medesima vocale le formanti cadano sempre nelle medesime bande frequenziali:

1143.jpg

Graficamente vi è un modo molto semplice per coordinare l’azione delle prime due formanti F1 e F2 il cui rapporto determinerà le diverse vocali, ovvero si prende un piano cartesiano e sull’asse x si dispongono le frequenze di F1 e sull’asse y le frequenze di F2, in questa maniera:

f1-f2.png

ho cerchiato in rosso molto approssimativamente le coordinate delle prime due formanti, nel senso che ad esempio la vocale <è> emessa da voce liricamente ben impostata potrebbe risultare come F1=600 Hz e F2=1500 Hz.

Risulta essere quindi una traccia molto indicativa utile soprattutto per sperimentare con il sopracitato software gratuito del geniale Svante Granqvist, che potete scaricare liberamente qui, purtroppo solo per win.

Vediamo solamente alcune funzioni di base:

madde.png

  • Cliccando sul triangolino grigio sulla barra degli strumenti avvio il synth vocale
  • cliccando sulla tastiera musicale cambio frequenza
  • sotto la barra degli strumenti posso selezionare le formanti che mi interessano (max 6)
  • ancora sotto posso cambiare il parametro Q per ogni formante (l’ampiezza della base del picco montagnoso)
  • sulla destra trovo il quadro degli armonici, l’ampiezza dei quali è modificabile by clicking

Cliccando su Settings/Show F1F2 map… si aprirà una finestra con rappresentazione cartesiana delle prime due formanti, sulla quale andrò a cliccare col tasto sinistro del mouse per modificare i valori di F1 e F2 e sentire le diverse vocali. Ecco il video, nel quale ho inserito solo alcune operazioni principali, per il resto lascio alla sperimentazione più totale.

Se in più scarico anche RTSect e lo avvio insieme a Madde, posso visualizzare in tempo reale un sonogramma con le variazioni formantiche.

.

.

Madde e i formanti vocali

Trovo questo software semplicemente fantastico.

Se voglio giochicchiare con i formanti per sentire quanto il loro cambiamento influisce sulle vocali, non c’è di meglio.

Prima di dare un’occhiata al clip che ho realizzato, sono doverose alcune chiarificazioni:

  • formante = concentrazione di energia in una banda frequenziale comprendente una o più componenti armoniche
  • Q = parametro variabile relativo a un intervallo frequenziale – campana – che ne indica visivamente la larghezza

 

fantvowred.gif

 

Alcuni aspetti interessanti della struttura formantica:

  • i primi due formanti contengono sufficienti informazioni affinchè il nostro sistema di audio-codifica identifichi e classifichi un timbro vocalico

  • ciascuna delle 7 vocali della lingua italiana prevede almeno 5 formanti, situati in zone frequenziali ben precise

  • la frequenza del primo formante F1 è in relazione con l’ampiezza dell’apertura della bocca
  • la frequenza del secondo formante F2 è determinata dalle diverse posizioni della lingua

Diamo ora un’occhiata a questa immagine:

vocali.jpg

sono raffigurate le frequenze dei primi due formanti di tutte e 7 le vocali, con relativo assetto del tratto vocale.

La cosa interessante è che per ogni vocale la posizione dei formanti non cambia pur variando la frequenza che si sta emettendo.vowp.gif

Ciò che fa la differenza è la diversa quantità di informazioni contenute in ciascun formante; nella figura qui a destra si nota come emettendo la stessa vocale <a> su frequenze diverse si determinino identici formanti ciascuno con una quantità diversa di componenti armoniche. Ciò avviene in quanto aumentando la frequenza, il primo armonico si sposta visivamente verso destra, e così tutti gli armonici successivi, che sono suoi multipli interi.

Questo è anche uno dei motivi per cui facciamo più fatica a notare differenze timbriche tra due soprani piuttosto che tra due bassi.

 

 

Tornando alla figura di sinistra, Mauro Uberti fa notare una cosa molto interessante: il picco del primo formante aumenta di frequenza dalla <i> fino alla <a>, per poi decrescere e tornare alla posizione di partenza dalla <a> alla <u>.

Il motivo è semplice quanto affascinante: F1 (primo formante) è in relazione anche con l’ampiezza della cavità faringea (dietro la lingua per intenderci), che in effetti, osservando la figura, prima diminuisce e in seguito aumenta.

Idem dicasi per le posizioni di F2 che si posiziona attorno ai 2700 nella <i> (cavità buccale piccola) e man mano scende fino ai 700 Hz nella <u> (cavità buccale ampia).

 

In quest’altra immagine abbiamo una chiara visione spettrografica di F1 e F2 e loro variazioni per ciascuna vocale:

1142.jpg

 

 

 

 

Uberti: le sette vocali della lingua italiana sintetizzate per chiarezza di esposizione come se fossero cantate da un basso sulla stessa nota fa1 (= 87,30 Hz): in alto lo spettrogramma dell’esempio vocale; nella colonna sinistra gli schemi degli atteggiamenti articolatori, ricavati da radiografie; nella colonna destra gli spettri delle sette vocali.

Nello spettro di ogni vocale si riconoscono facilmente i gruppi di armonici dall’aspetto di picchi montagnosi, chiamati “formanti”.

Nello spettrogramma le stesse formanti appaiono come annerimento degli stessi gruppi di armonici.

 

 

 

 

 

Per contro è interessante notare, come già menzionato, come al variare della frequenza di una medesima vocale i formanti cadano sempre nelle medesime bande frequenziali:

 

1143.jpg

 

Graficamente vi è un modo molto semplice per coordinare l’azione dei primi due formanti F1 e F2 il cui rapporto determinerà le diverse vocali, ovvero si prende un piano cartesiano e sull’asse x si dispongono le frequenze di F1 e sull’asse y le frequenze di F2, in questa maniera:

 

f1-f2.png

 

ho cerchiato in rosso molto approssimativamente le coordinate dei primi due formanti, nel senso che ad esempio la vocale <è> emessa da voce liricamente ben impostata potrebbe risultare come F1=1400 Hz e F2=1500 Hz.

Risulta essere quindi una traccia molto indicativa utile soprattutto per sperimentare con il sopracitato software gratuito del geniale Svante Granqvist, che potete scaricare liberamente qui, purtroppo solo per win.

Vediamo solamente alcune funzioni di base:

madde.png

  • Cliccando sul triangolino grigio sulla barra degli strumenti avvio il synth vocale
  • cliccando sulla tastiera musicale cambio frequenza
  • sotto la barra degli strumenti posso selezionare i formanti che mi interessano (max 6)
  • ancora sotto posso cambiare il parametro Q per ogni formante (l’ampiezza della base del picco montagnoso)
  • sulla destra trovo il quadro degli armonici, l’ampiezza dei quali è modificabile by click

Cliccando su Settings/Show F1F2 map… si aprirà una finestra con rappresentazione cartesiana dei primi due formanti, sulla quale andrò a cliccare col tasto sinistro del mouse per modificare i valori di F1 e F2 e sentire le diverse vocali.

Ecco il video, nel quale ho inserito solo alcune operazioni principali, per il resto lascio alla sperimentazione più totale.

 

 

Dimenticavo, se scarico anche RTSect e lo avvio insieme a Madde, posso visualizzare in tempo reale un sonogramma con le variazioni formantiche.

 

 

metronomo e diapason online

immagine.jpg
Idea carina, non so quanto utile.

Emusicinstitute, produttrice di metronomi, ha realizzato questa free version. Tre diverse skin, range 40/208 e niente fronzoli inutili.

Si clicca direttamente sui pallini gialli corrispondenti alla frequenza impulsiva desiderata.

Prevede anche un generatore audio fissato a 440 Hz.

Personalmente ho sempre usato diapason meccanici, e mi ha stupito la differenza acustica tra le due versioni.

Il diapason meccanico emette una frequenza di 440 Hz di semplice forma sinusoidale.

Nato agli inizi del ‘700, sembra che il primo a utilizzarlo fosse stato Haendel, e solamente algli inizi dell’800 venne impiegato per l’accordatura degli strumenti.

 

 

 

Questa è una rappresentazione sommaria di ciò che dovrebbe succedere durante la vibrazione:

Lo ascoltiamo qui.

Avete appena ascoltato il mio diapason. Avendo più di 25 anni di vita la sua frequenza è scesa da 440 a 438 Hz, probabilmente per deterioramento metallico.

 

Con un ascolto attento notiamo che il suono contiene anche uno zzinnnnn (circa 9560 Hz, ovvero vicino ma NON corrispondente al 22° armonico) della durata di qualche secondo, dato dall’impatto percussivo originario.

Questo è l’unico elemento <disturbatore> che percepiamo, in quanto ve ne sono altri a noi impercettibili, ma che contribuiscono a formare ciò che in effetti sentiamo:

  • una frequenza a 2792 Hz
  • una frequenza a 876 Hz, ovvero 438*2, ovvero esattamente l’ottava sopra

spettromecc1.png

Ora proviamo un esperimento acustico:

ascolterete in un unico file lo stesso diapason di prima accorciato e ripetuto più volte, prima nella sua integrità timbrica, poi privato dello ziinn, poi privato anche dei 2792 Hz e poi della seconda componente armonica, fino a rimanere con la fondamentale sinusoidale pura; subito dopo il procedimento inverso, man mano aggiungendo le componenti una a una.

Inutile dire che si necessita di buone cuffie.

Ecco il file audio in questione.

Ora eccovi solo le frequenze omesse, ovvero :

  • prima lo ziinnn a 9650 Hz (2 volte)
  • poi i 2792 Hz (2 volte)
  • quindi il 2° armonico a 876 Hz (2 volte)
  • poi la Fo (frequenza fondamentale o 1° componente armonico) a 438 Hz (2 volte)
  • per concludere con l’onda integra – la somma di tutto (1 volta)

Il diapason digitale emette invece questo suono (440 Hz), e lo spettro ne evidenzia la particolare sequenza degli armonici:

diapasondigitspettro.png

Da notare il buco tra i 4000 e i 7000 Hz, in ogni caso la sensazione timbrica ci viene fornita dai primi 9 armonici, come si può notare anche da quest’immagine:

diapasondigitanalisispettro.png

Nel seguente video che ho realizzato cerco di farvi “sentire”

  • prima tutte le frequenze da 7000 Hz in su, praticamente un sibilo sottilissimo e quasi inavvertibile,
  • poi distintamente i primi 6 armonici, dal più grave (440 Hz) al più acuto (2640)

Ovviamente gli armonici sono tutte onde sinusoidali, ed è sorprendente come il loro rapporto d’intensità contribuisca a mutare il timbro.

 

 

 

Super Kid

Segnalato da Stero.

Una versione dell’aria della Regina della Notte dal Flauto Magico di Mozart in versione bimbo-primaopoi-ti-saltano-le-cordine .

E’ interessante notare come gli spettrogrammi dei tre “Hört” finali emesse dal bimbo (rispettivamente Re5, Fa5 e Sib5) confermino la coincidenza del 1° formante con il 1° componente armonico, aspetto tipico della struttura formantica del soprano lirico:

regina-della-notte.png

 

 

regina-della-notte2.png

 

 

regina-della-notte3.png

Ciò spiega il motivo per cui la sensazione all’ascolto è quella di un timbro squillante e brillante ma vuoto, poco timbrato.

 

 

Wave Surfer

Considero questo software come uno dei più completi e versatili tra gli open source/free, molto simile a Speech Tools, di cui abbiamo già parlato, ma gira anche su Linux e Mac.

Una volta lanciato il programma apparirà questa schermata:

ws1.jpg

 

Per prima cosa cliccate nella barra dei menù su Help/About Plug-ins e installate i plug-ins available. In questo modo renderete il software molto più versatile.

Caricate una forma d’onda col solito File/Open (praticamente di tutto, wav, mp3, aif, aiff, au, raw, snd, ogg, smp, sph, …, nonchè avi, mov, mpg, mpeg, mp4, dv, …), e vi apparirà questa finestra:

 

ws2.jpg

a questo punto potete sperimentare le varie opzioni, ad esempio Demonstration, ed otterrete questo:

ws32.jpg

(cliccate per ingrandire)

Col tondino rosso voglio farvi notare la possibilità di poter visualizzare sia una stima formantica della forma d’onda (LPC – Linear Predictive Coding) sia un’indagine FFT (analisi dello spettro).

A questo punto cliccando col tasto dx del mouse in un punto qualsiasi ad esempio della forma d’onda, potrete integrare il tutto con l’apertura di altri pannelli:

ws4.jpg

ed ottenere visualizzazioni differenti secondo necessità.

 

 

 

La sezione Documentation è ben fornita ed esauriente, l’importante per prendere dimestichezza è sperimentare.

Eccovi il link e buon divertimento.