Q – Tertium Auris

Trovo questo software semplicemente fantastico.
Se voglio giochicchiare con le formanti per sentire quanto il loro cambiamento possa influire sulla produzione delle vocali, non c’è di meglio.
Prima di dare un’occhiata al clip che ho realizzato, sono doverose alcune chiarificazioni:

formante = concentrazione di energia in una banda frequenziale comprendente una o più componenti armoniche

Q = parametro variabile relativo a un intervallo frequenziale – campana – che ne indica “visivamente” la larghezza

Alcuni aspetti interessanti della struttura formantica:

le prime due formanti contengono sufficienti informazioni affinchè il nostro sistema di audio-codifica identifichi e classifichi un timbro vocalico, ma non nella sua qualità

ciascuna delle 7 vocali della lingua italiana prevede almeno 5 formanti, situate in zone frequenziali ben precise

la frequenza della prima formante F1 è in relazione con l’ampiezza dell’apertura della bocca

la frequenza della seconda formante F2 è determinata dalle diverse posizioni della lingua

In quest’altra immagine abbiamo una chiara visione spettrografica di F1 e F2 e loro variazioni per ciascuna vocale:

Il commento di Mauro Uberti all’immagine precedente:

le sette vocali della lingua italiana sintetizzate per chiarezza di esposizione come se fossero cantate da un basso sulla stessa nota fa1 (= 87,30 Hz): in alto lo spettrogramma dell’esempio vocale; nella colonna sinistra gli schemi degli atteggiamenti articolatori, ricavati da radiografie; nella colonna destra gli spettri delle sette vocali. Nello spettro di ogni vocale si riconoscono facilmente i gruppi di armonici dall’aspetto di picchi montagnosi, chiamati “formanti”. Nello spettrogramma le stesse formanti appaiono come annerimento degli stessi gruppi di armonici.

Immagine a sinistra:

sono raffigurate le frequenze delle prime due formanti di tutte e 7 le vocali, con relativo assetto del tratto vocale.

La cosa interessante è che per ogni vocale la posizione delle formanti non cambia pur variando la frequenza che si sta emettendo.

Ciò che fa la differenza è la diversa quantità di informazioni contenute in ciascuna formante; nella figura qui sotto si nota come emettendo la stessa vocale <a> su frequenze diverse si determinino identiche formanti ciascuna con una quantità diversa di componenti armoniche. Ciò avviene in quanto aumentando la frequenza, il primo armonico si sposta visivamente verso destra, e così tutti gli armonici successivi, che sono suoi multipli interi.

Questo è anche uno dei motivi per cui facciamo più fatica a notare differenze timbriche tra due soprani piuttosto che tra due bassi.

Tornando alla figura di sinistra, Mauro Uberti fa notare una cosa molto interessante: il picco della prima formante aumenta di frequenza dalla fino alla <a>, per poi decrescere e tornare alla posizione di partenza dalla <a> alla .

Il motivo è semplice quanto affascinante: F1 (prima formante) è in relazione anche con l’ampiezza della cavità faringea (dietro la lingua per intenderci), che in effetti, osservando la figura, prima diminuisce e in seguito aumenta.

Idem dicasi per le posizioni di F2 che si posiziona attorno ai 2700 nella (cavità buccale piccola) e man mano scende fino ai 700 Hz nella (cavità buccale ampia).

Per contro è interessante notare, come già menzionato, come al variare della frequenza di una medesima vocale le formanti cadano sempre nelle medesime bande frequenziali:

Graficamente vi è un modo molto semplice per coordinare l’azione delle prime due formanti F1 e F2 il cui rapporto determinerà le diverse vocali, ovvero si prende un piano cartesiano e sull’asse x si dispongono le frequenze di F1 e sull’asse y le frequenze di F2, in questa maniera:

ho cerchiato in rosso molto approssimativamente le coordinate delle prime due formanti, nel senso che ad esempio la vocale <è> emessa da voce liricamente ben impostata potrebbe risultare come F1=600 Hz e F2=1500 Hz.

Risulta essere quindi una traccia molto indicativa utile soprattutto per sperimentare con il sopracitato software gratuito del geniale Svante Granqvist, che potete scaricare liberamente qui, purtroppo solo per win.

Vediamo solamente alcune funzioni di base:

Cliccando sul triangolino grigio sulla barra degli strumenti avvio il synth vocale

cliccando sulla tastiera musicale cambio frequenza

sotto la barra degli strumenti posso selezionare le formanti che mi interessano (max 6)

ancora sotto posso cambiare il parametro Q per ogni formante (l’ampiezza della base del picco montagnoso)

sulla destra trovo il quadro degli armonici, l’ampiezza dei quali è modificabile by clicking

Cliccando su Settings/Show F1F2 map… si aprirà una finestra con rappresentazione cartesiana delle prime due formanti, sulla quale andrò a cliccare col tasto sinistro del mouse per modificare i valori di F1 e F2 e sentire le diverse vocali. Ecco il video, nel quale ho inserito solo alcune operazioni principali, per il resto lascio alla sperimentazione più totale.

Se in più scarico anche RTSect e lo avvio insieme a Madde, posso visualizzare in tempo reale un sonogramma con le variazioni formantiche.

Trovo questo software semplicemente fantastico.

Se voglio giochicchiare con i formanti per sentire quanto il loro cambiamento influisce sulle vocali, non c’è di meglio.

Prima di dare un’occhiata al clip che ho realizzato, sono doverose alcune chiarificazioni:

formante = concentrazione di energia in una banda frequenziale comprendente una o più componenti armoniche

Q = parametro variabile relativo a un intervallo frequenziale – campana – che ne indica visivamente la larghezza

Alcuni aspetti interessanti della struttura formantica:

i primi due formanti contengono sufficienti informazioni affinchè il nostro sistema di audio-codifica identifichi e classifichi un timbro vocalico

ciascuna delle 7 vocali della lingua italiana prevede almeno 5 formanti, situati in zone frequenziali ben precise

la frequenza del primo formante F1 è in relazione con l’ampiezza dell’apertura della bocca

la frequenza del secondo formante F2 è determinata dalle diverse posizioni della lingua

Diamo ora un’occhiata a questa immagine:

sono raffigurate le frequenze dei primi due formanti di tutte e 7 le vocali, con relativo assetto del tratto vocale.

La cosa interessante è che per ogni vocale la posizione dei formanti non cambia pur variando la frequenza che si sta emettendo.

Ciò che fa la differenza è la diversa quantità di informazioni contenute in ciascun formante; nella figura qui a destra si nota come emettendo la stessa vocale <a> su frequenze diverse si determinino identici formanti ciascuno con una quantità diversa di componenti armoniche. Ciò avviene in quanto aumentando la frequenza, il primo armonico si sposta visivamente verso destra, e così tutti gli armonici successivi, che sono suoi multipli interi.

Questo è anche uno dei motivi per cui facciamo più fatica a notare differenze timbriche tra due soprani piuttosto che tra due bassi.

Tornando alla figura di sinistra, Mauro Uberti fa notare una cosa molto interessante: il picco del primo formante aumenta di frequenza dalla fino alla <a>, per poi decrescere e tornare alla posizione di partenza dalla <a> alla .

Il motivo è semplice quanto affascinante: F1 (primo formante) è in relazione anche con l’ampiezza della cavità faringea (dietro la lingua per intenderci), che in effetti, osservando la figura, prima diminuisce e in seguito aumenta.

Idem dicasi per le posizioni di F2 che si posiziona attorno ai 2700 nella (cavità buccale piccola) e man mano scende fino ai 700 Hz nella (cavità buccale ampia).

In quest’altra immagine abbiamo una chiara visione spettrografica di F1 e F2 e loro variazioni per ciascuna vocale:

Uberti: le sette vocali della lingua italiana sintetizzate per chiarezza di esposizione come se fossero cantate da un basso sulla stessa nota fa₁ (= 87,30 Hz): in alto lo spettrogramma dell’esempio vocale; nella colonna sinistra gli schemi degli atteggiamenti articolatori, ricavati da radiografie; nella colonna destra gli spettri delle sette vocali.

Nello spettro di ogni vocale si riconoscono facilmente i gruppi di armonici dall’aspetto di picchi montagnosi, chiamati “formanti”.

Nello spettrogramma le stesse formanti appaiono come annerimento degli stessi gruppi di armonici.

Per contro è interessante notare, come già menzionato, come al variare della frequenza di una medesima vocale i formanti cadano sempre nelle medesime bande frequenziali:

Graficamente vi è un modo molto semplice per coordinare l’azione dei primi due formanti F1 e F2 il cui rapporto determinerà le diverse vocali, ovvero si prende un piano cartesiano e sull’asse x si dispongono le frequenze di F1 e sull’asse y le frequenze di F2, in questa maniera:

ho cerchiato in rosso molto approssimativamente le coordinate dei primi due formanti, nel senso che ad esempio la vocale <è> emessa da voce liricamente ben impostata potrebbe risultare come F1=1400 Hz e F2=1500 Hz.

Vediamo solamente alcune funzioni di base:

Cliccando sul triangolino grigio sulla barra degli strumenti avvio il synth vocale

cliccando sulla tastiera musicale cambio frequenza

sotto la barra degli strumenti posso selezionare i formanti che mi interessano (max 6)

ancora sotto posso cambiare il parametro Q per ogni formante (l’ampiezza della base del picco montagnoso)

sulla destra trovo il quadro degli armonici, l’ampiezza dei quali è modificabile by click

Cliccando su Settings/Show F1F2 map… si aprirà una finestra con rappresentazione cartesiana dei primi due formanti, sulla quale andrò a cliccare col tasto sinistro del mouse per modificare i valori di F1 e F2 e sentire le diverse vocali.

Ecco il video, nel quale ho inserito solo alcune operazioni principali, per il resto lascio alla sperimentazione più totale.

Dimenticavo, se scarico anche RTSect e lo avvio insieme a Madde, posso visualizzare in tempo reale un sonogramma con le variazioni formantiche.