Madde e i formanti vocali

Trovo questo software semplicemente fantastico.

Se voglio giochicchiare con i formanti per sentire quanto il loro cambiamento influisce sulle vocali, non c’è di meglio.

Prima di dare un’occhiata al clip che ho realizzato, sono doverose alcune chiarificazioni:

  • formante = concentrazione di energia in una banda frequenziale comprendente una o più componenti armoniche
  • Q = parametro variabile relativo a un intervallo frequenziale – campana – che ne indica visivamente la larghezza

 

fantvowred.gif

 

Alcuni aspetti interessanti della struttura formantica:

  • i primi due formanti contengono sufficienti informazioni affinchè il nostro sistema di audio-codifica identifichi e classifichi un timbro vocalico

  • ciascuna delle 7 vocali della lingua italiana prevede almeno 5 formanti, situati in zone frequenziali ben precise

  • la frequenza del primo formante F1 è in relazione con l’ampiezza dell’apertura della bocca
  • la frequenza del secondo formante F2 è determinata dalle diverse posizioni della lingua

Diamo ora un’occhiata a questa immagine:

vocali.jpg

sono raffigurate le frequenze dei primi due formanti di tutte e 7 le vocali, con relativo assetto del tratto vocale.

La cosa interessante è che per ogni vocale la posizione dei formanti non cambia pur variando la frequenza che si sta emettendo.vowp.gif

Ciò che fa la differenza è la diversa quantità di informazioni contenute in ciascun formante; nella figura qui a destra si nota come emettendo la stessa vocale <a> su frequenze diverse si determinino identici formanti ciascuno con una quantità diversa di componenti armoniche. Ciò avviene in quanto aumentando la frequenza, il primo armonico si sposta visivamente verso destra, e così tutti gli armonici successivi, che sono suoi multipli interi.

Questo è anche uno dei motivi per cui facciamo più fatica a notare differenze timbriche tra due soprani piuttosto che tra due bassi.

 

 

Tornando alla figura di sinistra, Mauro Uberti fa notare una cosa molto interessante: il picco del primo formante aumenta di frequenza dalla <i> fino alla <a>, per poi decrescere e tornare alla posizione di partenza dalla <a> alla <u>.

Il motivo è semplice quanto affascinante: F1 (primo formante) è in relazione anche con l’ampiezza della cavità faringea (dietro la lingua per intenderci), che in effetti, osservando la figura, prima diminuisce e in seguito aumenta.

Idem dicasi per le posizioni di F2 che si posiziona attorno ai 2700 nella <i> (cavità buccale piccola) e man mano scende fino ai 700 Hz nella <u> (cavità buccale ampia).

 

In quest’altra immagine abbiamo una chiara visione spettrografica di F1 e F2 e loro variazioni per ciascuna vocale:

1142.jpg

 

 

 

 

Uberti: le sette vocali della lingua italiana sintetizzate per chiarezza di esposizione come se fossero cantate da un basso sulla stessa nota fa1 (= 87,30 Hz): in alto lo spettrogramma dell’esempio vocale; nella colonna sinistra gli schemi degli atteggiamenti articolatori, ricavati da radiografie; nella colonna destra gli spettri delle sette vocali.

Nello spettro di ogni vocale si riconoscono facilmente i gruppi di armonici dall’aspetto di picchi montagnosi, chiamati “formanti”.

Nello spettrogramma le stesse formanti appaiono come annerimento degli stessi gruppi di armonici.

 

 

 

 

 

Per contro è interessante notare, come già menzionato, come al variare della frequenza di una medesima vocale i formanti cadano sempre nelle medesime bande frequenziali:

 

1143.jpg

 

Graficamente vi è un modo molto semplice per coordinare l’azione dei primi due formanti F1 e F2 il cui rapporto determinerà le diverse vocali, ovvero si prende un piano cartesiano e sull’asse x si dispongono le frequenze di F1 e sull’asse y le frequenze di F2, in questa maniera:

 

f1-f2.png

 

ho cerchiato in rosso molto approssimativamente le coordinate dei primi due formanti, nel senso che ad esempio la vocale <è> emessa da voce liricamente ben impostata potrebbe risultare come F1=1400 Hz e F2=1500 Hz.

Risulta essere quindi una traccia molto indicativa utile soprattutto per sperimentare con il sopracitato software gratuito del geniale Svante Granqvist, che potete scaricare liberamente qui, purtroppo solo per win.

Vediamo solamente alcune funzioni di base:

madde.png

  • Cliccando sul triangolino grigio sulla barra degli strumenti avvio il synth vocale
  • cliccando sulla tastiera musicale cambio frequenza
  • sotto la barra degli strumenti posso selezionare i formanti che mi interessano (max 6)
  • ancora sotto posso cambiare il parametro Q per ogni formante (l’ampiezza della base del picco montagnoso)
  • sulla destra trovo il quadro degli armonici, l’ampiezza dei quali è modificabile by click

Cliccando su Settings/Show F1F2 map… si aprirà una finestra con rappresentazione cartesiana dei primi due formanti, sulla quale andrò a cliccare col tasto sinistro del mouse per modificare i valori di F1 e F2 e sentire le diverse vocali.

Ecco il video, nel quale ho inserito solo alcune operazioni principali, per il resto lascio alla sperimentazione più totale.

 

 

Dimenticavo, se scarico anche RTSect e lo avvio insieme a Madde, posso visualizzare in tempo reale un sonogramma con le variazioni formantiche.

 

 

Madde e le formanti vocali

Trovo questo software semplicemente fantastico.
Se voglio giochicchiare con le formanti per sentire quanto il loro cambiamento possa influire sulla produzione delle vocali, non c’è di meglio.
Prima di dare un’occhiata al clip che ho realizzato, sono doverose alcune chiarificazioni:

  • formante = concentrazione di energia in una banda frequenziale comprendente una o più componenti armoniche
  • Q = parametro variabile relativo a un intervallo frequenziale – campana – che ne indica “visivamente” la larghezza
by hyperphysics

Alcuni aspetti interessanti della struttura formantica:

  • le prime due formanti contengono sufficienti informazioni affinchè il nostro sistema di audio-codifica identifichi e classifichi un timbro vocalico, ma non nella sua qualità
  • ciascuna delle 7 vocali della lingua italiana prevede almeno 5 formanti, situate in zone frequenziali ben precise
  • la frequenza della prima formante F1 è in relazione con l’ampiezza dell’apertura della bocca
  • la frequenza della seconda formante F2 è determinata dalle diverse posizioni della lingua
by Mauro Uberti

In quest’altra immagine abbiamo una chiara visione spettrografica di F1 e F2 e loro variazioni per ciascuna vocale:

Il commento di Mauro Uberti all’immagine precedente:

le sette vocali della lingua italiana sintetizzate per chiarezza di esposizione come se fossero cantate da un basso sulla stessa nota fa1 (= 87,30 Hz): in alto lo spettrogramma dell’esempio vocale; nella colonna sinistra gli schemi degli atteggiamenti articolatori, ricavati da radiografie; nella colonna destra gli spettri delle sette vocali. Nello spettro di ogni vocale si riconoscono facilmente i gruppi di armonici dall’aspetto di picchi montagnosi, chiamati “formanti”. Nello spettrogramma le stesse formanti appaiono come annerimento degli stessi gruppi di armonici.

 

Immagine a sinistra:

sono raffigurate le frequenze delle prime due formanti di tutte e 7 le vocali, con relativo assetto del tratto vocale.

La cosa interessante è che per ogni vocale la posizione delle formanti non cambia pur variando la frequenza che si sta emettendo.

Ciò che fa la differenza è la diversa quantità di informazioni contenute in ciascuna formante; nella figura qui sotto si nota come emettendo la stessa vocale <a> su frequenze diverse si determinino identiche formanti ciascuna con una quantità diversa di componenti armoniche. Ciò avviene in quanto aumentando la frequenza, il primo armonico si sposta visivamente verso destra, e così tutti gli armonici successivi, che sono suoi multipli interi.

Questo è anche uno dei motivi per cui facciamo più fatica a notare differenze timbriche tra due soprani piuttosto che tra due bassi.

Tornando alla figura di sinistra, Mauro Uberti fa notare una cosa molto interessante: il picco della prima formante aumenta di frequenza dalla <i> fino alla <a>, per poi decrescere e tornare alla posizione di partenza dalla <a> alla <u>.

Il motivo è semplice quanto affascinante: F1 (prima formante) è in relazione anche con l’ampiezza della cavità faringea (dietro la lingua per intenderci), che in effetti, osservando la figura, prima diminuisce e in seguito aumenta.

Idem dicasi per le posizioni di F2 che si posiziona attorno ai 2700 nella <i> (cavità buccale piccola) e man mano scende fino ai 700 Hz nella <u> (cavità buccale ampia).

 

 

 

 

 

 

 

 

Per contro è interessante notare, come già menzionato, come al variare della frequenza di una medesima vocale le formanti cadano sempre nelle medesime bande frequenziali:

1143.jpg

Graficamente vi è un modo molto semplice per coordinare l’azione delle prime due formanti F1 e F2 il cui rapporto determinerà le diverse vocali, ovvero si prende un piano cartesiano e sull’asse x si dispongono le frequenze di F1 e sull’asse y le frequenze di F2, in questa maniera:

f1-f2.png

ho cerchiato in rosso molto approssimativamente le coordinate delle prime due formanti, nel senso che ad esempio la vocale <è> emessa da voce liricamente ben impostata potrebbe risultare come F1=600 Hz e F2=1500 Hz.

Risulta essere quindi una traccia molto indicativa utile soprattutto per sperimentare con il sopracitato software gratuito del geniale Svante Granqvist, che potete scaricare liberamente qui, purtroppo solo per win.

Vediamo solamente alcune funzioni di base:

madde.png

  • Cliccando sul triangolino grigio sulla barra degli strumenti avvio il synth vocale
  • cliccando sulla tastiera musicale cambio frequenza
  • sotto la barra degli strumenti posso selezionare le formanti che mi interessano (max 6)
  • ancora sotto posso cambiare il parametro Q per ogni formante (l’ampiezza della base del picco montagnoso)
  • sulla destra trovo il quadro degli armonici, l’ampiezza dei quali è modificabile by clicking

Cliccando su Settings/Show F1F2 map… si aprirà una finestra con rappresentazione cartesiana delle prime due formanti, sulla quale andrò a cliccare col tasto sinistro del mouse per modificare i valori di F1 e F2 e sentire le diverse vocali. Ecco il video, nel quale ho inserito solo alcune operazioni principali, per il resto lascio alla sperimentazione più totale.

Se in più scarico anche RTSect e lo avvio insieme a Madde, posso visualizzare in tempo reale un sonogramma con le variazioni formantiche.

.

.

Sempre peggio

Io sono al computer.
Mia moglie accende la TV.

Famoso teatro d’opera, famoso direttore, cast tutto francese, e di buon livello generale, in scena un’opera famosa di repertorio.

E mentre sbrigo le mie faccende, ascolto.

Mi colpisce il soprano che interpreta un ruolo secondario, canta bene, nel senso che è ben intonata, filati di ottima fattura, timbro omogeneo e curato in tutta l’estensione, la respirazione sembra ben controllata, vibrato morbido e … naturale?

Mi chiama mia moglie, anch’essa soprano: “ma come canta questa?!”

In effetti non credo alle mie orecchie e ai miei occhi, un vibrato così apparentemente naturale emesso con un mezzo così artificiale… possibile che io mi sia fatto ingannare?

Labbra che si protendono e arretrano con movimenti rapidi atti a simulare un vibrato di ampiezza e di frequenza pressochè perfetto.

Acusticamente piacevole, visivamente ridicolo, didatticamente terrificante.

E siamo in un teatro di tradizione, e c’è una ripresa video internazionale.

Il vibrato vocale è naturale in quanto prodotto naturalmente dal processo di fonazione.

Questo è il meccanismo:

  • aumento della pressione sottoglottica
  • allungamento della trachea
  • innalzamento laringeo
  • inclinamento della cartilagine tiroide
  • stiramento delle pieghe vocali
  • alterazione della frequenza

Al ritorno il procedimento si inverte, diminuzione della pressione, la laringe si abbassa, …

praticamente, come lo definisce l’amico Mauro Uberti, è un meccanismo di tipo meccanico-pneumatico.

inclinazione-periodica-nel-vibrato.jpg

CT=cart. tiroide CA=aritenoidi CC=cart. cricoide MST=muscoli sterno-tiroidei

E qui torniamo ad un recente mio commento sul rapporto EFFICIENZA-EFFICACIA delineato anche da Fussi:

distinguiamo subito EFFICIENZA vocale da EFFICACIA vocale:

una voce EFFICIENTE prevede il totale controllo fisiologico di tutto l’apparato per raggiungere in modo ADEGUATO lo scopo, es. parlare un’ora in una grande sala senza ampl, cantare lirica in un palco cercando di far “correre” la voce, essere intellegibili, etc = corretta gestione del meccanismo di fonazione

una voce risulta EFFICACE quando l’apparato si adopera per raggiungere lo scopo. In QUALSIASI modo = mancanza di coordinamenti pneumofonici (rapporto aria/voce) con conseguente danno

quando per qualsiasi motivo viene a mancare l’EFFICIENZA si passa all’EFFICACIA con conseguenti comportamenti abusivi

Come disse Stockhausen qualche decennio fa, ma vale ancora oggi, al produttore, al direttore artistico, all’impresario, non interessa la qualità, interessa un prodotto commercialmente vendibile che crei audience.

Consapevoli ed ammareggiati (soprattutto mia moglie, “intanto lei è lì che canta”) di aver ricevuto ulteriore conferma della sempre più drastica discesa del livello artistico lirico generale, abbiamo spento la TV.