Free or Open Source audio/software – up-to-date

I am very stupid.

I was sure I have already inserted these extraordinary free audio tools for vocal and sound analysis (unfortunately only for Win) from UCL.

Ok, I’m doing now!

from UCL: SFSystem
from UCL: SFSystem

They are like many other applications, but some of them can offer to you many little surprises.

For vocal analysis I suggest: Continue reading “Free or Open Source audio/software – up-to-date”

SoundCopy per Win

clipped from www.measureandconvert.com

SoundCopy enables you to record, save, playback and compress voice, music and other sound. Recording time is limited only by the amount of hard disk space
available. SoundCopy can receive input from CD, the Internet (audio files you’ve downloaded or streaming audio), microphone, cassette player or any other line-in
source. You can use SoundCopy for recording meetings, conversations and dictation. You can use it to make digital back-ups of your audio tapes. You can set it to automatically record a radio program when you’re not there – the possibilities are endless.

 

 

Ecco il link al sito, con tutte le spiegazioni del caso.

 

 

Madde e le formanti vocali

Trovo questo software semplicemente fantastico.
Se voglio giochicchiare con le formanti per sentire quanto il loro cambiamento possa influire sulla produzione delle vocali, non c’è di meglio.
Prima di dare un’occhiata al clip che ho realizzato, sono doverose alcune chiarificazioni:

  • formante = concentrazione di energia in una banda frequenziale comprendente una o più componenti armoniche
  • Q = parametro variabile relativo a un intervallo frequenziale – campana – che ne indica “visivamente” la larghezza
by hyperphysics

Alcuni aspetti interessanti della struttura formantica:

  • le prime due formanti contengono sufficienti informazioni affinchè il nostro sistema di audio-codifica identifichi e classifichi un timbro vocalico, ma non nella sua qualità
  • ciascuna delle 7 vocali della lingua italiana prevede almeno 5 formanti, situate in zone frequenziali ben precise
  • la frequenza della prima formante F1 è in relazione con l’ampiezza dell’apertura della bocca
  • la frequenza della seconda formante F2 è determinata dalle diverse posizioni della lingua
by Mauro Uberti

In quest’altra immagine abbiamo una chiara visione spettrografica di F1 e F2 e loro variazioni per ciascuna vocale:

Il commento di Mauro Uberti all’immagine precedente:

le sette vocali della lingua italiana sintetizzate per chiarezza di esposizione come se fossero cantate da un basso sulla stessa nota fa1 (= 87,30 Hz): in alto lo spettrogramma dell’esempio vocale; nella colonna sinistra gli schemi degli atteggiamenti articolatori, ricavati da radiografie; nella colonna destra gli spettri delle sette vocali. Nello spettro di ogni vocale si riconoscono facilmente i gruppi di armonici dall’aspetto di picchi montagnosi, chiamati “formanti”. Nello spettrogramma le stesse formanti appaiono come annerimento degli stessi gruppi di armonici.

 

Immagine a sinistra:

sono raffigurate le frequenze delle prime due formanti di tutte e 7 le vocali, con relativo assetto del tratto vocale.

La cosa interessante è che per ogni vocale la posizione delle formanti non cambia pur variando la frequenza che si sta emettendo.

Ciò che fa la differenza è la diversa quantità di informazioni contenute in ciascuna formante; nella figura qui sotto si nota come emettendo la stessa vocale <a> su frequenze diverse si determinino identiche formanti ciascuna con una quantità diversa di componenti armoniche. Ciò avviene in quanto aumentando la frequenza, il primo armonico si sposta visivamente verso destra, e così tutti gli armonici successivi, che sono suoi multipli interi.

Questo è anche uno dei motivi per cui facciamo più fatica a notare differenze timbriche tra due soprani piuttosto che tra due bassi.

Tornando alla figura di sinistra, Mauro Uberti fa notare una cosa molto interessante: il picco della prima formante aumenta di frequenza dalla <i> fino alla <a>, per poi decrescere e tornare alla posizione di partenza dalla <a> alla <u>.

Il motivo è semplice quanto affascinante: F1 (prima formante) è in relazione anche con l’ampiezza della cavità faringea (dietro la lingua per intenderci), che in effetti, osservando la figura, prima diminuisce e in seguito aumenta.

Idem dicasi per le posizioni di F2 che si posiziona attorno ai 2700 nella <i> (cavità buccale piccola) e man mano scende fino ai 700 Hz nella <u> (cavità buccale ampia).

 

 

 

 

 

 

 

 

Per contro è interessante notare, come già menzionato, come al variare della frequenza di una medesima vocale le formanti cadano sempre nelle medesime bande frequenziali:

1143.jpg

Graficamente vi è un modo molto semplice per coordinare l’azione delle prime due formanti F1 e F2 il cui rapporto determinerà le diverse vocali, ovvero si prende un piano cartesiano e sull’asse x si dispongono le frequenze di F1 e sull’asse y le frequenze di F2, in questa maniera:

f1-f2.png

ho cerchiato in rosso molto approssimativamente le coordinate delle prime due formanti, nel senso che ad esempio la vocale <è> emessa da voce liricamente ben impostata potrebbe risultare come F1=600 Hz e F2=1500 Hz.

Risulta essere quindi una traccia molto indicativa utile soprattutto per sperimentare con il sopracitato software gratuito del geniale Svante Granqvist, che potete scaricare liberamente qui, purtroppo solo per win.

Vediamo solamente alcune funzioni di base:

madde.png

  • Cliccando sul triangolino grigio sulla barra degli strumenti avvio il synth vocale
  • cliccando sulla tastiera musicale cambio frequenza
  • sotto la barra degli strumenti posso selezionare le formanti che mi interessano (max 6)
  • ancora sotto posso cambiare il parametro Q per ogni formante (l’ampiezza della base del picco montagnoso)
  • sulla destra trovo il quadro degli armonici, l’ampiezza dei quali è modificabile by clicking

Cliccando su Settings/Show F1F2 map… si aprirà una finestra con rappresentazione cartesiana delle prime due formanti, sulla quale andrò a cliccare col tasto sinistro del mouse per modificare i valori di F1 e F2 e sentire le diverse vocali. Ecco il video, nel quale ho inserito solo alcune operazioni principali, per il resto lascio alla sperimentazione più totale.

Se in più scarico anche RTSect e lo avvio insieme a Madde, posso visualizzare in tempo reale un sonogramma con le variazioni formantiche.

.

.

Madde e i formanti vocali

Trovo questo software semplicemente fantastico.

Se voglio giochicchiare con i formanti per sentire quanto il loro cambiamento influisce sulle vocali, non c’è di meglio.

Prima di dare un’occhiata al clip che ho realizzato, sono doverose alcune chiarificazioni:

  • formante = concentrazione di energia in una banda frequenziale comprendente una o più componenti armoniche
  • Q = parametro variabile relativo a un intervallo frequenziale – campana – che ne indica visivamente la larghezza

 

fantvowred.gif

 

Alcuni aspetti interessanti della struttura formantica:

  • i primi due formanti contengono sufficienti informazioni affinchè il nostro sistema di audio-codifica identifichi e classifichi un timbro vocalico

  • ciascuna delle 7 vocali della lingua italiana prevede almeno 5 formanti, situati in zone frequenziali ben precise

  • la frequenza del primo formante F1 è in relazione con l’ampiezza dell’apertura della bocca
  • la frequenza del secondo formante F2 è determinata dalle diverse posizioni della lingua

Diamo ora un’occhiata a questa immagine:

vocali.jpg

sono raffigurate le frequenze dei primi due formanti di tutte e 7 le vocali, con relativo assetto del tratto vocale.

La cosa interessante è che per ogni vocale la posizione dei formanti non cambia pur variando la frequenza che si sta emettendo.vowp.gif

Ciò che fa la differenza è la diversa quantità di informazioni contenute in ciascun formante; nella figura qui a destra si nota come emettendo la stessa vocale <a> su frequenze diverse si determinino identici formanti ciascuno con una quantità diversa di componenti armoniche. Ciò avviene in quanto aumentando la frequenza, il primo armonico si sposta visivamente verso destra, e così tutti gli armonici successivi, che sono suoi multipli interi.

Questo è anche uno dei motivi per cui facciamo più fatica a notare differenze timbriche tra due soprani piuttosto che tra due bassi.

 

 

Tornando alla figura di sinistra, Mauro Uberti fa notare una cosa molto interessante: il picco del primo formante aumenta di frequenza dalla <i> fino alla <a>, per poi decrescere e tornare alla posizione di partenza dalla <a> alla <u>.

Il motivo è semplice quanto affascinante: F1 (primo formante) è in relazione anche con l’ampiezza della cavità faringea (dietro la lingua per intenderci), che in effetti, osservando la figura, prima diminuisce e in seguito aumenta.

Idem dicasi per le posizioni di F2 che si posiziona attorno ai 2700 nella <i> (cavità buccale piccola) e man mano scende fino ai 700 Hz nella <u> (cavità buccale ampia).

 

In quest’altra immagine abbiamo una chiara visione spettrografica di F1 e F2 e loro variazioni per ciascuna vocale:

1142.jpg

 

 

 

 

Uberti: le sette vocali della lingua italiana sintetizzate per chiarezza di esposizione come se fossero cantate da un basso sulla stessa nota fa1 (= 87,30 Hz): in alto lo spettrogramma dell’esempio vocale; nella colonna sinistra gli schemi degli atteggiamenti articolatori, ricavati da radiografie; nella colonna destra gli spettri delle sette vocali.

Nello spettro di ogni vocale si riconoscono facilmente i gruppi di armonici dall’aspetto di picchi montagnosi, chiamati “formanti”.

Nello spettrogramma le stesse formanti appaiono come annerimento degli stessi gruppi di armonici.

 

 

 

 

 

Per contro è interessante notare, come già menzionato, come al variare della frequenza di una medesima vocale i formanti cadano sempre nelle medesime bande frequenziali:

 

1143.jpg

 

Graficamente vi è un modo molto semplice per coordinare l’azione dei primi due formanti F1 e F2 il cui rapporto determinerà le diverse vocali, ovvero si prende un piano cartesiano e sull’asse x si dispongono le frequenze di F1 e sull’asse y le frequenze di F2, in questa maniera:

 

f1-f2.png

 

ho cerchiato in rosso molto approssimativamente le coordinate dei primi due formanti, nel senso che ad esempio la vocale <è> emessa da voce liricamente ben impostata potrebbe risultare come F1=1400 Hz e F2=1500 Hz.

Risulta essere quindi una traccia molto indicativa utile soprattutto per sperimentare con il sopracitato software gratuito del geniale Svante Granqvist, che potete scaricare liberamente qui, purtroppo solo per win.

Vediamo solamente alcune funzioni di base:

madde.png

  • Cliccando sul triangolino grigio sulla barra degli strumenti avvio il synth vocale
  • cliccando sulla tastiera musicale cambio frequenza
  • sotto la barra degli strumenti posso selezionare i formanti che mi interessano (max 6)
  • ancora sotto posso cambiare il parametro Q per ogni formante (l’ampiezza della base del picco montagnoso)
  • sulla destra trovo il quadro degli armonici, l’ampiezza dei quali è modificabile by click

Cliccando su Settings/Show F1F2 map… si aprirà una finestra con rappresentazione cartesiana dei primi due formanti, sulla quale andrò a cliccare col tasto sinistro del mouse per modificare i valori di F1 e F2 e sentire le diverse vocali.

Ecco il video, nel quale ho inserito solo alcune operazioni principali, per il resto lascio alla sperimentazione più totale.

 

 

Dimenticavo, se scarico anche RTSect e lo avvio insieme a Madde, posso visualizzare in tempo reale un sonogramma con le variazioni formantiche.

 

 

SpinDrum

Dall’interfaccia grafica credo che questo software sia stato concepito mediante Pure Data, una versione evoluta, più leggera e Open Source di Max/MSP (l’artefice è sempre David Zicarelli dell’IRCAM).

Da ixi-software

SpinDrum . version beta 0.9.1

The spindrum is a rhythm machine that can be used in such a general way that it is has nothing to do with rhythm anymore. It tries to explore non-conventional ways to sequence rhythms as well as to produce an interface that visually explains the underlying process.

Basically, you’ve got sets of 10 different “wheels” ranging from 1 to 10 sounds on each wheel. These wheels trigger the sound attached to them according to how many sounds are on the wheel. Pitch and panning can be controlled individually depending on the wheel’s location on the screen.

The combination of different objects creates evolving rhythms that can turn out to be extremely complex and interesting.

Download per Mac Classic
Download per Mac OSX
Download per Win

Ecco un video dimostrativo:

Sound Field

A differenza del Two-Dimensional Audio Mixer, simpatico programmino, questo Sound Field offre anche la possibilità di panpottare i suoni.

Ho realizzato questo clip dimostrativo:

All’interno della cartella Sound Field 1.2 troverete un file .exe, una cartella mp3, una cartella Prefs e un Read Me.

Sound Fields accetta al massimo 12 file audio mp3, è sufficiente inserirli nella cartella mp3 e manualmente nella cartella Prefs, che altro non è che un file di testo .txt, al quale basta aggiungere questa stringa per il primo file:

point(100, 200)/1/150/0.0000/0.0000/1.0000

e avendo l’accortezza di cambiare i valori 100 e 200 alla stringa successiva per non avere una sovrapposizione di due circonferenze.

Altro esempio:

dopo aver copiato/incollato tre file mp3 nella directory mp3, inserite queste stringhe nel file di testo

point(100, 200)/1/150/0.0000/0.0000/1.0000

point(300, 400)/1/150/0.0000/0.0000/1.0000

point(500, 600)/1/150/0.0000/0.0000/1.0000

e salvate, sapendo che i valori che a voi interessano sono

  • (x, y) = corrispondono alle coordinate del centro delle circonferenze
  • /150/ = dimensione del diametro di ogni circonferenza
  • i due valori /0.0000/ = coordinate del tondino verde (panpot), le quali possono assumere valori negativi (sinistra e sotto rispetto al centro

Un aspetto interessante è il fatto di poter utilizzare sia il cursore a tondino blu come miscelatore variabile nello spazio dello schermo, sia posizionarlo staticamente e spostare invece le circonferenze.

Per uscire, Esc.

Sono previsti dei shortcut da tastiera, provate con QWERTY e forse altri, non ho controllato.

Questi valori, che posso editare nel file di testo, cambieranno comunque utilizzando l’interfaccia come mostrato nel video, potendo poi salvare il tutto con Ctrl+S.

Per il download andate qui.

Hyperscore

A dir la verità in molti siti si dà notizia di questo didatticamente strabiliante software di composizione musicale. In effetti l’idea sembra buona, peccato che io non riesca a trovare il link per il download di un’ipotetica versione free tanto menzionata.

In ogni caso trovo i software della serie eJay molto superiori e più completi, anche se creati per scopi prettamente ludici.

Intanto gustatevi questo video dimostrativo:

hyperscore.png

Nuovo VLC 0.8.6 – miglior Player audio/video esistente

clipped from abtechno.org

Il progetto VideoLAN ha come obbiettivo lo sviluppo di programmi video gratuiti con licenza GNU, e recentemente ha rilasciato l’ultima versione 0.8.6 di VLC media player, già da tempo considerato il miglior player per file multimediali (audio/video) multipiattaforma disponibile.
Scaricato nella precedente versione da oltre 29 milioni di utenti, e attualmente al ritmo di una copia ogni 1.4 secondi, VLC è stato ulteriormente migliorato supportando “nativamente” i file WMP9, cioè tutti i file audio/video codificati per Microsoft Windows Media Video versione 9, e i file Flash Video, oltre a supportare anche la codifica Apple Remote nella versione OS X, e una migliore gestione del codec H.264.
VLC è ovviamente disponibile per tutti i sistemi operativi, qui trovi la panoramica completa con tutte le funzionalità e caratteristiche aggiornate.

  blog it

Inviti per Joost TV

Se qualcuno fosse interessato ad ottenere un invito come lasci un commento a questo post, vedrò di inoltrarvi il tutto quanto prima.

@@@@@@@@@@@

 

Ormai non si parla che di questo, molti blogger distribuiscono inviti per poter usufruire gratuitamente della versione beta di questo software che permette di godere in streaming di ciò che viene definita la TV del futuro.

In effetti l’idea sfornata dai creatori di Skype e Kazaa è veramente interessante, vedremo come sarà sviluppata e gestita.

 

Per ora i canali, gratuiti, non sono molti, però la qualità mi sembra buona, a patto di possedere un PC con buone prestazioni e connessione adsl, ed esiste anche la possibilità di interagire con altri utenti.

 

Per ogni canale è prevista la consultazione dei programmi orari e descrizione dei contenuti.

 

 

Se qualcuno fosse interessato ad ottenere un invito come lasci un commento a questo post, vedrò di inoltrarvi il tutto quanto prima.

 

 

Hi-Q Recorder

Permette di registrare qualsiasi suono passi per la scheda audio, streaming, mic, quick time, wmp, realp, , winamp etc.

Essendo una versione free può salvare solo in mp3, per fortuna con bitrate a scelta, in stereo o mono, con recording time illimitato (sempre in funzione però della memoria del vostro PC). Gira solo su windows. Trovate il link per il download in questa pagina.

Wave Surfer

Considero questo software come uno dei più completi e versatili tra gli open source/free, molto simile a Speech Tools, di cui abbiamo già parlato, ma gira anche su Linux e Mac.

Una volta lanciato il programma apparirà questa schermata:

ws1.jpg

 

Per prima cosa cliccate nella barra dei menù su Help/About Plug-ins e installate i plug-ins available. In questo modo renderete il software molto più versatile.

Caricate una forma d’onda col solito File/Open (praticamente di tutto, wav, mp3, aif, aiff, au, raw, snd, ogg, smp, sph, …, nonchè avi, mov, mpg, mpeg, mp4, dv, …), e vi apparirà questa finestra:

 

ws2.jpg

a questo punto potete sperimentare le varie opzioni, ad esempio Demonstration, ed otterrete questo:

ws32.jpg

(cliccate per ingrandire)

Col tondino rosso voglio farvi notare la possibilità di poter visualizzare sia una stima formantica della forma d’onda (LPC – Linear Predictive Coding) sia un’indagine FFT (analisi dello spettro).

A questo punto cliccando col tasto dx del mouse in un punto qualsiasi ad esempio della forma d’onda, potrete integrare il tutto con l’apertura di altri pannelli:

ws4.jpg

ed ottenere visualizzazioni differenti secondo necessità.

 

 

 

La sezione Documentation è ben fornita ed esauriente, l’importante per prendere dimestichezza è sperimentare.

Eccovi il link e buon divertimento.

Overtone Analyzer

Semplice ma funzionale questo software, purtroppo solo per win 2000/XP.

Nato come supporto per overtone singers, risulta comunque utilissimo per chi voglia sperimentare e analizzare il suono vocale nella sua generalità.

I due tools principali sono ovviamente lo spectrogram e l’analizzatore di spettro, resi funzionali grazie al supporto di due tools grafici, Staff view e Piano Keyboard (suona se vi si clicca sopra!), non indispensabili ma che risultano essere molto utili nell’identificazione visuale immediata di una frequenza nell’ambito del pentagramma e di una tastiera.

E’ stato bello notare come entrambi i tools grafici si possano visualizzare sia in senso verticale che orizzontale e in scala logaritmica o lineare.

Wow!
Non male per essere un programma free.

Tutto qui?

La sequenza degli armonici viene evidenziata da linee colorate.
Ad esempio gli armonici a distanza di ottava con linee rosse, i rimanenti con linee bianche (di default).
Vi sono delle labels (anch’esse suonano cliccandoci) che indicano, per ogni armonico, numero sequenziale, frequenza, nota musicale corrispondente (con variazioni in cent).

Non mi rimane che darvi il link al sito di Wolfgang Saus

Per il download è sufficiente spedire una mail specificando le motivazioni d’interesse per il software, dopodichè vi verrà consegnata una password per il login.

Speech Tools

Nel sito di Sil ho trovato una serie notevole di free software dedicati all’analisi fonologica.

Mi è sembrato molto interessante Speech Tools, supportato da un divertente ed esaustivo tutorial (in inglese).

speech11.JPG

Risulta utile anche a chi si occupa di audio-analisi, infatti prevede un’interfaccia grafica definibile a seconda delle diverse esigenze.

speech22.JPG


Finchè dura…

Ogni giorno Give away of the day offre un software in download gratuito.

Nulla di strano, se non fosse che i software non sono gratuiti ma hanno un costo, tranne che per un certo lasso di tempo.

In questo preciso istante, ad esempio, è disponibile un software gratuitamente per ancora 10 ore e 16 minuti, dopodichè tornerà ad essere a pagamento (circa 14$).