課題1

目的

曲を mml で作り，それを wav ファイルに変換し，その音信号だけをもとに，もとの mml で作った曲を再現してみる．もっとも簡単な採譜． FFTW の使い方の練習．

手順

mml で「ドレミファソラシド」を作成．
mml2midi で midi に変換．
timidity で wav に変換．
wav ファイルに書かれた音声データをC言語処理する．
fftw を使い，短時間フーリエ変換．
周波数分布の（山の）ピークを読み取り，音名に解釈する．
時間軸を少しずらして，同じことをする．

例

mml で「ドレミファソラシド」を作成．
doremi.mml
```
A C1 cdefgab>c
```
mml2midi で midi に変換．
doremi.mid
```
% mml2mid doremi.mml
```
timidity で midi ファイルを聞いてみる．
```
%timidity doremi.mid
```

timidity で midi データを wav ファイルに変換．
doremi.wav

%timidity -Ow -A 500 doremi.mid      # 引数 （-A 500 ）は，音量を 500% にする指定．

audacity で波形を見る．
```
%audacity doremi.wav
```
wav ファイルに書かれた音声データをC言語で読み込み処理する． octave などを使えば楽ではある... でも後々のために C 言語で書こう．
fftw を使い，短時間フーリエ変換をおこなう．
周波数分布の（山の）ピークを読み取り，音名に解釈する．

octave を使う方法．

octave: > sig = wavread('doremi.wav');
Input file 'doremi.wav' is RIFF format:
        Total length = 1056676 bytes
        Number of channels = 2
        Sampling rate = 44100 Hz
        Data length = 528320 samples

ステレオなので sig は2チャンネル分ある．めんどうなのでモノラルにしよう．

octave: > sig = sig(:,1);
octave: > whos                       # 変数がどうなっているか確認
octave: > fs = 44100;                # サンプリング周波数 （CD と同じ）
octave: > a = size(sig)(:,1) -1;     # a にはデータの数 -1 が入る．
octave: > t = 0: 1/fs : a/fs;        # 横軸の作成．
octave: > plot (t,sig.')
octave: > sound(sig, fs);            # 作った信号の音を聞いてみる (3秒間)


octave: > Y = fft(sig, 1024);        # 最初の1024個のデータをフーリエ変換
octave: > f = (0:512)/1024*44100;    # 周波数軸を作成
octave: > plot(f,20*log10(abs(Y(1:513)))); # フーリエ変換後のデータを表示（絶対値）


octave: > sp = fft(sig(16001:17024).*hamming(1024));
octave: > f = (0:512)/1024*44100;
octave: > plot(f,20*log10(abs(sp(1:513))));
octave: > [x, ix] = max(20*log10(abs(sp(1:513))))
x = 34.457
ix = 7 
octave:15> ix/1024*44100
ans = 301.46     # ピークの周波数

octave: あとは for 文で回せばよい．
transcription.m

sig = wavread('doremi.wav');
sig = sig(:,1);
fs = 44100;                # サンプリング周波数 （CD と同じ）
# nf = 4096;
nf = 8196;
a = size(sig)(:,1) -1;     # a にはデータの数 -1 が入る．
t = 0: 1/fs : a/fs;        # 横軸の作成．
f = (0:nf/2)/nf*44100;
for i = 1:4410:(size(sig)-nf/2)   # 0.1 sec おきに測定
        sp = fft(sig(i:i+nf-1).*hamming(nf));
#       sp = fft(sig(i:i+nf-1));
        [x, ix] = max(20*log10(abs(sp(1:nf/2+1))));
        peak = ix/nf*44100;
#       disp(i)
        disp(peak)
endfor

% octave transcription.m

263.65
263.65
263.65
269.03
269.03
295.94
295.94
295.94
295.94
333.60
333.60
333.60
333.60
333.60
355.12
355.12
355.12
355.12
355.12
355.12
398.17
398.17
398.17
398.17
441.22
441.22
446.60
446.60
441.22
500.40
500.40
500.40
500.40
995.42
532.69
527.31
527.31
527.31
527.31
527.31
495.02
1049.2
527.31
527.31
527.31
500.40
527.31
527.31
495.02
527.31

少しおかしい。どこがおかしいか考えてみる。

nagumo.m lsode-f1.m