Hello, WORLD!

ディープラーニングとは直接の関係はないですが、ゆくゆくは音声系の何かしらをやりたいのでWORLDを触ってみます。

参考にしたのはこちらの記事です。

結果がこちら。

scipy.io.wavfile.write を使ってファイルを書き出して再生してもよい

ということで、

wavfile.write('synthesized.wav', fs, synthesized)

で書き込んだデータを再生したら爆音で耳が死にかけました。

なぜ？と思って出力ファイルを見てみると Bits per sampleが16から64に変わっていました。（そのせいで音が大きくなる原理はまだわかっていない）

The bits-per-sample and PCM/float will be determined by the data-type.

型によって自動判別されるようです。

wavfile.write('synthesized.wav', fs, synthesized.astype(np.int16))

として爆音問題は解消しました。