Learning Deep Learning

「离开世界之前 一切都是过程」

Pythonで学ぶ音声合成(その1)

https://book.impress.co.jp/books/1120101073 読み始めた。ひとまず2章まで。 まだ数式は出てきていないがフーリエ変換でダメージを追った。 https://www.itd-blog.jp/entry/voice-recognition-10#1-Pythonでスペクトル解析 このサイトの説明が好きだった。 (実際に正弦波をフーリエ変換してみる例。...

QiitaのLGTM数を予測したい(その2:一応Webで動くところまで)

https://deeplearning.tnantoka.com/entry/2020/06/01/232656 の続き。 思ったより精度が全然あがりませんでしたが、なんとか形になりました。 参考にしたのは、以下のBERTによる実装。 https://ascii.jp/elem/000/004/002/4002417/ 結果はこんな感じです。 1 9562/9562 [====...

QiitaのLGTM数を予測したい(その1:ベース作り)

歌声合成をやりたくて(再)勉強しはじめたディープラーニングですが、 全然歌声に辿り着く気配がありません。 あまりにもアウトプットがなく、やる気がなくなってしまいそうなので、 情報が豊富な自然言語処理をやってみようと思います。 題材としてQiitaのLGTM数を使って「タイトルが受けそうか」を予測してみます。 まずはベースづくりです。 データ 2019-01-01〜2020-0...

Fashion MNISTからGANで画像生成

以前、MNISTの生成をHeroku上で動くようにしました。 https://deeplearning.tnantoka.com/entry/2020/04/20/225508 理論上はFashion MNISTでも動くはずだよな、ということで試してみました。 結果はこちら。 https://hello-deeplearning.herokuapp.com/examples/fa...

コーラスっぽい音声を合成(ディープラーニングではない)

「歌声を合成する」というトピックが載っている唯一無二(?)の本、ということで以下を読んでいます。 https://www.ohmsha.co.jp/book/9784274068942/ 前書きでは「プログラミングができれば数学苦手でも大丈夫だよ」というノリですが、普通に数式で殴られ続ける硬派な本です。 4.7が「歌声の合成」となっているわけですが、ディープラーニングではなく、 198...

ノイズから母音を合成

世の中ではAIが流暢に話すのが当たり前になりつつありますが、ここでやるのは単純なノイズにフィルタを書けて母音っぽくするという単純なものです。 ノイズの生成 合成の元となるノイズです。 参考文献「https://www.jstage.jst.go.jp/article/jasj/73/4/73_230/_article/-char/ja/」の pulse_train.wav に似せて作りま...

サイン波の重ね合わせ

引き続き「ゼロからはじめる音響学」を読んでいます。 http://floor13.sakura.ne.jp/book07/book07.html 今日はサイン波の重ね合わせをやってみました。 まずは結果から。 https://soundcloud.com/user-255261297-724174099/sets/hello-acoustics-2 1は単体で、2以降は2・3・4倍...

NumPyとSciPyでサイン波とドレミ

またまたDeep Learningではありませんが。 音のことを何も知らないので、この本を読んでいます。 https://www.kspub.co.jp/book/detail/1565296.html ソースコードがない本なのですが、どうやら同じ著者による以下の本と内容が似ているらしく、こちらのソースコードが参考になります。 https://gihyo.jp/book/2013/9...

Hello, WORLD!

ディープラーニングとは直接の関係はないですが、ゆくゆくは音声系の何かしらをやりたいのでWORLDを触ってみます。 http://www.kki.yamanashi.ac.jp/~mmorise/world/index.html 参考にしたのはこちらの記事です。 https://qiita.com/ohtaman/items/84426cee09c2ba4abc22 結果がこちら。 ...

MNISTの手書き文字認識と生成をHerokuで

WaveNetのサンプルが載っているということで、以下の本を読んでいます。 https://www.oreilly.co.jp/books/9784873118260/ 第4章の途中までの内容を使って、 MNISTの文字認識と、GANを使った生成をブラウザ上で動くようにしてみました。 https://hello-deeplearning.herokuapp.com/ ※ 普段はスリー...