ゼロから作るDeep Learning2(その2)

「ゼロから作るDeep Learning2」の続きメモ。

 

「5章 リカレントニューラルネットワーク(RNN)」

参考動画

www.youtube.com

参考情報

deepage.net

RNNは、時系列データを扱う。文章は、分散表現された単語が並んでいるため時系列データとなる。ネットワークとしては、ニューラルネットを次から次へつなげていくだけのもになる。単語がつならりその結果が、文章の分散表現となる。

この章で出てくる「Truncated BPTT」という学習方法を覚えておくとよい。OpenNMT-pyの学習でも使用している。

順伝播のつながりは維持し、逆伝播のみ適当な長さで切り離して学習を行う。

 

「6章 ゲート付きRNN」

参考動画

www.youtube.com

単純なRNNだと学習時の勾配が消失してしまったり、爆発してしまったりしてしまう。

なかなかうまくいかないものだ。そこで、適当にゲートをつけて、次のニューラルネットに送ったり遅らせなかったりするゲートを入れる。電子回路のラッチのような構成になる。このゲートの開け閉めの塩梅を学習させる。