2019 AI記事10選(翻訳)

下記の日本語訳。まとめ方が良い。
https://www.topbots.com/top-ml-research-papers-2019/

 

4. ON THE VARIANCE OF THE ADAPTIVE LEARNING RATE AND BEYOND, BY LIYUAN LIU, HAOMING JIANG, PENGCHENG HE, WEIZHU CHEN, XIAODONG LIU, JIANFENG GAO, JIAWEI HAN

・Abst
 学習率の自動調整は便利である。ここで、そのメカニズムを追求し、その問題の仮説を立てて検証する。さらに新しい手法も提案する。

・Summary
 学習率の自動調整は、学習の初期に局所解に陥る可能性があることを示した。warmupはこの問題が無いので良い→Rectified Adam(RAdam)の提案。

・Core Idea
 RAdamはSGD momentumのようにふるまう。

・その他の記事
https://github.com/arXivTimes/arXivTimes/issues/1347

 

4. XLNET: GENERALIZED AUTOREGRESSIVE PRETRAINING FOR LANGUAGE UNDERSTANDING, BY ZHILIN YANG, ZIHANG DAI, YIMING YANG, JAIME CARBONELL, RUSLAN SALAKHUTDINOV, QUOC V. LE

・Abst
 BERTはマスクの事前学習をするが、その依存関係を無視し、fintuneとの不一致に苦しむ。これを克服すべくXLNetを提案した。XLNetでは、1)要素の順番の期待値の最大化の学習を行い、2)自己回帰の式の制限を克服した。

・Summary
 Transformer-XLとBERTを組み合わせた。

・Core Idea
 有りうる語順の期待値を最大化する。

・その他の記事
https://github.com/arXivTimes/arXivTimes/issues/1289
 

 

6. ALBERT: A LITE BERT FOR SELF-SUPERVISED LEARNING OF LANGUAGE REPRESENTATIONS

・Abst
BERTなどは重いため、二つのパラメータ削減テクニックを導入した。また、文章の一貫性に着目した自己教師あり学習も利用する。

・Summary
A Lite BERT (ALBERT)。factorized embedding parameterization、cross-layer parameter sharing、sentence-order predictionを導入した。

・Core Idea
有りうる語順の期待値を最大化する。
factorized embedding parameterization:隠れ層の巨大な単語梅恋を二つの小さな行列に分解する。
cross-layer parameter sharing:すべてのacross layer(隣のレイヤ)においてパラメータを共有する?
sentence-order prediction:正解のデータセットはそのままに、不正解のデータセットは、正解例の順序を逆にしたものを使用します

・その他の記事
https://github.com/yoheikikuta/paper-reading/issues/38
https://qiita.com/IwasakiYuuki/items/01333a4e4766f5ebcd28 

 

7. TRANSFERABLE MULTI-DOMAIN STATE GENERATOR FOR TASK-ORIENTED DIALOGUE SYSTEMS

・Abst
 ドメインオントロジーの依存とドメイン間知識共有の欠如は大きな問題だ。既存手法は、推論時に未知のスロット値にはまったり、新しいドメインに移すときに問題になる。提案するTRADE(Transferable Dialogue State Generator)は、コピーメカニズムを利用して対話状態を発話からから生成する。またこれにより、学習時に遭遇しないトリプレット(domain, slot,value)を推定するとき、知識の転送をを促進する。モデルは、発話エンコーダ、スロットゲート、ステイトジェネレータからなり、これらはドメイン間で共有される。

・Summary
 ドメインオントロジへの依存多寡とドメイン間の知識共有に対応。実際のシナリオでは、たくさんのスロットは異なるドメインで値を共有している(場所スロットではレストラン、ホテル、タクシーなど色々なドメインで存在する)。筆者はTRADEを提案。これは、文脈で強調されるスロットゲートとコピーメカニズムを利用し、スロットの値を対話履歴のどこでも追跡する。TRADEはドメイン間でパラメータを共有し、過去の未知のスロットの値追跡すること可能にする事前に定義されたオントロジーを必要としない。

・Core Idea
- ドメインへの依存多寡とドメイン間の知識共有のために
 - それぞれの事前定義されたオントロジーの用語の確率を推定する代わりに、直接スロットの値を生成する
 - ドメイン間でパラメータを共有する
- TRADEの構成コンポーネント
 - 発話エンコーダは対話の発話を固定長ベクトルにエンコードする
 - スロットゲートは対話により特定のペア(domain, slot)がトリガーされるか予測する
 - ステージジェネレータは、全てのペアを独自に一致するために、複数の出力トークンをデコードする。

・その他の記事
https://github.com/arXivTimes/arXivTimes/issues/1330
https://medium.com/engineering-dialogue-system/%E8%AB%96%E6%96%87%E8%A6%81%E7%B4%84-acl-2019-transferable-multi-domain-state-generator-for-task-oriented-4e0ab566eea4 

 

8. A THEORY OF FERMAT PATHS FOR NON-LINE-OF-SIGHT SHAPE RECONSTRUCTION

・Abst
 我々は、可視シーンとtransientカメラのパスにない未知物体の間の光のフェルマーパスの最新の理論を紹介します。これらのライトパスは、スペクトル反射に従うか物体境界で反射され、隠れた物体の形状をエンコードします。
...

 

9. SOCIAL INFLUENCE AS INTRINSIC MOTIVATION FOR MULTI-AGENT DEEP REINFORCEMENT LEARNING,

 ・Abst
 我々は、マルチエージェント強化学習で調整とコミュニケーションを達成する統一されたメカニズム提案する。報酬を受けたエージェントを通して、他のエージェントにも影響を及ぼしていく。この因果関係はcounterfactual reasoningにより評価される。それぞれのタイムステップで、エージェントは取りうる行動をシミュレーションして、他のエージェントに与える影響を調べる。他のエージェントに与える影響が大きいほど、高い報酬が与えられる。これは行動間の高い相互情報を持つことと同一だ。

・Symmary
 この論文では、MARLの内的社会的モチベーションの誘発を考える。このアプローチでは、他のエージェントに影響を与える行動が高い報酬を得る。これによりエージェント間の相互情報交換が促進される。

 

10. LEARNING EXISTING SOCIAL CONVENTIONS VIA OBSERVATIONALLY AUGMENTED SELF-PLAY

・Abst
 AIエージェントが効果的に人間に寄与するには、存在する習慣に沿った行動を取る必要がある(渋滞ではどうナビゲーションするか、どの言語を話すのか、チームメイトとどう調整するのか)。エージェントの学習ポリシーに、既存グループに参加した際の考慮を考える。MARLでは学習中は高成績でも、実際のグループに入ると失敗することもある。小数のサンプルからグループの慣習を見つける方法を提案する。

・Core Idea
 observationally augmented self-play(OSP)を提案。目的と一緒に、社会的行動の少数のペア(状態、アクション)を与えて、学習させる。

 

単語
Pursuing:追及する
rectifies:修正する
tractable:扱いやすい
neglects:無視する
discrepancy:不一致
pros and cons:長所と短所
factorization:因数分解
coherence:一貫性
ontology:知識をあるドメイン内の概念と概念間の関係のセットとみなしたときの形式的表現
slot:小さい穴
utterances:発言
facilitating:促進する
imperative:命令的
dialogue:対話
utterance:発話
Fermat:フェルマー
transient:瞬間的な
unified :統一された
coordination:調整
Causal :因果
counterfactual:反事実的条件文 
alternate:代わりとなる
conventions:習慣