FaceNet: A Unified Embedding for Face Recognition and Clustering

Abst.
 顔画像を直接近さが測れるユークリッド空間に落とせるFaceNetを開発した。これにより、顔認証やクラスタリングができてうれしいよ。

1. Inrto
 顔画像をDeepで埋め込みベクトルにして、顔の近さ=L2距離にする。
 今までボトルネック層を使ってたけど、間接的だし、次元が多き過ぎる。
 トリプレットを利用して、直接埋め込み用のモデルを作る。
 トリプレットの選び方が大事でした。

3. Method
3.1 Triplet Loss
 埋め込み空間のノルムは1に制限する。
3.2 Triplet Selection
 ハードポジティブは、アンカーと一番距離が離れたポジティブ。ハードネガティブはアンカーと最も近いネガティブ。
 オンラインでミニバッチからサンプリングしてくる。
 最もハードなポジティブを選ぶ代わりに、ハードネガティブを選択しながら、ミニバッチ内の全てのアンカーポジティブペアを使用します。
 セミハード:αよりは近いが、依然として、pよりは遠いnを利用する。ハードネガ底部を使うと、長さ0の局所解に落ちる可能性がある。