Abst.
顔画像を直接近さが測れるユークリッド空間に落とせるFaceNetを開発した。これにより、顔認証やクラスタリングができてうれしいよ。
1. Inrto
顔画像をDeepで埋め込みベクトルにして、顔の近さ=L2距離にする。
今までボトルネック層を使ってたけど、間接的だし、次元が多き過ぎる。
トリプレットを利用して、直接埋め込み用のモデルを作る。
トリプレットの選び方が大事でした。
3. Method
3.1 Triplet Loss
埋め込み空間のノルムは1に制限する。
3.2 Triplet Selection
ハードポジティブは、アンカーと一番距離が離れたポジティブ。ハードネガティブはアンカーと最も近いネガティブ。
オンラインでミニバッチからサンプリングしてくる。
最もハードなポジティブを選ぶ代わりに、ハードネガティブを選択しながら、ミニバッチ内の全てのアンカーポジティブペアを使用します。
セミハード:αよりは近いが、依然として、pよりは遠いnを利用する。ハードネガ底部を使うと、長さ0の局所解に落ちる可能性がある。