Blog

2018年7月23日 Deep Clustering for Unsupervised Learning of Visual Features(視覚的特徴の教師なし学習手法Deep Clusterの提案)

■コメント
CNN(畳み込みニューラルネットワーク)で画像をクラスタリングする、Deep Clusterについての論文です。クラスタリングの基本的な手法であるk-meansとCNNを組み合わせたクラスタリング手法です。k-meansのクラスタリング結果をCNNの正解ラベルとみなして(疑似ラベル)、ネットワークの重みを更新していくというものです。重みの初期値がランダムでも、クラスタリングがそれなりに上手く行くのが大変興味深いですね。

■概要
クラスタリングは、コンピュータビジョンの分野で広範に適用、研究が進められている教師なし学習の一手法です。大規模なデータセットにおいて、クラスタリングが視覚的特徴のEnd-to-Endの学習に適用されるケースは多くありません。 本研究では、ニューラルネットワークのパラメータ、および抽出した特徴量をクラスタリングしたラベルを学習する、DeepClusterを提案します。DeepClusterは、基本的なクラスタリング手法であるk-meansにより特徴量を反復的にグループ化し、その結果を教師データとしてネットワークの重みを更新します。ImageNetやYFCC100Mなどの大規模データセットにおける、CNNの教師なし学習にDeepClusterを適用した結果、既存のState of the Artな手法と比較し、すべての標準的なベンチマークで大幅に上回る事を確認しました。

■論文URL
https://arxiv.org/abs/1807.05520

■著者/所属機関
Mathilde Caron / Facebook AI Research
Piotr Bojanowski / Facebook AI Research
Armand Joulin / Facebook AI Research
Matthijs Douze / Facebook AI Research

■投稿日
2018/07/15

■採択された学会名
ECCV 2018

一覧に戻る