ぱろすけ's website

佐村河内識別システム

概要

近年、自称作曲家・佐村河内守氏と外見の酷似した人物が増加し、彼らと佐村河内氏とを自動的に見分けるシステムの開発が望まれている。一方で、佐村河内氏は作曲時と謝罪会見時で大きく外見的に変化することが知られており、佐村河内氏を見分けるシステムはそのような変化に頑健である必要があるため、実現は容易ではない。本プロジェクトでは、高度なコンピュータ技術を活用し、佐村河内氏を適切に見分けるシステムを開発する。

赤枠が佐村河内守氏です。

さあ佐村河内氏はどれ?

背景

自称作曲家・佐村河内守氏が世間を賑わせている。佐村河内守氏が引き起こした様々な問題のうちもっとも厄介なものは、「佐村河内守氏にそっくりな人物が多すぎる」ということである。たとえば、ミュージシャンの Revo 氏は知らない人に「あなたのCDはもう二度と買いません」などと言われるなどの風評被害を訴えており、漫画家のみうらじゅん氏についてもタクシー運転手から「佐村河内さんでしょ?」と執拗に問い詰められるなどの被害を報告している。また、京都大学の卒業式では佐村河内守氏が2人登場するなど、佐村河内守氏にそっくりな人物の増加とそれに伴う風評被害が大きな社会問題となっている。

以上の社会情勢を踏まえると、佐村河内守氏かそうでないかを自動で見分けるシステムの開発の必要性が急務であると考えられる。

佐村河内守氏

Revo 氏

みうらじゅん氏

京都大学卒業式

しかしながら、そのようなシステムの実現はそれほど容易ではない。なぜならば、佐村河内氏は作曲時と謝罪会見で大きく姿を変えることが知られているからである。この謝罪会見の劇的ビフォーアフターについて、「全然誰だかわからなかった」などのコメントが聞かれる一方で「没個性すぎてこれはこれでいろいろな人に似ている」などの意見もあり、新たな風評被害を生む可能性がある。

そのため、佐村河内氏を適切に見分けるシステムは、そのようなイメチェンにも適切に対処できなければならない。これが、問題を困難にし、これまで佐村河内氏を識別するシステムの実現を阻んできた主要な要因のひとつである。

通常時

謝罪会見時

問題設定

以上、「佐村河内氏を適切に識別するシステムが必要であること」及び「そのようなシステムはイメチェンにも適切に対処できる必要があること」を説明した。これらを踏まえ、ここでは機械の解くべき佐村河内問題を次のように定義する。

“佐村河内画像 (通常時) および非佐村河内画像 (通常時) を用いて佐村河内氏の外見を学習し、その学習結果を用いて佐村河内画像 (謝罪会見時) および非佐村河内画像 (謝罪会見時) のそれぞれから佐村河内度を算出し、佐村河内氏本人の画像に対してもっとも高い佐村河内度をつけること。”

この問題を正しく解くことができるようなシステムは、「通常時でも謝罪会見時でも佐村河内氏を正しく判別でき、かつイメチェンにも対応が可能である」という性質を持つ。そのため、本プロジェクトではこのような問題を解くシステムを構築することを目的とする。

これらから佐村河内らしさを学習

どれがもっとも佐村河内らしいか?

先行技術及び手法

顔認識に関しては従来より様々な手法が提案されている。ここでは最近の成果を2件取り上げる。

Fisher Vector Faces [Simonyan et al. BMVC 2013] では、一般の物体の認識に用いられる Fisher Vector (FV) と呼ばれる手法を顔画像へと適用し、顔のパーツを明示的にモデリングせずに、高精度の識別結果を記録した。顔の領域を検出し、顔の向きを合わせるなどの前処理を行った後は、ただ通常の物体認識と同様の手続きを適用するのみである。

DeepFace [Taigman et al. CVPR 2014] は Facebook 社の発表した研究であり、「ほぼ人間並みの識別能力を実現した」として大きな注目を集めた。こちらでは、顔検出と向きの補正を行った後に、Deep Convolutional Neural Networks (DCNN) と呼ばれる手法を用いて識別を行う。こちらも一般の物体の認識に用いられる手法であり、一部に独自の改良を施してはいるが、処理の大筋は顔画像に限るものではない。

Simonyan et al.

Taigman et al.

本プロジェクトでは、上記事例に倣い、顔画像に対して Fisher Vector 及び Deep Convolutional Neural Network を適用する。Fisher Vector については SVM の算出する自信度を、Deep Convolutional Neural Networks については出力層の出力する数値を佐村河内度と定義する。

実験結果

上記手法を実際の佐村河内画像群に対して適用した。佐村河内画像群 (通常時) を用いて学習を行い、その結果を用いて佐村河内画像群 (謝罪会見時) の佐村河内度を算出した。結果は以下の通りである。

どちらの手法においても、佐村河内氏本人の画像の佐村河内度がもっとも高くなっている。特に Deep Convolutional Neural Networks においては佐村河内画像と非佐村河内画像との佐村河内度の差は大きく、かなりの自信度を持って佐村河内氏の判定が行えていることが確認できる。

学習に用いた画像は、ほとんどが似たようなサングラス及び髪型であり、そこから佐村河内氏を見分けるためにはサングラスや髪型ではない部分の特徴を捉える必要がある。そのように訓練された学習器は、サングラスや髪型が大きく変化していたとしても、それ以外の特徴を活かして正しく佐村河内氏を識別できたものと考えられる。

結論と展望

本プロジェクトでは、佐村河内画像群 (通常時) のみを用いて機械に佐村河内氏の顔を学習させ、そのような機械が佐村河内画像群 (謝罪会見時) から佐村河内氏を正しく見分けられるようなシステムを実現した。通常時と謝罪会見時では佐村河内氏の外見は大きく変化しているが、そのような変化に影響されることなく機械は佐村河内氏を選出することが可能である。これは驚くべき結果である。

本プロジェクトの最大の問題点は、そろそろ佐村河内氏も忘れ去られつつあるという事実である。しかしながら、佐村河内問題の本質はそっくりさん判別による風評被害の防止であり、適用先は佐村河内氏のみに限らない。今後は、ニュースサイトの記事などを用いて外見の類似が原因となっている風評被害を自動で検出し、そして自動で判別を行うシステムを構築するなどの発展が期待される。

参考文献


Copyright (C) 2014-2016 ぱろすけ. All Rights Reserved.