マイクロソフト(Azure Machine Learning)の画像解析でHow Old.net(https://how-old.net/)が有名ですが、他にもユーザー自身が利用できる画像解析サービスがあります。
それはproject oxfordです。
http://www.projectoxford.ai/
今回紹介する画像解析以外にもSpeech to Textなどもあります。
画像解析は、技術的にも難しく、例えば画像投稿サイトではアダルトなどの不正な画像の投稿との対応に多くの工数を使っていますが、project oxfordではAPIに画像を送るだけで、判別をしてくれるサービスです。
独自で構築するのと違い、このサービスを利用する大量のデータに基いてどんどん学習されるため、非常に有用性の高いことが特徴です。
それではProject Oxfordの画像解析でどんなことができるかを見ていきます。
機能紹介
大きく以下の機能を提供しております。
顔検出(写真から顔の部分を検出します)
顔認識(2つの顔写真の類似度を検出します)
OCR(画像内の文字の検出)
サムネイル作成
画像解析
それぞれの詳細は以下となります。
1. 顔検出
画像から人の顔の場所を見つけます。
単に顔を見つけるだけでなく、その中の目や鼻、唇の端といった情報まで見つけ出してJsonフォーマットで出力してくれます。
よくデジカメにあるような顔判別だけでなくパーツの座標まで教えてくれるのが特徴です。
2. 顔認識
2つの顔写真を比較し、
・同一人物であるか?
・その信頼性
を判断してくれます。
上記の画像でわかるように、人間であれば判断が難しい帽子の有無にも的確な回答をしています。
変装を見破るといった防犯的な意味はもちろん、自分と小栗旬さんがどのくらい似ているかを再確認するためにも使えます。
3. OCR(Optical Character Recognition)
画像内にある文字を読み取ってくれます。
上図にもあるように、単に文字を読み取ってくれるだけでなくその言語や文字の方向などを読み取ってくれます。
また、各単語の検出された位置情報まで把握してくれます。
これは日本語にも対応しており、スキャンデータからの文字起こしなどに使ってみたいですね。
4. サムネイル作成
ぱっと見るとなんのことかと思うかもしれませんが、かなりすごい機能です!
なんと画像の中から中心となるオブジェクト(対象)を見つけ出して、そこを中心にしたサムネイルを自動作成してくれます。
左下のチェックを外してしまうと単に中心からとなりますが、チェックをオンにすることで上図のように中心となる対象を探して、最適化してくれます。
大量の画像をブログやFacebook用に最適化するといったことで役立ちそうですね。
5. 画像解析
http://www.projectoxford.ai/demo/visions#Analysis
最後が画像解析です。
これは、スゴイです。実際にサイトで見て欲しいですが、画像に対して
・アダルトコンテンツか?
・みだらなコンテンツか?
といった冒頭にも紹介したように画像投稿サイトだと課題になる機能はもちろん、その画像が何であるか(上図の画像では、人以外にもアウトドアーなどとも判断されています)といったことまでしてくれます。
これは不正が当投稿対策はもちろん、画像への自動タグ付けなど様々な用途で期待されますね。
いかがでしたでしょか?
画像認識というとGoogleが有名ですが、Azureの画像認識もかなりレベルが高いです。ぜひ興味がある人はサイト上で確認して欲しいです。
ナレコムクラウドでは機械学習を含めたAIやロボットといった事に興味があるエンジニアを募集しております。
未経験の方でも興味がある方はお気軽にお問い合せ下さい。