人工知能による顔認識の実際
Amazon Rekognition では、高精度な画像分析と動画分析をアプリケーションに簡単に追加できます。数々のテクノロジーの進歩と同様に、顔認識の仕組みを知り、どのように使われるか理解するのが重要です。最もよくある質問を見てみましょう。
顔認識とは何ですか?
顔認識とは、画像や動画から個人を特定するために構築されたシステムです。この機能は数十年間存在していましたが、ここ数年で使用が注目され、身近になりました。現在、個人写真のアプリケーションやモバイルデバイスの二次認証として使われるなど、革新的なソリューションの原動力となっています。これらの派生した機能を理解するためにも、まずは顔認識の仕組みについて見てみましょう。
Amazon Rekognition などで使用可能な顔分析機能は、画像や動画から顔のある場所、その顔の特徴を特定します。たとえば、Amazon Rekognition では、両目の開閉、気分、髪の色などの属性を分析できます。これらの検出された特徴は、何百万もの画像をメタデータタグ (幸せ、眼鏡、年齢層など) を使って整理したり検索したりする必要のあるお客様や、ソース画像またはユニーク ID に顔認識を使うなど、個人を特定する必要のあるお客様に大変役立っています。
お客様は顔認識をどのように使用していますか?
顔認識は、数々のアプリケーションや業種で役に立っています。今日、このテクノロジーは、ニュース制作会社が重要なイベントに関する報道において有名人を特定したり、モバイルアプリケーションで二次認証を提供したり、メディアやエンターテインメント会社が画像や動画ファイルに自動でインデックスをつけたりするのをはじめ、人道的活動団体が人身売買の被害者を特定し救出するのを助けています。
例えば、Marinus Analytics は、Amazon Rekognition の人工知能を利用し Traffic Jam といった人身売買の被害者の特定や発見を支援するツールを提供しています。以前は捜査員による個別分析が必要でしたが、画像分析で 1 秒に何百万の記録を自動検索することによって、捜査員たちは非常に重要な時間を節約することができています。
もう一つの例としては、アフリカ西部をベースとした金融サービス会社である Aella Credit があります。エマージングマーケットの銀行口座を持たない人たちへモバイルアプリを通して銀行のサービスを提供している Aella Credit は、顔を特定し比較できる Amazon Rekognition を使用することによって、人間の介入なしに本人確認をしています。このシンプルな顔認識の利用によって、過去よりも多くの人たちに銀行のサービスを提供することが可能になりました。Amazon Rekognition のお客様の導入事例は、Amazon Rekognition のお客様を参照してください。
責任をもって顔認識を適用するにはどうすればいいですか?
顔認識は、プライバシー権などの個人の権利を侵したり、人間による分析が必要な場合の自主的な決断をしたりするのに使われるべきではありません。例えば、銀行が金融アプリケーションで顧客の身元を確認するのに Amazon Rekognition などのツールを使っていた場合、テクノロジーを使用しているという事実を明確に開示し、規約と条件に基づき顧客の許可を得ることが必要です。公衆の安全や法執行機関については、市民の権利と公衆の安全の両方を守るため、政府は法執行機関と協力し、顔認識テクノロジーの利用目的制限ポリシーを作成するべきだと私たちは考えます。
公衆の安全と法執行機関に関わるすべてのケースで、Amazon Rekognition などのテクノロジーは、潜在的な合致を狭める目的のみに使用されるべきです。Amazon Rekognition のレスポンスは、さらに先の人間分析のため、素早く潜在的な顔を提示します。公衆の安全におけるユースケースの重大さを考えると、顔の認識を高めるために人間の判断が必要で、顔認識ソフトウェアは独立して使われるべきではありません。
ドクター Matt Wood はこう述べています。「Machine learning は法執行機関のエージェンシーをサポートするとても重要なツールです。正しく適用されているか不安である間は、オーブンを捨てるべきではありません。もしかしたら、ただ間違った温度設定のためにピザが焦げてしまっただけかもしれないのですから。しかし、政府が公共の安全作業を支援するために法執行機関に求めている温度 (または信頼水準) を計量し、特定することは非常に合理的な考えです。
Amazon Rekognition での顔認識の仕組みは?
Rekognition の顔照合は、機械学習とコンピュータビジョン技術を使用して構築されています。その仕組みは次のとおりです: (1) 顔を含む入力画像の部分を探します。(2) 頭部を含む画像領域を抽出し、顔が「通常の」垂直位置になるように領域を揃えて、切り取った顔画像を出力します。(3) 切り取ったそれぞれの顔画像を「顔ベクトル」(厳密には、顔画像の数学的表現) に変換します。SearchFaces で検索されるコレクションは、顔ベクトルのセットであり、顔画像のセットではないことに注意してください。(4) ソース画像の顔ベクトルとターゲット画像の顔ベクトルを比較し、顔ベクトルに対するシステムの類似性スコアを返します。API コールの詳細については、デベロッパー用ドキュメントを参照してください。
類似度スコアおよび類似度しきい値とは何ですか?
類似度スコアとは、Amazon Rekognition が分析する際、画像の中の 2 つの顔が同じ人間のものである可能性を示す統計的な基準です。例えば、類似度スコア 95% と認定された画像は、Rekogniton が分析したすべての顔の中で、検索された顔と該当の画像が 95% 類似しているということを示しています。類似度スコアが高いほど、2 つの画像が同じ人物のものであるという可能性が高いということになります。しかし、たとえ 99% 類似していても、完璧に合致しているという保証はありません。
Rekognition は、確率的システムを使用しています。確率的システムでは、絶対的に確実な正確性ではなく、代わりに予測を基に決定されるからです。
ここで、類似度しきい値が重要になってきます。類似度しきい値とは、Rekognition を使用するアプリケーションが見込みのある合致として受け入れる、類似度スコアの最小値のことです。しきい値の選択は、返された結果に重要なインパクトを与えます。お客様から与えられる可能性のある、人物を誤認 (または、「偽陽性」) した数は、しきい値の設定の直接的な結果です。お客様は、ニーズとアプリケーションのユースケースに基づいて、ふさわしい設定を選択します。
非常に確実な顔の類似性の一致が重要なユースケースについては、しきい値を 99% に設定することを推奨します。例えば、公衆の安全と法執行機関に関わるケースでは、まずフィールドを狭めてから人間の目で素早く調査し、決断を使用するかどうかのオプションを検討するのがキーとなります。
一方、多くのケースでは Amazon Rekognition の結果を人間がレビューする必要はありません。例えば、従業員バッジと顔の二次ファクタ認証では、 Amazon Rekognition によって高い (99%) 類似度が確認されました。あるいは、個人的な写真収集アプリケーションなど多少の誤ったマッチが許されるような場合は、最小限のしきい値 80% でいいかもしれません。お客様は、類似度しきい値をユースケースやニーズに応じて調整できるのです。
有名人認識 API とは何ですか? 顔の検索と同じですか、異なりますか?
Celebrity Detection は、さまざまな映画のシーンや環境における潜在的な有名人を認識するようデザインされています。有名人は、異なるメイクアップをしたり、ウィッグをつけたり、その他の要素によって違う人物を演じることが多いので、Amazon Rekognition のこの機能では、特定の有名人のリストの中から前もってレベル付けされたデータに最も潜在的合致度が高い結果に照準を合わせています。このユースケースは、より多くの偽陽性を承認するよう意図的に設計されており、そのため公衆の安全と法執行機関に関わるケースには使用するべきではありません。
対照的に、Rekognition の顔検索機能は 2 つの顔がどれだけ類似しているか確実な値を返すよう設計されています。確実な類似性を返すよう最適化し、行方不明の子供を探し親元へ返す、許可された従業員をビルに入れる、または人身売買の被害者を特定し救出するなどの、公衆の安全と法執行機関に関するアプリケーションに使用することもできます。
これらの 2 つの機能は、使用する基礎となるテクノロジー、解決するユースケース、サービスする顧客の違いという点で、まったく異なる機能です。
顔認識は安全ですか?
はい。顔認識についてのよくある誤解と仕組みについて調べてみましょう。
まず、人間のほうが機械より顔を認識できると言う人たちがいます。しかし、National Institute for Standards and Technology (NIST) が最近共有した、少なくとも 2 年前のモデルの Amazon Rekognition を使った顔認識テクノロジーに関する研究によると、古いテクノロジーでさえ、人間の顔認識能力を上回るという結果が出ました。
次に、すべての確率的システムと同様に、多少の偽陽性があるからといって、顔認識に欠陥があるとは言い切れません。むしろ、ユースケースと関係のある、ふさわしい類似度しきい値を設定するなど、ベストプラクティスに従う必要があるということを強調しています。加えて、このテクノロジーの良いところは、継続して学び改善するということです。偽陽性は時が経つごとに減っていく可能性があります。
今日、たくさんの成功したお客様、たとえば Thorn、VidMob、Marinus Analytics、POPSUGAR などが、シンプルかつ大きなインパクトのある方法に顔認識を使用しています。
顔認識の使用を始めるにはどうすればいいですか?
AWS は、顔認識の使用を開始するサポートとして、 10 分間のチュートリアルおよび指示付きのガイダンスを含む詳細なドキュメントを用意しています。
Amazon Rekognition の不正使用の疑いを報告するにはどうすればよいですか?
Amazon Rekognition の使用法が不正または違法、もしくはあなたあるいは他の人の権利を侵害している疑いがある場合は、AWS に報告してください。当社が問題を調査します。
Amazon Rekognition の詳細