Some parts of this page may be machine-translated.

 

キーポイントアノテーションとは?その特徴とアノテーション方法

キーポイントアノテーションとは?その特徴とアノテーション方法

キーポイントアノテーションとは?その特徴とアノテーション方法




キーポイントアノテーションとは?

AIによる画像認識の分野は近年非常に進化しています。それに伴い、AIが学習するための教師データ作成も、画像認識の目的によってさまざまな手法が用いられるようになりました。その中の一つの手法がキーポイントアノテーションです。この手法では、画像や動画の中の特定のオブジェクトの特徴的な位置(ランドマーク)を点でアノテーションします。ランドマークをアノテーションするので、ランドマークアノテーションと呼ばれることもあります。関節などのポイントにアノテーションする場合キーポイントアノテーション、顔の表面のポイントにアノテーションする場合ランドマークアノテーションなど、分けて解説されることもありますが、ここでは区別せずキーポイントアノテーションとして解説していきます。

目次

1. キーポイントアノテーションが注目される理由は?

キーポイントアノテーションは、主に姿勢推定や顔認識などに活用されます。姿勢推定のためのアノテーションでは肩、肘、手首、膝などの関節の位置を推定してポイントを入力します。人物などの姿勢変化をAIが認識するためには、動画からフレーム単位などで切り出された画像のピクセル情報と、それぞれの点の座標情報をAIが学習して、姿勢や表情の変化を認識できるようになります。そのためには、さまざまな姿勢や表情の画像を使用したキーポイントアノテーションデータを用意することが大切です。そうすることによって、AIが姿勢や表情を認識する精度が上がります。また、入力するポイントが多くなれば、より複雑な変化を認識できるようになります。

 

次に、姿勢推定と顔認識においてキーポイントアノテーションが注目される理由をご紹介します。

1-1. 姿勢推定とモーションキャプチャ:

キーポイントアノテーションは、身体のポーズや動きを正確に捉えるために使用されます。姿勢推定やモーションキャプチャなどでは、関節などの結節点の変化を捉えることで姿勢や体の動きをデータ化します。従来はこれらの動きを捉えるために、実際に人にセンサーを取り付けた上で、そのセンサーの動きを捉えるカメラを複数台用意して動作を捕捉する方法が一般的でした。この方法では、データを得るためには計測機材を設置できる整った環境が必要ですし、複数のセンサーを取り付けた上での動作を計測することになります。こうした制約があるため、狭い空間での計測や、複雑な動作、複数の対象動作データを得ることが困難でした。

 

AIの登場により、こうしたデータをキーポイントアノテーションで得ることができれば、画像や動画など二次元のデータから動作を推定することが可能となり、場所や計測機器に頼らない姿勢推定とモーションキャプチャが可能となります。カメラ一台でも精度の高い認識が行えるようになったことで、動作を検知したい、さまざまな場面への応用が進んでいます。

 

keypoint_img

 

1-2. 顔認識:

顔の特定の位置にポイントを入力することで、表情の変化や個々の顔の形状の違いをAIが学習できるようになります。目尻・口元・頬・顎など細かくポイントを定めることで、より精度の高い認識が可能になります。キーポイントアノテーションを活用することで、他のアノテーション手法では難しい、対象物の細かく複雑な特徴を捉えることができます。仮にバウンディングボックスアノテーションを行い、人の顔全体を囲んで、AIに認識させたとしても、同一人物が眼鏡をかけていたり、マスクや帽子をかぶって」いる場合、AIが同一人物と認識することは難しくなります。こうした場合でも、キーポイントアノテーションによる画像認識で目尻の位置や鼻・顎・耳など、その人特有の形状が把握できていれば、顔の一部だけでも精度の高い認識が可能となります。

 

keypoint_face

 

2. キーポイントアノテーションのやり方

キーポイントアノテーションプロジェクトでは、以下の手順を通じて作業を進めます。

2-1. データの収集:

キーポイントアノテーションに使用するデータセットを収集します。画像や動画など、検出したい対象・動きがあるデータを集めましょう。また、人の姿勢推定の場合にはCOCOデータセットなど、既にあるデータを活用する方法もあります。

2-2. アノテーションツールの選択:

キーポイントアノテーションに適したツールを選択します。オープンソースのツールや商用ツールなど様々なツールがありますので、ツールの操作性などのさまざまな観点で、目的や状況に応じたツール選択をしましょう。プロジェクトの規模によっては、プロジェクト管理機能を備えたものを選択することもお勧めです。

2-3. ポイントの設定:

学習させたい対象のポイント入力箇所(アノテーション仕様)を決定します。対象に応じて、どのようにポイントをマークすれば最適なデータが得られるかを決めます。定義書やガイドラインなどを作成してアノテーション作業を行う際に作業にバラつきが出ないようにすることも考慮に入れましょう。また、可能であれば、実際に作業を開始する前に少量のデータでアノテーションを行い、AIでテストできればなお良いでしょう。

2-4. アノテーションの実施:

アノテーションツールを使用して、設定したポイントを画像にアノテーションします。各ポイントを正確にアノテーションすることが重要です。ただし、正確さを追求しすぎると時間がかかってしまい、大量のデータを用意するのが大変です。そのためには、誤差の許容範囲を事前に決めて置くと良いでしょう。また、作業を進めていくと判断に迷う例や、ガイドライン・定義書などにあてはまらないものが現れることもしばしばあります。こうした品質を決定する要素については、担当者を決めておき、ガイドラインを更新するなどして品質を担保するための工夫をしましょう。

2-5. データの確認と修正:

アノテーションされたデータを確認し、必要に応じて修正を行います。データの品質要件に応じたチェック頻度の設定や、必要に応じて、QAチェック専任の担当者を置くなど、品質を担保する体制を構築することが重要です。

3. まとめ

ここまで見てきたように、キーポイントアノテーションは、画像認識の分野、特に姿勢推定・顔認識など、さまざまなものに応用されています。ビジネスへの応用としては、運輸業における運転手の異常動作検知や、スポーツ・医療・教育分野での人体の動作解析などがあります。従来の技術では対応が難しかったものでも、キーポイントアノテーションデータを学習したAIを活用することによって、さまざまな課題を解決することができるでしょう。

 

AIの認識精度を担保するためにも、正確なアノテーションと高品質なデータセットの作成は不可欠です。もし、キーポイントアノテーションのデータ作成を自社で実施するのが難しいという場合には、外部ベンダーを活用する方法も有効です。

4. ヒューマンサイエンスのアノテーション代行サービス

教師データ作成数4,800万件の実績

ヒューマンサイエンスでは自然言語処理、医療支援、自動車、IT、製造や建築など多岐にわたる業界のAI開発プロジェクトに参画しています。これまでGAFAMをはじめとする多くの企業様との直接のお取引により、総数4,800万件以上の高品質な教師データをご提供してきました。数名規模のプロジェクトからアノテーター150名の長期大型案件まで、業種を問わずさまざまなアノテーションのプロジェクトにご対応しています。 AIを導入したいけれど何から取り組んだらよいのかわからないという企業様も、ぜひ当社にご相談ください。

クラウドソーシングを利用しないリソース管理

ヒューマンサイエンスではクラウドソーシングは利用せず、当社が直接契約した作業担当者でプロジェクトを進行します。各メンバーの実務経験や、これまでの参加プロジェクトでの評価をしっかりと把握した上で、最大限のパフォーマンスを発揮できるチームを編成しています。

最新のアノテーションツールを活用

ヒューマンサイエンスが導入しているアノテーションツールの一つAnnoFabでは、プロジェクトの進行中にもクラウド上でお客様から進捗確認やフィードバックをいただくことが可能です。作業データはローカルのマシンに保存できない仕様とすることで、セキュリティにも配慮しています。

自社内にセキュリティルームを完備

ヒューマンサイエンスでは、新宿オフィス内にISMSの基準をクリアしたセキュリティルームを完備しています。そのため、守秘性の高いプロジェクトであってもオンサイトでご対応することができ、セキュリティを担保することが可能です。当社ではどのプロジェクトでも機密性の確保は非常に重要と捉えています。作業担当者にはセキュリティ教育を継続して実施し、リモートのプロジェクトであっても情報やデータの取り扱いには細心の注意を払っています。



 

 

 

関連ブログ

 

 

人気記事ランキング

お問い合わせ・資料請求

TOP