
大量のデータの一件一件に情報を付与していくアノテーション作業に欠かせないのがアノテーションツールです。しかし、「アノテーションツール」などで検索するとさまざまな名称のものが出てくるものの、一体どのツールを使用すればいいか迷っていませんか?今回は、アノテーションツールを選ぶ際に検討すべき3つのポイントと、おすすめのアノテーションツールを5つご紹介します。
- 目次
1. アノテーションツールを選ぶ3つのポイント
1-1. 目的
アノテーションツールは、自社でどのようなAIモデルを構築するかに合わせて選ぶ必要があります。「画像認識」、「音声認識」、「自然言語処理」など、目的によって最適なアノテーションツールはそれぞれ異なります。例えば「画像認識」の領域の「物体検出」であれば、画像内の特定の物体をバウンディングボックスで囲んでタグ付けしていく機能が必要であり、「自然言語処理」の領域であれば、文書内にある特定の固有表現を抽出するテキストアノテーションの機能が必要です。
このように、ツールによってできるアノテーションの種類は異なるため、目的にあったツールを選びましょう。
1-2. 機能と使いやすさ
膨大なデータを処理するアノテーション作業では、ツールの機能と使いやすさ(操作性)が重要になります。マニュアルがなくても直感的に操作できるUI(ボタンの並びや画面構成)かどうか、画像の読み込みなど動作が軽快かどうか、タグ付けをした画像にコメントを付けられるかどうか、などを考慮するとよいでしょう。
また、アノテーションツールは大きくクラウド型とインストール型に分かれ、クラウド型はインストール不要でアカウントを作成してログインすればすぐに使い始められます。一方で、インストール型は外部サーバーにデータをアップせずにローカルで作業できるため、データのセキュリティ管理上の安心はあるものの、ツールによってはGitHubなどバージョン管理システムからツールをダウンロードしたり、コマンドを実行してインストールしたりする必要があるなど、導入のハードルが高いものもあります。
さらに、それぞれのツールによって出力できるデータ形式は異なります。JSON、PascalVOC、YOLO、COCOなど、求める出力形式をサポートしているかどうかも、ツールを選ぶ際の重要なポイントの一つと言えるでしょう。
1-3. 管理
一つのプロジェクトで多くのアノテーターを抱えて作業する場合、アノテーターやタスク(=アノテーション作業の最小単位)の管理機能も見逃せないポイントの一つです。例えば、アノテーターの日々の進捗状況(アノテーションの数、作業済みタスク数、差し戻し回数、など)を確認できたり、タスクごとのステータス(アノテーション済み、レビュー済み、差し戻し中、保留中、など)を確認できたりすると、管理業務がスムーズに行えるほか、品質の担保にも役立ちます。
2. アノテーションツール比較5選
今回は、画像アノテーションの分野における代表的なアノテーションツールを5つご紹介いたします。
2-1. Annofab
Annofabはクラウド型のアノテーションツールで、画像、動画に対応しています。

画像内の特定の領域を囲む領域抽出 (セグメンテーション)、画像の中から特定の物体をバウンディングボックスで囲む物体検出、大きさを必要としない線状の対象物(道路の車両通行帯やセンターラインなど)を抽出するポリライン(連続線)などに対応しています。
クラスの設定画面では、クラスの値、種類、色はもちろん、最小設定(例:矩形の最小の幅と高さを設定する、など)や、誤差許容範囲(例:矩形のズレの許容範囲の距離(ピクセル)を指定する、など)といったことも設定可能です。
Annofabが優れている点は、ショートカットキーなど操作面での機能支援が充実しており、例えば、自動車「q」、ナンバープレート「w」、バイク「e」、人「r」など、クラスの種類ごとにショートカットキーを割り当てることで、左手でキーボードでクラスを選択し、右手のマウスでアノテーション操作をする、などといった方法で効率よく作業を進められます。
また、管理機能が充実しているため、アノテーション済みデータを検索・一覧表示できたり、プロジェクト全体の進捗状況や、タスク(=アノテーション作業の最小単位)が差し戻された回数などをアノテーターごとに把握できる統計データを確認したりできます。
出力形式はJSONをサポートしています。
Annofabの基本情報やメリット・デメリットについて、当ブログ内の別記事にてさらに詳しくご紹介していますので、ぜひご覧ください。
Annofab(公式サイト)については、こちら。
2-2. FastLabel
FastLabelはクラウド型のアノテーションツールで、画像、動画、テキスト、音声、3次元(3D)、自動アノテーション、などに対応しています。

FastLabelの強みは、幅広いアノテーション種類および出力形式への対応です。上述のとおり、画像・動画から、テキストや音声、さらに3次元(3D)まで、昨今のアノテーションに必要な機能はすべて網羅しています。また、画像アノテーションであれば矩形、円、多角形、キーポイント、線、セグメンテーション、骨格推定、などのアノテーション種類をサポートしており、JSON、COCO、PascalVOC、YOLO、CSVなど多くのプロジェクトで必要とされる形式をサポートしています。
また、FastLabelは動作が軽快で、ページを読み込み際や、各メニュー間を移動する際も常にサクサクと表示されます。
さらに、有料版にはなりますが、自動アノテーションやスマートアノテーションという作業を効率化する機能も揃えているのは強みです。自動アノテーションはあらかじめビルトインされているAIモデルを利用して、自動車、歩行者、ナンバープレートなどを自動で検出してバウンディングボックスを付与することができます。
また、スマートアノテーション(画像 – セグメンテーションの場合のみ)では画像の色の値をもとに領域を自動で検出してくれるため、画像によっては人の手で一から領域を検出するより、速くアノテーションを行うことができます。
FastLabelについては、こちら。
2-3. Labelme
Labelmeは、インストール型の画像・動画アノテーションツールです。

画像アノテーションであれば、矩形、ポリゴン、円、線、点などに対応しています。また、画像の明るさを調整するメニューもあり、暗めで分かりづらい部分の明るさを上げることでアノテーション領域の判別などに役立てられます。
また、アノテーションに必要な最小限の機能に絞られているため、画像の読み込みやアノテーションの付与・編集などの一つひとつの動作は軽快です。
インストールは実行ファイルをローカルにダウンロードするだけのため、アカウントを作成したり、ログインしたりすることなくすぐに使用開始できる点はメリットです。
出力形式はJSONをサポートしています。
2-4. CVAT
CVAT(Computer Vision Annotation Tool)はインテル社が開発・公開した、インストール型のオープンソースのアノテーションツールです。

画像・動画アノテーションに対応しており、画像は矩形、ポリゴン、線、点、円、立方体に対応しており、自動アノテーション機能も備えています。自動アノテーションは80種類以上のあらかじめ指定された対象物(自動車、人、飛行機、自転車、犬、など)に対して実行できます。
CVATはチェック時などに不備のあった画像を直接アノテーターに対して差し戻す機能はないものの、「Issue Tracker」と呼ばれる入力フィールドに不備のあった画像のURLを記録しておくことで、アノテーターはそのリンクから指摘を受けた画像に移って修正することができます。
また、エクスポートできるデータ形式が非常に豊富(CVAT、COCO、Datumaro、CamVid、Cityscapes、など)であることも特徴です。
CVATについては、こちら。
2-5. VoTT
VoTT(Visual Object Tagging Tool)はMicrosoft社によって開発された、インストール型のオープンソースのアノテーションツールです。

画像と動画アノテーションに対応しており、動作は軽快で、アノテーション経験がない人でも直感的に操作できるUIになっています。
VoTTはWindows、MacおよびLinux用のインストーラーがそれぞれ用意されているため、どなたでも簡単にインストールできます。
ただ、アノテーターやタスク進捗の管理や、チェック機能などは備えていないため、複数名を抱えるプロジェクトの場合は別の方法で管理する必要があります。
出力形式はAzure Custom Visionサービス、Microsoft Cognitive Toolkit (CNTK)、PascalVOC、TensorFlowレコード、VoTT JSON、CSV、をサポートしています。
3. まとめ
今回はアノテーションツールを選ぶ際に考えるべき3つのポイントを解説するとともに、5つのおすすめ画像アノテーションツールをご紹介いたしました。
昨今アノテーションツールの数も多くなってきているため、自社の目的に合った最適なアノテーションツールを選んで活用することで、時間や手間のかかるアノテーション作業をできるだけ効率化することが大事です。
なお、アノテーションツールの導入のコストを抑えたい場合、アノテーション自体の代行・委託を検討することも有効な手段の一つです。当社ではアノテーションツールのご相談からアノテーションの代行まで幅広く対応しておりますので、ぜひお気軽にお声がけください。
4. AI活用のご相談はヒューマンサイエンスへ
4-1. 最新のアノテーションツールを活用
ヒューマンサイエンスが導入しているアノテーションツールの一つAnnofabでは、プロジェクトの進行中にもクラウド上でお客様から進捗確認やフィードバックをいただくことが可能です。作業データはローカルのマシンに保存できない仕様とすることで、セキュリティにも配慮しています。
4-2. 教師データ作成数4,800万件の実績
「AIを導入したいけれど何から取り組んだらよいのかわからない」
「外注するにも何を依頼すればよいのかわからない」
そんなときはぜひヒューマンサイエンスにご相談ください。
ヒューマンサイエンスでは自然言語処理、医療支援、自動車、IT、製造や建築など多岐にわたる業界のAI開発プロジェクトに参画しています。これまでGAFAMをはじめとする多くの企業様との直接のお取引により、総数4,800万件以上の高品質な教師データをご提供してきました。数名規模のプロジェクトからアノテーター150名の長期大型案件まで、業種を問わずさまざまなアノテーションのプロジェクトにご対応します。
4-3. クラウドソーシングを利用しないリソース管理
ヒューマンサイエンスではクラウドソーシングを利用せず、当社が直接契約した作業担当者とプロジェクトを進行します。各メンバーの実務経験や、これまでの参加プロジェクトでの評価をしっかりと把握した上で、最大限のパフォーマンスを発揮できるチームを編成しています。
4-4. 自社内にセキュリティルームを完備
ヒューマンサイエンスでは、新宿オフィス内にISMSの基準をクリアしたセキュリティルームを完備しています。守秘性の高いプロジェクトであっても、オンサイトでご対応します。当社ではどのプロジェクトでも機密性の確保は非常に重要と捉えています。作業担当者にはセキュリティ教育を継続して実施し、リモートのプロジェクトであっても情報やデータの取り扱いには細心の注意を払っています。