
大量のデータの一件一件に情報を付与していくアノテーション作業に欠かせないのがアノテーションツールです。しかし、「アノテーションツール」などで検索するとさまざまな名称のものが出てくるものの、一体どのツールを使用すればいいか迷っていませんか?今回は、アノテーションツールを選ぶ際に検討すべき3つのポイントと、おすすめのアノテーションツールを6つご紹介します。
- 目次
1. アノテーションツールとは?
1-1. アノテーションツールとは?
AI開発において多くの場合必要な教師データを作成するために欠かせない「アノテーション」作業ですが、アノテーション(annotation)とは、「注釈」や「注解」を意味する言葉で、IT分野ではテキストや音声、画像、動画など様々なデータに対して、タグやメタデータといった情報を付与する作業のことを指します。これを効率的に行うための専用ツールが「アノテーションツール」です。例えば、画像アノテーションでは下記のような方法があります。
・バウンディングボックスアノテーション:物体を四角形で囲み画像上における位置情報も含めてタグ付けする方法
・キーポイントアノテーション:関節や、目口鼻など顔のパーツといった特定の点にタグをつける方法
・セグメンテーション:対象物の輪郭をピクセル単位で細かくなぞっていく方法
このような方法に対して、必要な機能を備えたアノテーションツールを使うことで、作業をより効率的かつ正確に行うことができます。
1-2. アノテーションツールの必要性
アノテーションは数千から数万のデータに対して行う必要があります。例えば、画像アノテーションをする際、Photoshopなどの一般的な画像ソフトなどで行うことも可能ですが、こうしたソフトは大量のデータを次から次へと閉じたり開いたりする作業を行うには不向きです。また、AI学習に必要なデータ形式の出力への対応が困難なことがほとんどです。一方、専用ツールであれば、大量のデータを連続して処理することも簡単ですし、出力形式もサポートしていることが多く、手間をかけずAI学習に必要なデータを得られます。
AI開発が加速する中で、膨大なデータに対するアノテーションを迅速かつ効率的に進めるには、使いやすく高機能なアノテーションツールの導入が重要となります。
1-3. 2025年 世界のアノテーションツールの市場動向
AIの活用によりアノテーションツールの市場も大幅に拡大中
AIの活用が進む中で、それを支える「アノテーションツール」の市場も急成長しています。2025年時点の規模は約20億~30億ドルと推定されており、2030年や2033年には80億~125億ドル規模に達する見込みです。年平均成長率(CAGR)は20~31%という驚異的な伸びを見せています。
この成長を牽引しているのは、自動運転、医療診断、チャットボットなど、幅広い分野でのAI活用の増加です。これに伴いAI開発のための教師データ作成に、画像、テキスト、音声、動画といった多様なデータ形式に対応したアノテーションツールのニーズも高まっています。
データ品質・セキュリティ維持が課題
一方で、急成長と共にデータ品質の確保やセキュリティの維持が大きな課題となっています。AIの精度は教師データの質に大きく依存するため、アノテーションの品質がモデル全体の性能に悪影響を及ぼすリスクがあります。
さらに、医療や金融といったセンシティブなデータを扱う分野では、データのプライバシー保護や法的な遵守も求められます。このため、セキュリティ対策が組み込まれたツールや、ISMSなどの認証制度や、それぞれの業界応じたデータセキュリティの標準に準拠した管理体制の整備が今後ますます重要になるでしょう。
技術的進歩と自動アノテーション
近年の技術的進歩により、アノテーションツールにおいてもAIの力が活用されるようになっています。自動アノテーションといった機能によって、作業の一部をAIが補助することが徐々に可能となっています。活用できる範囲は今のところ汎用的なアノテーションに限られてはいますが、今後、より自動化が進めば、従来のように手作業で進めていたプロセスの多くが大幅に効率化され、アノテーターの負担軽減やコスト削減が期待できるでしょう。
また、複数の作業者をマネジメントする機能を備えたツールも増えています。データの管理、作業者へのタスクアサイン、アノテーション結果のレビュー・承認フロー、コメント機能などが搭載されることで、これら一連のプロセスを一括管理しスムーズな作業が実現可能です。オンサイトでもそうですが、リモートワークが当たり前となり海外を含め複数拠点でのAI開発が可能になった現在、こうした機能は作業効率と品質を両立させるうえで欠かせない存在です。
2. アノテーションツールを選ぶ3つのポイント
2-1. 目的
アノテーションツールは、自社でどのようなAIモデルを構築するかに合わせて選ぶ必要があります。「画像認識」、「音声認識」、「自然言語処理」など、目的によって最適なアノテーションツールはそれぞれ異なります。例えば「画像認識」の領域の「物体検出」であれば、画像内の特定の物体をバウンディングボックスで囲んでタグ付けしていく機能が必要であり、「自然言語処理」の領域であれば、文書内にある特定の固有表現を抽出するテキストアノテーションの機能が必要です。
このように、ツールによってできるアノテーションの種類は異なるため、目的にあったツールを選びましょう。
2-2. 機能と使いやすさ
膨大なデータを処理するアノテーション作業では、ツールの機能と使いやすさ(操作性)が重要になります。マニュアルがなくても直感的に操作できるUI(ボタンの並びや画面構成)かどうか、画像の読み込みなど動作が軽快かどうか、タグ付けをした画像にコメントを付けられるかどうか、などを考慮するとよいでしょう。
また、アノテーションツールは大きくクラウド型とインストール型に分かれ、クラウド型はインストール不要でアカウントを作成してログインすればすぐに使い始められます。一方で、インストール型は外部サーバーにデータをアップせずにローカルで作業できるため、データのセキュリティ管理上の安心はあるものの、ツールによってはGitHubなどバージョン管理システムからツールをダウンロードしたり、コマンドを実行してインストールしたりする必要があるなど、導入のハードルが高いものもあります。
さらに、それぞれのツールによって出力できるデータ形式は異なります。JSON、PascalVOC、YOLO、COCOなど、求める出力形式をサポートしているかどうかも、ツールを選ぶ際の重要なポイントの一つと言えるでしょう。
2-3. 管理
一つのプロジェクトで多くのアノテーターを抱えて作業する場合、アノテーターやタスク(=アノテーション作業の最小単位)の管理機能も見逃せないポイントの一つです。例えば、アノテーターの日々の進捗状況(アノテーションの数、作業済みタスク数、差し戻し回数、など)を確認できたり、タスクごとのステータス(アノテーション済み、レビュー済み、差し戻し中、保留中、など)を確認できたりすると、管理業務がスムーズに行えるほか、品質の担保にも役立ちます。
3. アノテーションツール比較6選
今回は、画像アノテーションの分野における代表的なアノテーションツールを6つご紹介いたします。
3-1. Annofab
Annofabはクラウド型のアノテーションツールで、画像、動画に対応しています。

画像内の特定の領域を囲む領域抽出 (セグメンテーション)、画像の中から特定の物体をバウンディングボックスで囲む物体検出、大きさを必要としない線状の対象物(道路の車両通行帯やセンターラインなど)を抽出するポリライン(連続線)などに対応しています。
クラスの設定画面では、クラスの値、種類、色はもちろん、最小設定(例:矩形の最小の幅と高さを設定する、など)や、誤差許容範囲(例:矩形のズレの許容範囲の距離(ピクセル)を指定する、など)といったことも設定可能です。
Annofabが優れている点は、ショートカットキーなど操作面での機能支援が充実しており、例えば、自動車「q」、ナンバープレート「w」、バイク「e」、人「r」など、クラスの種類ごとにショートカットキーを割り当てることで、左手でキーボードでクラスを選択し、右手のマウスでアノテーション操作をする、などといった方法で効率よく作業を進められます。
また、管理機能が充実しているため、アノテーション済みデータを検索・一覧表示できたり、プロジェクト全体の進捗状況や、タスク(=アノテーション作業の最小単位)が差し戻された回数などをアノテーターごとに把握できる統計データを確認したりできます。
出力形式はJSONをサポートしています。
Annofabの基本情報やメリット・デメリットについて、当ブログ内の別記事にてさらに詳しくご紹介していますので、ぜひご覧ください。
Annofab(公式サイト)については、こちら。
3-2. FastLabel
FastLabelはクラウド型のアノテーションツールで、画像、動画、テキスト、音声、3次元(3D)、自動アノテーション、などに対応しています。

FastLabelの強みは、幅広いアノテーション種類および出力形式への対応です。上述のとおり、画像・動画から、テキストや音声、さらに3次元(3D)まで、昨今のアノテーションに必要な機能はすべて網羅しています。また、画像アノテーションであれば矩形、円、多角形、キーポイント、線、セグメンテーション、骨格推定、などのアノテーション種類をサポートしており、JSON、COCO、PascalVOC、YOLO、CSVなど多くのプロジェクトで必要とされる形式をサポートしています。
また、FastLabelは動作が軽快で、ページを読み込み際や、各メニュー間を移動する際も常にサクサクと表示されます。
さらに、有料版にはなりますが、自動アノテーションやスマートアノテーションという作業を効率化する機能も揃えているのは強みです。自動アノテーションはあらかじめビルトインされているAIモデルを利用して、自動車、歩行者、ナンバープレートなどを自動で検出してバウンディングボックスを付与することができます。
また、スマートアノテーション(画像 – セグメンテーションの場合のみ)では画像の色の値をもとに領域を自動で検出してくれるため、画像によっては人の手で一から領域を検出するより、速くアノテーションを行うことができます。
FastLabelについては、こちら。
3-3. Labelme
Labelmeは、インストール型の画像・動画アノテーションツールです。

画像アノテーションであれば、矩形、ポリゴン、円、線、点などに対応しています。また、画像の明るさを調整するメニューもあり、暗めで分かりづらい部分の明るさを上げることでアノテーション領域の判別などに役立てられます。
また、アノテーションに必要な最小限の機能に絞られているため、画像の読み込みやアノテーションの付与・編集などの一つひとつの動作は軽快です。
インストールは実行ファイルをローカルにダウンロードするだけのため、アカウントを作成したり、ログインしたりすることなくすぐに使用開始できる点はメリットです。
出力形式はJSONをサポートしています。
3-4. CVAT
CVAT(Computer Vision Annotation Tool)はインテル社が開発・公開した、インストール型のオープンソースのアノテーションツールです。

画像・動画アノテーションに対応しており、画像は矩形、ポリゴン、線、点、円、立方体に対応しており、自動アノテーション機能も備えています。自動アノテーションは80種類以上のあらかじめ指定された対象物(自動車、人、飛行機、自転車、犬、など)に対して実行できます。
CVATはチェック時などに不備のあった画像を直接アノテーターに対して差し戻す機能はないものの、「Issue Tracker」と呼ばれる入力フィールドに不備のあった画像のURLを記録しておくことで、アノテーターはそのリンクから指摘を受けた画像に移って修正することができます。
また、エクスポートできるデータ形式が非常に豊富(CVAT、COCO、Datumaro、CamVid、Cityscapes、など)であることも特徴です。
CVATについては、こちら。
3-5. VoTT
VoTT(Visual Object Tagging Tool)はMicrosoft社によって開発された、インストール型のオープンソースのアノテーションツールです。

画像と動画アノテーションに対応しており、動作は軽快で、アノテーション経験がない人でも直感的に操作できるUIになっています。
VoTTはWindows、MacおよびLinux用のインストーラーがそれぞれ用意されているため、どなたでも簡単にインストールできます。
ただ、アノテーターやタスク進捗の管理や、チェック機能などは備えていないため、複数名を抱えるプロジェクトの場合は別の方法で管理する必要があります。
出力形式はAzure Custom Visionサービス、Microsoft Cognitive Toolkit (CNTK)、PascalVOC、TensorFlowレコード、VoTT JSON、CSV、をサポートしています。
3-6. labelImg
LabelImgは画像アノテーション用のオープンソースツールで、バウンディングボックスのアノテーションに対応しています。

Windowsではzipファイルをダウンロードして解凍しexeファイルを実行するだけですぐ使用できます。Macではターミナルを使用してインストールする必要がありますが、他のツールに比べるとそのステップはシンプルです。
クラス名を定義するファイルをclasses.txtとして指定のフォルダに置き、画像フォルダとアノテーション出力ファイル用フォルダを用意して、ツール上で各フォルダのパスを指定するだけでアノテーション作業が始められます。ローカルで使用できるのでクラウドツール不可のアノテーション作業にも対応できます。
VoTTと同じく、作業割当や進捗管理、作業フィードバックなどのマネジメント機能はないため、複数人数で作業を行う場合にはこれらのマネジメントスキルが必要となります。
出力形式はPascalVOCとYOLOをサポートしています。
4. まとめ
今回はアノテーションツールを選ぶ際に考えるべき3つのポイントを解説するとともに、6つのおすすめ画像アノテーションツールをご紹介いたしました。
昨今アノテーションツールの数も多くなってきているため、自社の目的に合った最適なアノテーションツールを選んで活用することで、時間や手間のかかるアノテーション作業をできるだけ効率化することが大事です。
なお、アノテーションツールの導入のコストを抑えたい場合、アノテーション自体の代行・委託を検討することも有効な手段の一つです。当社ではアノテーションツールのご相談からアノテーションの代行まで幅広く対応しておりますので、ぜひお気軽にお声がけください。
5. ヒューマンサイエンスのアノテーション代行サービス
教師データ作成数4,800万件の豊富な実績
ヒューマンサイエンスでは自然言語処理、医療支援、自動車、IT、製造や建築など多岐にわたる業界のAIモデル開発プロジェクトに参画しています。これまでGAFAMをはじめとする多くの企業様との直接のお取引により、総数4,800万件以上の高品質な教師データをご提供してきました。数名規模のプロジェクトからアノテータ150名の長期大型案件まで、業種を問わずさまざまなアノテーションのプロジェクトにご対応しています。 AIモデルを導入したいけれど何から取り組んだらよいのかわからないという企業様も、ぜひ当社にご相談ください。
クラウドソーシングを利用しないリソース管理
ヒューマンサイエンスではクラウドソーシングは利用せず、当社が直接契約した作業担当者でプロジェクトを進行します。各メンバーの実務経験や、これまでの参加プロジェクトでの評価をしっかりと把握した上で、最大限のパフォーマンスを発揮できるチームを編成しています。
最新のアノテーションツールを活用
ヒューマンサイエンスが導入しているアノテーションツールの一つAnnoFabでは、プロジェクトの進行中にもクラウド上でお客様から進捗確認やフィードバックをいただくことが可能です。作業データはローカルのマシンに保存できない仕様とすることで、セキュリティにも配慮しています。
自社内にセキュリティルームを完備
ヒューマンサイエンスでは、新宿オフィス内にISMSの基準をクリアしたセキュリティルームを完備しています。そのため、守秘性の高いプロジェクトであってもオンサイトでご対応することができ、セキュリティを担保することが可能です。当社ではどのプロジェクトでも機密性の確保は非常に重要と捉えています。作業担当者にはセキュリティ教育を継続して実施し、リモートのプロジェクトであっても情報やデータの取り扱いには細心の注意を払っています。