Some parts of this page may be machine-translated.

 

アノテーションに費用相場は存在しない?教師データ作成の価格構成要素と外注先選定のポイント。

アノテーションに費用相場は存在しない?教師データ作成の価格構成要素と外注先選定のポイント。

AIの開発に欠かせないアノテーションですが、その作業には膨大な時間とリソースが必要です。外注で依頼した場合、その価格はどのように決まるのでしょうか。価格の安い業者でも問題ないのでしょうか。アノテーションを外注する際に重視すべきポイントについてお話していきます。



目次

1. AI開発におけるアノテーションの位置づけ

1-1. AIの品質を左右するアノテーション

AIの開発においてアノテーションのプロセスは非常に重要です。AIの精度を上げるためには機械学習が行われますが、その教材となるのはアノテーションによって作られる教師データです。
AI開発の工程でのアノテーションの位置づけはこのようになります。

教師データの品質はAIの精度に直結するため、その前段階であるアノテーションが適切に行われていないと、その後のすべてのプロセスに影響が出てしまいます。AIも人間と同じで、間違った教材で学習してしまうと正しい判断が身につかないという結果につながります。

1-2. AI発展の背景にある地道な作業

アノテーションとは具体的にはデータの1つ1つにタグやラベル、メタデータと呼ばれる情報を付けていく作業のことです。テキストや音声、画像、動画などあらゆる形態のデータがその対象になります。手作業によって行われるため、作業者には正確な知識と判断力に加えて、相当な根気強さも求められます。AIにできることが増えていく背景には、この地道なプロセスが必ず存在します。
アノテーションの意味や種類については以下の記事も参考にしてください。
>>アノテーションとは?その意味からAI・機械学習との関係まで解説。

2. アノテーションの外注価格は何で決まるか

2-1. アノテーション代行サービスに外部委託する理由

アノテーションには時間も人手もかかります。作業を担当するアノテーターだけではなく、データのチェックを行うチェッカーや案件を管理するプロジェクトマネージャーの役割も必要です。そのすべてを社内のリソースで賄いながら目的を達成するのは現実的に難しいと言えるでしょう。そのため多くの企業ではアノテーションのプロジェクトは外部の代行サービスにアウトソーシングされることが一般的です。ただし外注先の選定は教師データの品質を大きく左右します。本来のゴールであるAIの精度向上にも大きな影響を及ぼすため、注意深く選定する必要があります。

2-2. アノテーション代行に費用相場は存在するか?

代行サービスでのアノテーションの価格はどのように算定されるのでしょうか。基本的に価格はデータの数量と求める品質水準、プロジェクト管理費で決まります。必要となるデータの数量とその作業量はプロジェクトの用途や目標とする精度によって大きく変化します。作業期間やリソースの数も同様に変化するため、価格は一概には言えないというのが実状です。

3. 価格を構成するプロジェクト管理費とは

 

価格を決める要素のひとつであるプロジェクト管理費とは何でしょうか。どこか漠然としていて不透明な印象があります。価格の構成要素として妥当であるかを考えるために、そのコストの根拠となるプロジェクト管理とはどのような業務なのかを具体的に見ていきましょう。

3-1. 仕様とルールの策定

そのプロジェクトの目的や求める品質をプロジェクトマネージャーがヒアリングして、アノテーションツールの選定や必要なリソースの手配から計画します。作業のガイドラインの作成、プロジェクトが始動してからの仕様変更や例外事項への対応、進捗を見ての改善対応、成果物の品質のチェックもプロジェクト管理に含まれます。

3-2. リソースのマネジメント

そのプロジェクトにふさわしいアノテーターをアサインして教育や勤怠管理を行い、作業上の細かな質問に対応することもプロジェクト管理のひとつです。

3-3. セキュリティレベルや難易度に応じた対応

守秘性の高いプロジェクトであったり、扱うデータに個人情報が含まれる等の理由でリモートでの作業が適さない場合があります。必要に応じてオンサイトでの作業環境を手配して管理することもプロジェクト管理の一環です。

 

以上は代表的なプロジェクト管理の一例ですが、実際の業務ではそのプロジェクトに応じた臨機応変な対応が行われます。アノテーションのプロジェクト管理とは、毎回そのプロジェクトに合ったチームを構築して、効果的な方法で目的を達成することです。プロジェクト管理なくして効果的なアノテーションが実現することはありません。軽視することのできない、非常に重要な要素であることが見て取れます。

4. アノテーションの外注先選定のポイント

4-1. 外注先の選定で重要なことは

そうなると外注先の選定では何を重要視すべきでしょうか。見た目の価格よりも重要なのは、その外注先にアノテーションのプロジェクト管理に必要な体制がきちんと構築されているかということです。そういう業者であれば、プロジェクトの目的を理解した上で効果的でムダのない提案ができるプロジェクトマネージャーがいることが期待できます。結果、コストパフォーマンスに優れた成果が期待できます。

4-2. アノテーションのプロジェクト管理に必要な体制とは

作業を行うアノテーターには作業量とスピードが求められる一方で、相当の注意深さや根気強さ、ルールやタグ付けを行う対象への深い理解も求められます。そのため適性にあった人材の登用や管理、細やかな教育が行えるマネジメント体制が必要とされます。作業者へのセキュリティ教育や、マネジメント側での十分なセキュリティ対策も必要です。

4-3. アノテーションをクラウドソーシングすることの問題点

それでもコストはできるだけおさえたいと考えたとき、クラウドソーシングを利用する代行業者が選択肢に上がると思います。しかしクラウドソーシングの利用は一見してコストパフォーマンスが優れてみえる一方で、実際に作業を開始してみると品質が安定せず、結果的に追加修正や検証作業が発生することで想定外のコスト超過を招いてしまうこともあります。セキュリティ面ではデータが散逸してしまうという懸念もあります。 作業がやり直しとなった場合や、セキュリティインシデントが発生したときの損失を考えると、外注先を選定する際には品質と価格のバランスには十分に注意する必要があります。

5. ヒューマンサイエンスのアノテーション代行サービス

5-1. 教師データ作成数4,800万件の豊富な実績

ヒューマンサイエンスでは自然言語処理、医療支援、自動車、IT、製造や建築など多岐にわたる業界のAI開発プロジェクトに参画しています。これまでGAFAMをはじめとする多くの企業様との直接のお取引により、総数4,800万件以上の高品質な教師データをご提供してきました。数名規模のプロジェクトからアノテーター150名の長期大型案件まで、業種を問わずさまざまなアノテーションのプロジェクトにご対応しています。 AIを導入したいけれど何から取り組んだらよいのかわからないという企業様も、ぜひ当社にご相談ください。

5-2. クラウドソーシングを利用しないリソース管理

ヒューマンサイエンスではクラウドソーシングは利用せず、当社が直接契約した作業担当者でプロジェクトを進行します。各メンバーの実務経験や、これまでの参加プロジェクトでの評価をしっかりと把握した上で、最大限のパフォーマンスを発揮できるチームを編成しています。

5-3. 最新のアノテーションツールを活用

ヒューマンサイエンスが導入しているアノテーションツールの一つAnnoFabでは、プロジェクトの進行中にもクラウド上でお客様から進捗確認やフィードバックをいただくことが可能です。作業データはローカルのマシンに保存できない仕様とすることで、セキュリティにも配慮しています。

5-4. 自社内にセキュリティルームを完備

ヒューマンサイエンスでは新宿オフィス内に ISMSの基準をクリアしたセキュリティルームを完備しています。守秘性の高いプロジェクトであってもオンサイトでご対応します。当社ではどのプロジェクトでも機密性の確保は非常に重要と捉えています。作業担当者にはセキュリティ教育を継続して実施し、リモートのプロジェクトであっても情報やデータの取り扱いには細心の注意を払っています。



 

 

 

関連ブログ

 

 

人気記事ランキング

お問い合わせ・資料請求

TOP