Some parts of this page may be machine-translated.

テキストアノテーションサービス

テキストアノテーション
サービス

ドキュメント制作・多言語対応で培ったノウハウと
データの機密性を確保した高品質なテキストアノテーション

GAFAMをはじめとする
教師データ作成実績4,800万件以上

ヒューマンサイエンスではマニュアル制作や翻訳サービスにおいて35年以上にわたり事業を展開してきました。
豊富な経験から培われた様々なコアスキルが、アノテーション事業にも生かされています。
リモート、オンサイト、お客様環境への常駐など案件に応じたさまざまな運用方法でお客様の課題を解決します。

テキストアノテーションとは

テキストアノテーションとは、文章中の特定の単語やフレーズに対して意味やカテゴリを付与する作業のことです。
AIや機械学習のモデルがテキストデータを理解しやすくするため利用され、これにより、自然言語処理の精度が向上し、自動翻訳や感情分析、マニュアル作成などで効果的に活用されます。

テキストアノテーションとは

テキストアノテーションに関わる
こんなお悩みありませんか?

  • 専門性が高い案件や、
    難易度が高い案件に対応できる
    人材が不足している。

  • 作業が俗人化しており、
    例外やエッジケースも多く
    品質のバラツキや低下が課題と感じている。

  • 機密情報を扱うことが多く、
    セキュリティやデータ管理に不安を感じている。

ヒューマンサイエンスが、

テキストアノテーションに関するお悩みを解決します

ヒューマンサイエンスのテキストアノテーションの
特長Feature

Feature01

高難易度や専門性が高い分野も
高品質なアノテーションを実現
業界知識が豊富なプロジェクトマネージャーが作成要件を習熟し、アノテーターの教育をしてから作業を進行するため、高い精度でのアノテーションを実現します。 特に専門性が必要とされる医療分野においては、実際の医師によるアノテーション監修・チェックも可能です。

Feature02

高品質を実現する作業者への
教育と情報コミュニケーション
アノテーションの品質は人に大きく依存します。そのため弊社では、トライアルに合格した登録作業者でプロジェクト運営、案件毎に作業者評価、フィードバックを実施しています。 また曖昧性が高く例外が数多く発生するテキストアノテーションでは、例外・エッジケースの対処を記載したシートを作業者と共有、個別コミュニケーションで形式知化しずらいノウハウの共有や教育も行い、品質の向上と安定化を実現します。

Feature03

万全のセキュリティ体制
オフィスはISMS認証*を取得しており、オフィス等のセキュリティルームでの作業にも対応しています。そのため個人情報等の守秘性の高いデータを扱うプロジェクトであってもセキュリティを担保することが可能です。また、クラウドソーシングの利用を避けたいお客様も、お客様の拠点での常駐対応も可能です。*ISMS認証:財団法人・日本情報処理開発協会(JIPDEC)が定めた評価制度( ISMS適合性評価制度)

テキストアノテーションのユースケースField

テキスト分類
大量の文書データを効率的に分類します。データをAIに学習させることで、特定のテーマやカテゴリに自動で分類され、業務効率を大幅に向上させます。
意図・固有表現抽出
データ分析や自然言語処理の精度を向上させるために文章中の意図や固有表現を抽出しラベリングします。

テキストアノテーションサービス実績・事例Case Study

CASE 04
OCRテキスト認識精度向上のためのプロジェクト
グローバルIT企業様

必要となる作業
  • OCRの認識精度向上のため、路線図や飲食店のメニューの画像などからテキスト領域を抽出してAIが理解できるデータに変換する。
  • 作業者はテキスト領域を手作業で選択してひとつひとつに正しい情報を付加する。
お客様の
課題
  • 期限内に最大限の稼働時間を確保したいが、自社のリソースだけでは補いきれない。
  • 難易度が高い作業のため、一旦採用したリソースからもトレーニング中のリタイアが続出。プロジェクトの進行が困難。  
当社の
解決策
  • 案件に特化した採用テストを新たに設計して実施。合格者のみでチームを編成することでリタイアを減少させ、稼働効率を向上させました。
  • トレーニングで好成績だったアノテーターの人的傾向を分析し、似た傾向のリソースを積極的に追加採用しました。
  • 英語のガイドラインや資料をそのまま理解できるリソースでチームを編成しました。資料を翻訳するプロセスをなくすことでコストの削減を実現しました。
件数
22,000件
作業期間
1,600時間/月
ここがポイント
  • ヒューマンサイエンスがこれまでに培ったドキュメント制作のスキルや多言語対応のリソースが、このプロジェクトでのテスト制作やチーム編成にも生かされました。
  • その成果として当初の想定基準を超える高い稼働効率を実現しました。

CASE 05
契約書の内容確認のAI自動化プロジェクト
グローバルIT企業様

必要となる作業
  • 契約書の内容確認の自動化を目的として、テキストを分析する作業。
  • 作業者は契約書類を読んで、特定の文言や表現を抽出して分類、ラベリングを行う。専門用語の理解と、複雑なラベリングの定義づけが必要。
お客様の
課題
  • 社内のリソースが不足しており、教師データを量産するための仕組みづくりが進まない。
  • PoC(概念実証)を実施するために何から手をつけるべきかがわからない。
  • 作業ルールの策定やナレッジの標準化、マネジメントの仕組みづくりから経験のある人に相談したい。
当社の
解決策
  • 当社リソースから経験豊富なアノテーター1名をお客様先常駐で派遣しました。
  • お客様の課題をお聞きし、合意をとりながら作業工程や判断基準をマニュアル化しました。
  • 今後のアノテーションの拡大に向けたマネジメントの課題を具体化して、継続できる仕組みを構築しました。
件数
約200件
作業期間
3ヶ月間
ここがポイント
  • ヒューマンサイエンスから経験あるプロジェクトマネージャーを派遣することで、現在と今後の課題を可視化。
  • お客様の環境に常駐することで、きめ細かな対応とデータの機密性の確保を両立。アノテーション体制の拡大に向けた仕組みづくりに貢献しました。

CASE 07
会話文の感情判定AIプロジェクト
コンテンツ制作IT企業様

必要となる作業
  • 会話文テキストに対して8種類の感情をラベリング。
お客様の
課題
  • これまで社内のエンジニア一人でアノテーション作業を行ってきたため、教師データの作成が進まない。 そのため外注化を考えているが、曖昧で正解が特定しづらいアノテーション作業であるため、ラベリングに個人差が大きく、一貫性のある品質の高い教師データ作成できるか不安。
  • 複数人での作業や外注化をする際に、ラベリングのバラつきを抑え、品質安定化を図る基準書の作成経験やノウハウがない。
当社の
解決策
  • お客様との外注契約前にトライアルを行い、お客様で品質評価を実施。
  • 弊社でアノテーション基準書を作成。
  • トリプルパスを採用(同じデータを3名がアノテーションし、多数決でラベルを選択、決定する。)
件数
20,000件
作業期間
約2ヶ月間
ここがポイント
  • トライアル中にお客様とのQ&Aやコミュニケーション、フィードバックをいただきながら、曖昧性が高いアノテーションにも関わらず、お客様の要望にあったアノテーション仕様書を作成することができました。また、仕様書は、お客様内で行う定期的な追加学習の際にも役立てることができました
  • こまめな分納を行うことで、お客様からのFBやご要望にタイムリーに対応することで、お客様の品質に対する不安を解消。
  • トリプルパスに加え、PMのチェックとタイムリーな作業者へのフィードバック、定期ミーティングの実施により、曖昧性の高い言語アノテーションにありがちな、作業者の判定結果のバラツキ、傾向の偏りを抑えながら品質の安定化と一貫性を確保し、お客様から高いご評価をいただきました。

テキストアノテーションサービスサービスの流れProcess

  • 01

    ヒアリング

    サンプルデータや仕様書などの資料をご提供いただく。
  • 02

    お見積

    頂いたサンプルデータや仕様書などの資料を元にお見積をします。
    ※詳細が決まっていない場合は、前提条件を設定してお見積と納期を回答
  • 03

    サンプル納品

    プロジェクトの初期段階で一次納品を行う。フィードバックを頂き、再度認識合わせを行う。
  • 04

    アノテーション

    定期的に進捗報告。不明点は都度ご連絡。必要に応じて作業指示更新、周知。
  • 05

    ご納品

    ご要望に応じて、振り返りの打ち合わせ実施。

テキストアノテーション価格Price

テキストアノテーション
(価格参考例)

テキスト文の分類 意図/固有表現抽出
作業内容 比較的短い会話文などを
指定の基準に従って分類する作業です。
wordやPDF文書中の
指定の表現・箇所にマーキングしてラベリングを行う作業です。
作業量/納期 10,000文/約3週間 Word/PDF:2,000ファイル(合計約7,000ページ)
作業条件など 国内リモート作業、全数チェック
分類クラス数:6種程度
国内リモート作業、全数チェック
クラス数/作業対象数:4種類/ファイルあたり35ヶ所程度
価格 330,000円~ 1,000,000円~

※上記は想定作業での価格参考例です。実際の作業仕様や条件などによって料金や納期は異なります。まずはご相談ください。

お見積りにつきましては、お問い合わせフォームよりご依頼ください。

テキストアノテーションサービスよくある質問FAQ

プロジェクトの内容に合った人材に作業してもらえるのか心配です。 +
ヒューマンサイエンスではプロジェクト開始前に作業内容を検証して、特性に合った人材をアサインしています。
当社契約作業者の適性やこれまでの経験、案件毎に行う多面的な人材評価結果をもとに効果的なチーム編成を実現しています。
今まで自社で使っていたアノテーションツールと同じものを使用してもらうことは可能でしょうか? +
はい。対応いたします。これまで当社で導入事例がなかったツールにも柔軟に対応いたします。
VPNを利用した対応も可能です。まずはご相談ください。
実際の作業が開始してからもプロジェクトマネージャーに相談したり、
コミュニケーションをとることはできますか? +
はい。対応いたします。
ご要望に応じてミーティングやフィードバックの機会を設けています。SlackやTeamsなどの利用も可能です。
外国語の自然言語処理のアノテーションは可能ですか? +
はい。可能です。当社の翻訳事業やローカリゼーション事業で培ったリソースや経験を生かして対応いたします。
これまでには英語や台湾語の教師データ作成を手がけております。まずはご相談ください。

お役立ち資料Download

アノテーション代行業界別活用シーンIndustry

お問い合わせ・無料トライアル

TOP