Some parts of this page may be machine-translated.

生成AI LLM RAG データ構造化サービス

生成AI LLM RAG
データ構造化サービス

生成AIにおけるLLM精度向上のためのデータ構造化支援サービス

GAFAMをはじめとする
教師データ作成実績4,800万件以上

ヒューマンサイエンスではマニュアル制作や翻訳サービスにおいて35年以上にわたり事業を展開してきました。
豊富な経験から培われた様々なコアスキルが、アノテーション事業にも生かされています。
リモート、オンサイト、お客様環境への常駐など案件に応じたさまざまな運用方法でお客様の課題を解決します。

生成AI LLM RAG
データ構造化サービスとは

データ構造化とは、膨大なデータを整理し機械が理解しやすい形式に変換するプロセスを指します。生成AIにおいては、特に大規模言語モデル(LLM)の精度向上のために、データの質と構造が大きな影響を与えるためヒューマンサイエンスではこれらのプロセスを専門的にサポートし、質の高いデータ構造化を実現します。

生成AI LLM RAG データ構造化サービスとは

データ構造化に関わる
こんなお悩みありませんか?

  • LLMの回答精度が上がらない。
    今ある社内ドキュメントの
    構造化のみでなく、
    回答精度が向上する
    ドキュメントの作り方、運用も
    サポートして欲しい。

  • 画像、動画、図表などの
    情報を含むドキュメントが
    大量にあり、
    リソース・コストの
    負担が大きい。

  • 社内データは、多くの
    機密情報を扱うため
    セキュリティ面に
    不安を感じている。

ヒューマンサイエンスが、

データ構造化に関するお悩みを解決します

ヒューマンサイエンスのデータ構造化サービスの
特長Feature

Feature01

創業以来のドキュメント制作・運用ノウハウ
弊社はマニュアル・ドキュメント制作から事業がスタートしたため、様々なドキュメントに関するノウハウがあります。現在では、制作・運用のコンサルティングも手掛けており、LLM RAG データ構造化でもそのノウハウを活かし、データ構造化のみならず、回答精度が向上するドキュメントの作り方や運用のサポートを行うことも可能です。

Feature02

テキストデータ、
動画、音声データなど
あらゆる非構造化データに対応
テキスト、動画、音声、画像など様々なデータ形式でデータ構造化が可能です。アノテーションサービスのみならず、創業以来のマニュアルや動画コンテンツ制作で培った、弊社のドキュメントの構造を知りつくした知見を活かし、高品質なデータ構造化を実現します。

Feature03

万全のセキュリティ体制
オフィスはISMS認証*を取得しており、オフィス等のセキュリティルームでの作業にも対応しています。そのため個人情報等の守秘性の高いデータを扱うプロジェクトであってもセキュリティを担保することが可能です。
また、クラウドソーシングの利用を避けたいお客様も、お客様の拠点での常駐対応も可能です。*ISMS認証:財団法人・日本情報処理開発協会(JIPDEC)が定めた評価制度( ISMS適合性評価制度)

データ構造化サービスの
ユースケースField

ドキュメント構造化
ドキュメントやドキュメントに含まれる図表や表組、レイアウトなどにより、そのままの状態ではLLMが認識しずらいデータを構造する作業です。
誤った回答を生み出すリスクを低下させ、より正確な回答を生み出すことに寄与します。
分類
データを特定のカテゴリーやグループに分ける作業を行います。データの整理を助ける役割を持ちます。
データクレンジング
データセットからノイズになる誤情報を取り除き、データの質を向上させる作業です。AIの精度向上のために必要不可欠な作業となります。

データ構造化サービス実績・事例Case Study

医療ドキュメントのデータ構造化
医療機器メーカーC社様

必要となる
作業
  • 医療関連ドキュメントの図表・グラフのデータ構造化
お客様の
課題
  • pdfドキュメントに画像として添付されている大量の図表を数値として構造化したい。
  • 社内で実施すると膨大な時間と手間が必要となってしまい、コア業務を圧迫してしまうためベンダー活用を検討。
ご提案内容と
ポイント
  • 弊社契約アノテーター (医療系アノテーション経験者) を活用した迅速なプロジェクト立ち上げ。
    作業データには英語のドキュメントも存在するため英語に堪能な契約スタッフをアサイン。
  • グラフなどの自動読み取りツールを使用して、読み取りの精度のバラつき低減と作業の高速化を実現。
  • 仕様書にない例外・エッジケースが大量になると想定。
    PMによる仕様書へのフィードバック・改訂や作業中に発生する情報を集約し、顧客と共有し密にコミュニケーションを図ることで品質を確保。
作業数
2,000 件
作業期間
2ヶ月間
お客様の声
  • 手探り状態で始めた部分もあったが、最も望んだことを理解していただき、気づいていないところも指摘いただいた。
    テストでも他社と比べてもトップレベルで満足できた。
  • 支給データの画像の粗さや読み取りずらさは我々も認識していたが、その中でも順調に進めてもらえたので、流石アノテーションのプロと感じた。
  • 仕様などが不明瞭なままで作業を進め、品質が落ちるのが懸念であったが、質問をきちんとしくれたので良かった。
    質問も的を得たものが多く、最後の方には安心感があった。

データ構造化サービスサービスの流れProcess

  • 01

    ヒアリング

    サンプルデータや作業仕様などの資料をご提供いただく。
  • 02

    お見積

    頂いたサンプルデータや仕様書などの資料を元にお見積をします。
    ※詳細が決まっていない場合は、前提条件を設定してお見積と納期を回答
  • 03

    サンプル納品

    プロジェクトの初期段階で一次納品を行う。フィードバックを頂き、再度認識合わせを行う。
  • 04

    データ構造化・
    アノテーション

    定期的に進捗報告。不明点は都度ご連絡。必要に応じて作業指示更新、周知。
  • 05

    ご納品

    ご要望に応じて、振り返りの打ち合わせ実施。

データ構造化サービス価格Price

LLM RAG データ構造化
(価格参考例)

PDF中の図表・
グラフデータ数値化
LLM学習データセット作成
作業内容 PDFドキュメント中の画像化されている
グラフなどを抽出し、数値化する作業です。
一定のシチュエーションを想定した
会話の質問文・回答文を作成する作業です。
作業量/納期 PDF:500ファイル(合計33,000ページ)/約1.5ヶ月 5,000セット/約3週間
作業条件など 国内リモート作業、全数チェック
作業対象数:ファイルあたりの4箇所程度
国内リモート作業、全数チェック
価格 1,000,000円~ 350,000円~

※上記は想定作業での価格参考例です。実際の作業仕様や条件などによって料金や納期は異なります。まずはご相談ください。

お見積りにつきましては、お問い合わせフォームよりご依頼ください。

データ構造化サービスよくある質問FAQ

プロジェクトの内容に合った人材に作業してもらえるのか心配です。 +
ヒューマンサイエンスではプロジェクト開始前に作業内容を検証して、特性に合った人材をアサインしています。
当社契約作業者の適性やこれまでの経験、案件毎に行う多面的な人材評価結果をもとに効果的なチーム編成を実現しています。
アノテーターの採用にクラウドソーシングは利用していますか? +
ヒューマンサイエンスではクラウドソーシングは利用していません。
トライアルに合格した契約アノテーターが作業を担当します。作業者へのセキュリティ教育、人材評価、教育を継続的に行い、セキュリティと品質の向上安定を図っています。
オフショアのプロジェクトは作業品質が心配です。 +
ヒューマンサイエンスではオフショアのプロジェクトであっても、国内のプロジェクトマネジャーが管理を行い、品質管理も国内で行っています。
そのため国内作業に劣らない高品質な教師データのご提供が可能です。
作業の難易度が高いため作業担当者だけではなくプロジェクトマネジャーも開始前に研修を受ける必要があります。対応可能でしょうか。 +
はい。対応いたします。
当社プロジェクトマネージャーが作業開始前に研修を受講します。リモート、お客様環境での受講、当社のセキュリティルームの利用など、さまざまな方法で案件に合わせてご対応いたします。
医療系のプロジェクトです。医師の監修やチェックを行ってもらうことは可能でしょうか?  +
はい。可能です。内容や専門分野によって個別に対応いたします。

お役立ち資料Download

アノテーション代行業界別活用シーンIndustry

お問い合わせ・無料トライアル

TOP