
こんにちは!コンサルタントのKです。普段は、製造業界や医薬業界の企業様に対して、マニュアルの作成・改善プロジェクトを担当しています。
本日は、最近お客様からもよくお聞きする「RAG(検索拡張生成)」についてです。マニュアル制作の専門家の視点で、RAGの精度を高めるための方法をご紹介したいと思います。
- 目次
1. RAGとは?
最近よく聞く「RAG(検索拡張生成:Retrieval-Augmented Generation)」という言葉。これは簡単に言うと、生成AIが回答を生成するときに、あらかじめ準備しておいた外部の情報源(社内マニュアルやナレッジベースなど)から必要な情報を探して、その情報をもとに回答を作る仕組みのことです。外部情報を取り入れることで、生成AIを単独で使うよりも、信頼できる回答を生成させることができるようになります。
通常の生成AIは、過去に学習したデータだけを使ってユーザーからの質問に答えます。そのため情報が古かったり、学習していない内容については事実と異なることを答えてしまったりします(ハルシネーション)。
一方、RAGは質問を受け取った後にリアルタイムで関連する情報を探し出し、その内容を参考にして答えます。そのため、ユーザーはより正確で新しい情報を得ることができるのです。
1-1. RAGの利用用途
では、RAGはどんな場面で使われているのでしょうか。
● カスタマーサポート
企業のカスタマーサポートで使われるチャットボットにRAGを使うと、社内のマニュアルやFAQなどから必要な情報を探して答えることができるため、より正確な回答を提供することが可能になります。
● 社内業務
社員向けのマニュアルから情報を取り出して、必要な情報だけをリアルタイムで提供することができます。例えば、RAGを活用したチャットボット(通称「RAGチャットボット」)を使えば、新入社員が「この作業の手順を教えて」と質問すると、社内ドキュメントから該当する情報を探して、回答してくれます。
● マーケティングや市場調査
市場の動向やトレンドをWeb記事やニュースから探して要約し、マーケティング担当者に分かりやすく伝えることができます。
このように、RAGはさまざまな業務で活用されており、情報を集めて、それを使って生成AIが賢く答える仕組みとして注目されています。
2. RAG活用に欠かせない、精度向上の取り組み
RAGは便利な仕組みですが、ただ技術を導入するだけでなく、その精度を高めるための取り組みを並行して行うことがとても重要です。なぜなら、RAGの検索対象となる情報の質や構造、処理方法によっては、ユーザーに対して適切な回答を提供できない可能性があるからです。
例えば、外部情報の中から見つかった情報が、本当はユーザーの質問とは関係のない内容だった場合、生成された回答は的外れなものになってしまいます。また、一部の情報だけを切り取って回答が生成されてしまうと、本来の意味が誤って伝わるおそれがあります。こうしたわかりづらい回答は、ユーザーの混乱を招き、業務上の判断ミスや作業の遅延につながるリスクがあります。さらに言えば、誤った回答が繰り返されることで、RAGチャットボット自体の信頼性が低下し、最終的には利用されなくなるという事態も起こりえます。
したがって、RAGチャットボットを実用レベルで運用するには、正確かつ信頼性の高い情報を安定して提供できるよう、精度の向上に向けた取り組みが不可欠なのです。
3. RAGの精度向上の方法
先ほど述べたとおり、RAGの強みを最大限に発揮するためには、インプットする情報の整備や検索・生成プロセスの改善が必要です。ここでは、RAGの精度を向上させるために効果的な7つの方法をご紹介します。
● インプットするドキュメントを整備する
RAGは、内部的に検索したドキュメントを生成AIが理解・活用できるように処理しますが、その元になるドキュメントが雑多だったり、表現が曖昧だったりすると、正しく情報を活用できません。そのため、まずは社内ドキュメントやマニュアルを「誰が読んでも意味が伝わる」状態に整えることが大切です。
例えば、以下のような整備が有効です。
・主語、述語を明確にする
・箇条書きを活用して情報を整理する
・あいまいな表現(「これ」「それ」などの指示語)を避ける
・手順、注意、補足といった情報の種別を明確にする
このような整備をすることで、人にとっても、生成AIにとってもわかりやすいドキュメントになり、より効果的にRAGを活用できるようになるでしょう。
● 最適な検索手法を選ぶ
RAGにおける「検索」は、回答の土台となる情報を選ぶ重要な工程です。検索の仕組みには、「キーワード検索」「ベクトル検索」「ハイブリッド検索」などの手法があります。
・キーワード検索:
特定の単語が含まれるドキュメントを探す。高速だが、意味の類似性までは考慮しない。
・ベクトル検索:
意味の近さ(セマンティック類似性)でドキュメントを探す。語彙の違いがあっても意味が近ければヒットする。
・ハイブリッド検索:
キーワードとベクトルの両方を組み合わせ、検索精度を高める方法。
用途や対象ドキュメントの特性に応じて、最適な検索手法を選ぶことで、より関連性の高い情報を取得でき、結果的にRAGの精度が向上します。
● チャンク分割する
ドキュメント全体をそのまま検索対象とするのではなく、一定のサイズごとに分割(チャンク化)することで、より細かな情報単位での検索が可能になります。このチャンク分割は、情報の粒度や論理構造に合わせて適切に行うことが大切です。
● 図や表などのデータは前処理をする
RAGは文章中心に処理を行うため、画像として保存された図表は認識できません。図や表が多いドキュメントは、できる限りMarkdown形式などでテキスト化し、構造を保ったまま読み込ませることが重要です。
・表はMarkdownのテーブル記法で記述
・図の内容はキャプションや説明文としてテキスト化
・矢印やフローチャートは、簡単な箇条書きに変換
このようにテキストとして記載しておくことで、生成AIが情報を理解しやすくなり、回答の質が向上します。
● 検索性向上のための情報を付加する
検索時により正確な情報を引き出すために、ドキュメントにメタ情報やタグを付けておくのも有効です。以下のような情報を活用すれば、検索時の絞り込みがしやすくなり、誤ったドキュメントが検索結果に混ざるリスクを減らせます。
・ドキュメントのカテゴリ(例:人事マニュアル、営業手順、FAQなど)
・更新日
・関連するキーワードや用語
・関連部署や対象ユーザー(例:新入社員向け、システム管理者向け)
● 継続的に改善する
RAGの精度は、最初の構築だけでは十分ではありません。実際の利用を通してユーザーがどんな質問をしているか、どんな回答が適切でなかったかといったフィードバックを蓄積し、継続的に改善を行うことが大切です。
・間違った回答の原因分析(検索ミス?ドキュメントの質?プロンプトの不備?)
・検索対象のドキュメントの追加・更新
・チャンク構造や検索手法の見直し
・プロンプトの改善
このような改善を継続して行うことで、RAGチャットボットは業務にしっかり根付いた、信頼されるチャットボットへと成長していきます。
このように、精度向上の方法はいろいろありますが、マニュアル制作のプロであるヒューマンサイエンスは、RAGの精度を高める施策として「AIに読み込ませるドキュメントの整備」がとても大切だと考えています。
ドキュメントをきちんと整えることで、生成AIが内容を正しく理解しやすくなるだけでなく、人が読んでもわかりやすいものになります。実際、多くのRAGチャットボットでは、ユーザーが答えの根拠を確認したり、もっと詳しく調べたりするために、元のドキュメントへのリンクが表示されます。そのとき、リンク先のドキュメントがわかりにくければ、「結局よくわからなかった」ということになりかねません。
だからこそ、生成AIにとって理解しやすいだけでなく、人間にとっても親切で読みやすい「両方にやさしいドキュメントづくり」がとても重要なのです。
次の章では、実際にこの考え方で、RAGに読み込ませることを前提に社内のマニュアル整備に取り組んだ企業の事例をご紹介します。
4. RAG構築も見据えて、ドキュメント整備に取り組んだ事例
ここでは、ある金融系企業A社様の事例をご紹介します。
● 課題・背景
A社様では、以下のような課題や背景がありました。
・社内の業務マニュアルがわかりにくい、必要な情報を探しにくい、形式がバラバラ
・今後生成AIチャットボットを活用したい、それに向けてマニュアルを見直したい
● 取り組み
ヒューマンサイエンスでは、次のような支援を行いました。
・お手本となるマニュアルを作成
生成AIが処理しやすいことと人間にとってわかりやすいことを両立できるように作成しました。また、チャットボットのインプットとして十分活用できるよう、情報の網羅性も重視しました。
・マニュアルの書きかたをまとめたルール集を作成
RAGチャットボットの精度に影響するポイントも含め、誰でもわかりやすくマニュアルを作成できるよう、書きかたのルールをまとめました。
● 今後の展望
A社様では、今回整備したマニュアルやルール集を他の部門にも展開し、会社全体で情報の整理と共有を進めていく予定です。あわせて、自社で開発されたRAGチャットボットに整備したマニュアルを読み込ませ、運用に向けた検証を進められるご計画です。
A社様は、生成AIの活用を見据えながらマニュアルの整備にもしっかり取り組まれています。弊社もA社様と伴走しながら本プロジェクトに取り組む中で、やはり生成AIツールの検討とあわせて、ツールのインプットとするドキュメントの整備が重要だと実感しています。
5. マニュアル整備のご相談はヒューマンサイエンスへ
ヒューマンサイエンスは、日本語版のマニュアル作成から英語および多言語翻訳まで、ワンストップでご支援いたします。1985年からの長きにわたり数々のマニュアルを手がけてきた実績があります。以下のようなニーズがございましたら、ぜひお気軽にご相談ください。
・既存の日本語マニュアルや英語マニュアルを分かりやすく改善したい
・英語マニュアルの作成を検討していて、日本語マニュアルから段階的に進めたい
・社内で作成された日本語マニュアルを英訳(各言語訳)して活用したい
特長①:大企業・グローバル企業を中心とした豊富なマニュアル制作実績
ヒューマンサイエンスは、製造業やIT業界を中心に、多岐にわたる分野でマニュアル制作実績を積み重ねてきました。これまでに「ドコモ・テクノロジ株式会社」「ヤフー株式会社」「ヤマハ株式会社」など、名だたる企業をクライアントとしてきました。
特長②:経験豊富なコンサルタントによる調査・分析からアウトプットまで
業務マニュアル作成に携わるのは、ヒューマンサイエンスが誇る経験豊富なコンサルタントになります。熟練のコンサルタントが、豊富な経験と提供された資料から、より分かりやすく効果的なマニュアルを提案します。また、情報が整理されていない段階からのマニュアル作成も可能です。担当のコンサルタントがヒアリングを行い、最適なマニュアルを作成いたします。
マニュアル評価・分析・改善提案サービス|ヒューマンサイエンス
特長③:マニュアル化だけでなく、定着支援も重視
ヒューマンサイエンスは、マニュアル作成にとどまらず、”定着化”という重要な段階にも注力しております。マニュアル作成後も、定期的な更新やマニュアル作成セミナーを通じて、マニュアルの定着を支援してまいります。多岐にわたる施策により、現場でのマニュアルの有効活用をサポートいたします。
最後までお読みいただき、ありがとうございました。
このブログがわかりやすいマニュアル作成のヒントになれば、うれしく思います。