RAGとは?
最近よく聞く「RAG(検索拡張生成:Retrieval-Augmented Generation)」という言葉。
これは簡単に言うと、生成AIが回答を生成するときに、あらかじめ準備しておいた外部の情報源(社内マニュアルやナレッジベースなど)から必要な情報を探して、その情報をもとに回答を作る仕組みのことです。
外部情報を取り入れることで、生成AIを単独で使うよりも、信頼できる回答を生成させることができるようになります。
通常の生成AIは、過去に学習したデータだけを使ってユーザーからの質問に答えます。そのため情報が古かったり、学習していない内容については事実と異なることを答えてしまったりします(ハルシネーション)。
一方、RAGは質問を受け取った後にリアルタイムで関連する情報を探し出し、その内容を参考にして答えます。そのため、ユーザーはより正確で新しい情報を得ることができるのです。
1-1. RAGの利用用途
では、RAGはどんな場面で使われているのでしょうか。
● カスタマーサポート
企業のカスタマーサポートで使われるチャットボットにRAGを使うと、社内のマニュアルやFAQなどから必要な情報を探して答えることができるため、より正確な回答を提供することが可能になります。
● 社内業務
社員向けのマニュアルから情報を取り出して、必要な情報だけをリアルタイムで提供することができます。
例えば、RAGを活用したチャットボット(通称「RAGチャットボット」)を使えば、新入社員が「この作業の手順を教えて」と質問すると、社内ドキュメントから該当する情報を探して、回答してくれます。
● マーケティングや市場調査
市場の動向やトレンドをWeb記事やニュースから探して要約し、マーケティング担当者に分かりやすく伝えることができます。
このように、RAGはさまざまな業務で活用されており、情報を集めて、それを使って生成AIが賢く答える仕組みとして注目されています。
RAG活用に欠かせない、精度向上の取り組み
RAGは便利な仕組みですが、ただ技術を導入するだけでなく、その精度を高めるための取り組みを並行して行うことがとても重要です。
なぜなら、RAGの検索対象となる情報の質や構造、処理方法によっては、ユーザーに対して適切な回答を提供できない可能性があるからです。
例えば、外部情報の中から見つかった情報が、本当はユーザーの質問とは関係のない内容だった場合、生成された回答は的外れなものになってしまいます。
また、一部の情報だけを切り取って回答が生成されてしまうと、本来の意味が誤って伝わるおそれがあります。こうしたわかりづらい回答は、ユーザーの混乱を招き、業務上の判断ミスや作業の遅延につながるリスクがあります。
さらに、誤った回答が繰り返されることで、RAGチャットボット自体の信頼性が低下し、最終的には利用されなくなるという事態も起こりえます。
したがって、RAGチャットボットを実用レベルで運用するには、正確かつ信頼性の高い情報を安定して提供できるよう、精度の向上に向けた取り組みが不可欠なのです。
RAGの精度向上の方法
RAGの強みを最大限に発揮するためには、インプットする情報の整備や検索・生成プロセスの改善が必要です。
ここでは、RAGの精度を向上させるために効果的な方法をご紹介します。
● インプットするドキュメントを整備する
RAGは、検索したドキュメントを生成AIが理解・活用できるように処理しますが、その元になるドキュメントが雑多だったり、表現が曖昧だったりすると、正しく情報を活用できません。
そのため、社内ドキュメントやマニュアルを「誰が読んでも意味が伝わる」状態に整えることが大切です。
・主語、述語を明確にする
・箇条書きを活用して情報を整理する
・あいまいな表現(「これ」「それ」など)を避ける
・手順、注意、補足といった情報の種別を明確にする
● 最適な検索手法を選ぶ
・キーワード検索:特定の単語が含まれるドキュメントを探す
・ベクトル検索:意味の近さでドキュメントを探す
・ハイブリッド検索:両者を組み合わせて精度を高める
● チャンク分割する
ドキュメントを一定のサイズに分割することで、より適切な情報を検索しやすくなります。
● 図や表などのデータは前処理をする
・表はMarkdownのテーブル記法で記述
・図は説明文としてテキスト化
・フローは箇条書きで表現
● 検索性向上のための情報を付加する
・ドキュメントのカテゴリ
・更新日
・関連キーワード
・対象ユーザー
● 継続的に改善する
・誤回答の原因分析
・ドキュメントの追加・更新
・検索構造の見直し
・プロンプトの改善
生成AIにとっても、人にとってもわかりやすい「両方にやさしいドキュメントづくり」が重要です。
RAG構築も見据えて、ドキュメント整備に取り組んだ事例
● 課題・背景
・マニュアルがわかりにくく、形式もバラバラ
・将来的に生成AIチャットボットを活用したい
● 取り組み
・お手本となるマニュアルの作成
・マニュアル作成ルール集の整備
● 今後の展望
整備したマニュアルを全社展開し、RAGチャットボットに読み込ませて検証を進める予定です。
マニュアル整備のご相談はヒューマンサイエンスへ
ヒューマンサイエンスは、日本語マニュアル作成から英語・多言語翻訳までワンストップでご支援いたします。
・既存マニュアルを改善したい
・英語マニュアルを段階的に作成したい
・日本語マニュアルを多言語展開したい
特長①:豊富なマニュアル制作実績
ドコモ・テクノロジ株式会社
ヤフー株式会社
ヤマハ株式会社
特長②:調査・分析からアウトプットまで対応
経験豊富なコンサルタントが、ヒアリングから最適なマニュアルを作成します。
特長③:定着支援まで含めたサポート
マニュアル作成後も、更新やセミナーを通じて定着を支援します。
最後までお読みいただき、ありがとうございました。
このブログが、わかりやすいマニュアル作成のヒントになれば幸いです。