「社内の膨大なマニュアルを、AIに検索させたい」「何千ページもある資料から、必要な部分だけ答えてほしい」
こういったニーズに応える技術が「RAG(Retrieval-Augmented Generation)」です。難しそうな名前ですが、仕組みはとても合理的です。
全部読ませようとすると、3つの壁にぶつかる
「じゃあドキュメントを全部プロンプトに入れればいいじゃないか」と思うかもしれません。でも実際にやると、3つの問題が起きます。
ひとつはトークン上限。AIが一度に処理できる量には限界があります。ふたつ目はコスト。大量のテキストを毎回処理すると費用がかかります。そして3つ目は精度の低下。関係ない情報が大量にあると、AIが本当に重要な部分を見落としやすくなります。
RAGはこの問題を「必要な部分だけ渡す」という発想で解決します。
RAGは「事前準備」と「質問時」の2ステージ
まず事前準備として、ドキュメントを小さな「チャンク(断片)」に切り分けます。切り方には固定文字数・見出しや段落・意味のまとまりなど複数の方法があります。切り分けたチャンクはそれぞれ数値(ベクトル)に変換され、データベースに保存されます。
次に、ユーザーが質問してきたとき。質問文も同じように数値に変換し、データベース内のチャンクと「どれが似ているか」を計算します。似ているチャンクだけを取り出してプロンプトに加えてからClaudeに送ることで、全部読ませるより格段に正確で安価な回答が得られます。
さらに精度を上げたいなら
意味的な類似度だけでなく、単語の一致でも検索する「ハイブリッド検索」を使うと、専門用語のような固有の言葉にも強くなります。また、検索後にAIが結果を再評価して順位を整え直す「リランキング」や、各チャンクに元文書との関係情報を付加する「コンテキスト付与」も、精度向上に効果的です。
まとめ
- RAGは全部読ませるのではなく、必要な部分だけを取り出してAIに渡す技術
- 事前にドキュメントを分割・数値化しておき、質問時に関連部分だけを検索する
- 社内FAQ・マニュアル検索・契約書解析などに活用できる
次回は、AIが自分でタスクの手順を考えて進める「エージェント」と、あらかじめ手順を設計する「ワークフロー」の違いを解説します。
▶ Anthropic Academy 公式講座はこちら(無料)
※本記事はAnthropicの公式講座「Building with the Claude API」の内容をもとに日本語で解説したものです。
”






