自社データをAIに読み込ませる「RAG」とは?【はじめてのClaude API vol.09】

「社内の膨大なマニュアルを、AIに検索させたい」「何千ページもある資料から、必要な部分だけ答えてほしい」

こういったニーズに応える技術が「RAG(Retrieval-Augmented Generation)」です。難しそうな名前ですが、仕組みはとても合理的です。


目次

全部読ませようとすると、3つの壁にぶつかる

「じゃあドキュメントを全部プロンプトに入れればいいじゃないか」と思うかもしれません。でも実際にやると、3つの問題が起きます。

ひとつはトークン上限。AIが一度に処理できる量には限界があります。ふたつ目はコスト。大量のテキストを毎回処理すると費用がかかります。そして3つ目は精度の低下。関係ない情報が大量にあると、AIが本当に重要な部分を見落としやすくなります。

RAGはこの問題を「必要な部分だけ渡す」という発想で解決します。


RAGは「事前準備」と「質問時」の2ステージ

まず事前準備として、ドキュメントを小さな「チャンク(断片)」に切り分けます。切り方には固定文字数・見出しや段落・意味のまとまりなど複数の方法があります。切り分けたチャンクはそれぞれ数値(ベクトル)に変換され、データベースに保存されます。

次に、ユーザーが質問してきたとき。質問文も同じように数値に変換し、データベース内のチャンクと「どれが似ているか」を計算します。似ているチャンクだけを取り出してプロンプトに加えてからClaudeに送ることで、全部読ませるより格段に正確で安価な回答が得られます。


さらに精度を上げたいなら

意味的な類似度だけでなく、単語の一致でも検索する「ハイブリッド検索」を使うと、専門用語のような固有の言葉にも強くなります。また、検索後にAIが結果を再評価して順位を整え直す「リランキング」や、各チャンクに元文書との関係情報を付加する「コンテキスト付与」も、精度向上に効果的です。


まとめ

  • RAGは全部読ませるのではなく、必要な部分だけを取り出してAIに渡す技術
  • 事前にドキュメントを分割・数値化しておき、質問時に関連部分だけを検索する
  • 社内FAQ・マニュアル検索・契約書解析などに活用できる

次回は、AIが自分でタスクの手順を考えて進める「エージェント」と、あらかじめ手順を設計する「ワークフロー」の違いを解説します。

Anthropic Academy 公式講座はこちら(無料)

※本記事はAnthropicの公式講座「Building with the Claude API」の内容をもとに日本語で解説したものです。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

目次