自社データをAIに読み込ませる「RAG」とは？【はじめてのClaude API vol.09】

2026年2月19日2026年3月26日

“

「社内の膨大なマニュアルを、AIに検索させたい」「何千ページもある資料から、必要な部分だけ答えてほしい」

こういったニーズに応える技術が「RAG（Retrieval-Augmented Generation）」です。難しそうな名前ですが、仕組みはとても合理的です。

全部読ませようとすると、3つの壁にぶつかる

「じゃあドキュメントを全部プロンプトに入れればいいじゃないか」と思うかもしれません。でも実際にやると、3つの問題が起きます。

ひとつはトークン上限。AIが一度に処理できる量には限界があります。ふたつ目はコスト。大量のテキストを毎回処理すると費用がかかります。そして3つ目は精度の低下。関係ない情報が大量にあると、AIが本当に重要な部分を見落としやすくなります。

RAGはこの問題を「必要な部分だけ渡す」という発想で解決します。

まず事前準備として、ドキュメントを小さな「チャンク（断片）」に切り分けます。切り方には固定文字数・見出しや段落・意味のまとまりなど複数の方法があります。切り分けたチャンクはそれぞれ数値（ベクトル）に変換され、データベースに保存されます。

次に、ユーザーが質問してきたとき。質問文も同じように数値に変換し、データベース内のチャンクと「どれが似ているか」を計算します。似ているチャンクだけを取り出してプロンプトに加えてからClaudeに送ることで、全部読ませるより格段に正確で安価な回答が得られます。

意味的な類似度だけでなく、単語の一致でも検索する「ハイブリッド検索」を使うと、専門用語のような固有の言葉にも強くなります。また、検索後にAIが結果を再評価して順位を整え直す「リランキング」や、各チャンクに元文書との関係情報を付加する「コンテキスト付与」も、精度向上に効果的です。

次回は、AIが自分でタスクの手順を考えて進める「エージェント」と、あらかじめ手順を設計する「ワークフロー」の違いを解説します。

※本記事はAnthropicの公式講座「Building with the Claude API」の内容をもとに日本語で解説したものです。

”

よかったらシェアしてね！