【2026年最新】RAG・ベクターDB API料金比較|OpenAI・Cohere・Pinecone・Weaviate




RAG ベクターDB API料金比較

はじめに

RAG・ベクターDB APIとは?

RAG(Retrieval-Augmented Generation)とは、LLMに自社ドキュメントや最新情報を参照させながら回答を生成する手法です。AIエージェント・チャットボット・社内検索など、幅広い用途で活用されています。

RAGの構築には2種類のAPIが必要です:

  • Embeddingモデル(埋め込みAPI):テキストをベクター(数値配列)に変換するAPI。検索の精度を左右する
  • ベクターDB(VectorDB):変換したベクターを格納・検索するデータベース。格納量とクエリ数に応じた料金体系が多い

RAGのコスト構造

RAGのコストは3段階で発生します:

  1. インデックス作成時:ドキュメントをEmbeddingモデルでベクター化する費用(1回限り)
  2. ストレージ:ベクターDBに格納したデータを保持する月額費用
  3. 検索クエリ:ユーザーのクエリをベクター化して検索するたびに発生する費用

Embeddingモデル API料金比較表(2026年3月時点)

※料金はUSD。1Mトークン(tokens)あたりの入力費用です。

モデル名 提供元 料金(1Mトークンあたり) 次元数 無料枠
text-embedding-3-small OpenAI $0.02(バッチ: $0.01) 1536次元 なし(新規クレジットあり)
Voyage AI voyage-4-lite Voyage AI $0.02 512次元 最大200Mトークン無料
Voyage AI voyage-4 Voyage AI $0.06 1024次元 最大100Mトークン無料
Cohere embed-v4.0 Cohere $0.12 1024次元 トライアルクレジットあり
Voyage AI voyage-4-large Voyage AI $0.12 2048次元 最大50Mトークン無料
text-embedding-3-large OpenAI $0.13(バッチ: $0.065) 3072次元 なし(新規クレジットあり)
gemini-embedding-2-preview Google(Gemini API) $0.20 3072次元 無料ティアあり(使用量制限)

※Voyage AIのストレージオプション($0.05/GB/月)も提供あり。
※バッチAPIは非同期処理・50%割引。リアルタイム不要な場合はコスト削減に有効。

ベクターDB(VectorDB)料金比較表(2026年3月時点)

※1Mベクター格納の目安コスト:1536次元・float32換算で約6〜14GB。実際は次元数・使用量で変動します。

サービス名 料金体系 1Mベクター格納目安 無料枠
Chroma Cloud 従量課金(ストレージ$0.33/GiB/月+クエリ) 約$6/月 $5〜$100相当クレジット
Qdrant Cloud 従量課金(詳細非公開) 無料枠内(768次元)/ $10〜$50/月(1536次元推定) 約1M 768次元ベクターまで無料
Weaviate Cloud(Flex) $45/月〜+ベクター次元・ストレージ従量 $20〜$50/月程度 Sandboxあり(機能限定)
Pinecone(Standard) $50/月最低+ストレージ$0.33/GB+Read/Write $50/月(最低料金適用) Starter: 2GBまで無料

※ChromaはOSS版(ローカル)も無料で使用可能。本番運用でChroma Cloudを使う場合は上記料金。
※QdrantはOSS版がGitHub公開済み。セルフホストなら無料だが運用コストが発生。
※WeaviateもOSS版あり。Weaviate Cloudは管理型(フルマネージド)サービス。
※Pineconeは完全マネージド型。セルフホスト不可。大規模本番用途に向く。

用途別おすすめ組み合わせ

コスト最小・個人開発・プロトタイプ向き

OpenAI text-embedding-3-small($0.02/1Mトークン)+Chroma OSS(無料・ローカル)の組み合わせが最もコストを抑えられます。ローカル開発・プロトタイプ・少量データならほぼ無料で構築できます。

バランス重視・中規模本番向き

OpenAI text-embedding-3-small + Qdrant Cloudが費用対効果の高い組み合わせです。Qdrantは768次元まで無料枠があり(1536次元では有料移行)、OSSからクラウドへの移行もスムーズです。

高精度・エンタープライズ向き

OpenAI text-embedding-3-large($0.13/1Mトークン)+Pinecone Standardが高精度・高可用性の組み合わせです。Pineconeは完全マネージドで運用コストがかからず、大規模本番環境に適しています。

Googleエコシステムで統一したい場合

gemini-embedding-2-preview($0.20/1Mトークン)+Vertex AI Vector Searchの組み合わせも可能です。Gemini APIと統一して管理したい場合に選ばれます(無料ティアあり)。

セルフホスト vs マネージドクラウドの選び方

セルフホスト(OSS) マネージドクラウド
初期コスト 低(ソフト無料) 中〜高(最低月額あり)
運用コスト サーバー・メンテナンス費 込み(自動スケール)
スケール 手動構築が必要 自動・即時対応
向いている用途 開発・小〜中規模 本番・大規模

まとめ

  • Embedding最安はOpenAI text-embedding-3-small・Voyage AI voyage-4-lite(ともに$0.02/1Mトークン)
  • 高精度EmbeddingはOpenAI text-embedding-3-large($0.13)またはgemini-embedding-2-preview($0.20)
  • VectorDB最安はChroma OSS(ローカル無料)またはQdrant Cloud(小規模無料枠あり)
  • マネージドVectorDBはPinecone($50/月〜)が最も安定した選択肢
  • プロトタイプはtext-embedding-3-small+Chroma OSS、本番はtext-embedding-3-small+Qdrant/Pineconeが定番構成
  • 大量インデックス作成時はバッチAPIで50%割引(text-embedding-3-small: $0.01/1Mトークン)

料金は変動することがあります。最新情報は各社公式ページをご確認のうえ、実際の用途でテストして選定してください。