【2026年最新】RAG・ベクターDB API料金比較|OpenAI・Cohere・Pinecone・Weaviate

はじめに
RAG・ベクターDB APIとは?
RAG(Retrieval-Augmented Generation)とは、LLMに自社ドキュメントや最新情報を参照させながら回答を生成する手法です。AIエージェント・チャットボット・社内検索など、幅広い用途で活用されています。
RAGの構築には2種類のAPIが必要です:
- Embeddingモデル(埋め込みAPI):テキストをベクター(数値配列)に変換するAPI。検索の精度を左右する
- ベクターDB(VectorDB):変換したベクターを格納・検索するデータベース。格納量とクエリ数に応じた料金体系が多い
RAGのコスト構造
RAGのコストは3段階で発生します:
- インデックス作成時:ドキュメントをEmbeddingモデルでベクター化する費用(1回限り)
- ストレージ:ベクターDBに格納したデータを保持する月額費用
- 検索クエリ:ユーザーのクエリをベクター化して検索するたびに発生する費用
Embeddingモデル API料金比較表(2026年3月時点)
※料金はUSD。1Mトークン(tokens)あたりの入力費用です。
| 提供元 | モデル名 | 料金(1Mトークンあたり) | 次元数 | 無料枠 |
|---|---|---|---|---|
| OpenAI | text-embedding-3-small | $0.02(バッチ: $0.01) | 1,536次元 | なし(新規クレジットあり) |
| text-embedding-3-large | $0.13(バッチ: $0.065) | 3,072次元 | なし(新規クレジットあり) | |
| Voyage AI | voyage-4-lite | $0.02 | 512次元 | 最大200Mトークン/月 無料 |
| voyage-4 | $0.06 | 1,024次元 | 最大200Mトークン/月 無料 | |
| voyage-4-large | $0.12 | 2,048次元 | 最大200Mトークン/月 無料 | |
| Cohere | embed-v4.0 | $0.12 | 1,024次元 | トライアルクレジットあり |
| gemini-embedding-2-preview | $0.20 | 3,072次元 | 無料ティアあり(使用量制限) | |
| gemini-embedding-001 | $0.15 | 768次元 | 無料ティアあり(使用量制限) |
※Voyage AIのストレージオプション($0.05/GB/月)も提供あり。
※バッチAPIは非同期処理・50%割引。リアルタイム不要な場合はコスト削減に有効。
※gemini-embedding-001はテキスト専用(画像非対応)。gemini-embedding-2-previewはマルチモーダル対応。
ベクターDB(VectorDB)料金比較表(2026年3月時点)
| 提供元 | プラン | 料金体系 | 無料枠 |
|---|---|---|---|
| Chroma | Starter | $0/月 + 従量課金 Write: $2.50/GiB Storage: $0.33/GiB/月 Query: $0.0075/TiB |
$5クレジット付き |
| Team | $250/月 + 従量課金 | $100クレジット付き | |
| Qdrant | Free Tier | 永久無料 (0.5vCPU / 1GB RAM / 4GB Disk) |
永久無料 |
| Standard | 従量課金 (公式計算機で確認) |
— | |
| Weaviate | Flex | $45/月〜 + 従量課金 ベクター次元: $0.01668/1M ストレージ: $0.255/GiB |
14日間無料トライアル |
| Premium | $400/月〜 (HA・電話サポート・SLA 99.9%) |
— | |
| Pinecone | Standard | $50/月〜 ストレージ: $0.33/GB/月 |
Starter: 2GBまで無料 |
※ChromaはOSS版(ローカル)も無料で使用可能。本番運用でChroma Cloudを使う場合は上記料金。
※QdrantはOSS版がGitHub公開済み。セルフホストなら無料だが運用コストが発生。
※WeaviateもOSS版あり。Weaviate Cloudは管理型(フルマネージド)サービス。
※Pineconeは完全マネージド型。セルフホスト不可。大規模本番用途に向く。
用途別おすすめ組み合わせ
コスト最小・個人開発・プロトタイプ向き
OpenAI text-embedding-3-small($0.02/1Mトークン)+Chroma OSS(無料・ローカル)の組み合わせが最もコストを抑えられます。ローカル開発・プロトタイプ・少量データならほぼ無料で構築できます。
バランス重視・中規模本番向き
OpenAI text-embedding-3-small + Qdrant Cloudが費用対効果の高い組み合わせです。Qdrant Free Tierは永久無料(0.5vCPU/1GB RAM/4GB Disk)で始められ、スケールアップ時はStandardに移行できます。
高精度・エンタープライズ向き
OpenAI text-embedding-3-large($0.13/1Mトークン)+Pinecone Standardが高精度・高可用性の組み合わせです。Pineconeは完全マネージドで運用コストがかからず、大規模本番環境に適しています。
Googleエコシステムで統一したい場合
gemini-embedding-2-preview($0.20/1Mトークン)+Vertex AI Vector Searchの組み合わせも可能です。Gemini APIと統一して管理したい場合に選ばれます(無料ティアあり)。コスト重視であればgemini-embedding-001($0.15/1Mトークン)も選択肢です(テキスト専用)。
セルフホスト vs マネージドクラウドの選び方
| セルフホスト(OSS) | マネージドクラウド | |
|---|---|---|
| 初期コスト | 低(ソフト無料) | 中〜高(最低月額あり) |
| 運用コスト | サーバー・メンテナンス費 | 込み(自動スケール) |
| スケール | 手動構築が必要 | 自動・即時対応 |
| 向いている用途 | 開発・小〜中規模 | 本番・大規模 |
まとめ
- Embedding最安はOpenAI text-embedding-3-small・Voyage AI voyage-4-lite(ともに$0.02/1Mトークン)
- 高精度EmbeddingはOpenAI text-embedding-3-large($0.13)またはgemini-embedding-2-preview($0.20)
- Google系コスト重視はgemini-embedding-001($0.15・テキスト専用)も選択肢
- VectorDB最安はChroma OSS(ローカル無料)またはQdrant Cloud Free Tier(永久無料・4GB Disk)
- マネージドVectorDBはPinecone($50/月〜)が最も安定した選択肢
- プロトタイプはtext-embedding-3-small+Chroma OSS、本番はtext-embedding-3-small+Qdrant/Pineconeが定番構成
- 大量インデックス作成時はバッチAPIで50%割引(text-embedding-3-small: $0.01/1Mトークン)
料金は変動することがあります。最新情報は各社公式ページをご確認のうえ、実際の用途でテストして選定してください。





