副業全国
Claude APIのプロンプトキャッシュで月コスト半減

クロード えーぴーあい プロンプト キャッシュ つき コスト はんげん
Claude Opus 4.7のプロンプトキャッシュで最大90%の入力コスト削減が可能。1時間TTLの使い方、cache_controlの置き方、月額コストを半減させる実例を解説。
プロンプトキャッシュは「使わない理由がない」
Claude APIのプロンプトキャッシュは、長い固定プロンプト(システム指示・資料・過去会話)を再利用時に劇的に安くする機能です。適用部分は**入力コストを最大90%削減**できます。
仕組み(イメージ)
- 初めて送る固定部分は通常料金+キャッシュ書き込み料
- 5分(または1時間)以内に再利用されると**キャッシュ読み出し価格**で請求
- キャッシュ部分が長いほど割安感が大きい
いつ効くか
- システムプロンプトが長い(1,000トークン超)
- 同じ資料を何度も参照する(FAQボット、社内リサーチ)
- 会話が長く続くチャットボット
1時間TTLオプション
ENABLE_PROMPT_CACHING_1H環境変数を有効にすると、APIキー・Bedrock・Vertex・Foundry利用者は1時間{TTLを使えます。長いセッションで特に有利です。
月コスト半減の現実例
- 社内FAQボット:システム指示8千トークンを固定化、入力コスト約60%削減
- リサーチ支援:長文PDFをキャッシュ、再質問コスト大幅削減
- ブログ下書き:スタイルガイドを固定化、記事1本あたり数十%安く
実装のコツ
- 変わらない部分を先に、毎回違う部分を後に置く
cache_controlは**接頭部分**にだけ付ける- 頻繁に書き換わるシステムプロンプトは逆効果
注意点
- 料金体系は改定されます。最新価格は公式サイトで確認を。
- 秘密情報を含むキャッシュは保管場所・有効期間に注意を。
まとめ
固定プロンプトを先に置きcache_controlを付けるだけで、多くの利用シーンで月額コストが半減します。
出典(公式の情報)
※ 制度は変わることがあります。申請の前に、必ず公式ページの最新情報をご確認ください。
この記事は 2026-05-05 時点の情報です。 個別のご事情については、お住まいの市区町村の福祉窓口・年金事務所・専門家にご相談ください。