Claude Sonnet 5の400エラーと回答が切れる原因

Claude Sonnet 5への移行後、これまで安定して動作していたAIエージェントのコードが突然動かなくなったり、出力が途切れたりして困惑していませんか。2026年6月30日のアップデート以降、多くの開発環境でデフォルトモデルが切り替わった影響により、パラメータ設定の根本的な見直しが急務となっています。
本記事では、Sonnet 5移行で発生する「400エラー」や「回答が不完全になる」といった不具合の技術的要因を型分けし、正しく動作させるための具体的な修正ステップを解説します。
Claude Sonnet 5とは?
リリース日と提供範囲
Claude Sonnet 5は、2026年6月30日にAnthropic社から一般提供が開始されました。このモデルはリリースと同時に、Free(無料)プランやProプランのデフォルトモデルとして採用されたほか、Max、Team、Enterpriseといった各法人向けプラン、さらにはAPI経由でも全面的に利用可能となっています。
従来のSonnetシリーズが持っていたスピード感と、Opusシリーズに近い高度な推論能力を両立させた「真の次世代モデル」として位置付けられていますが、その高性能化に伴い、APIリクエスト時の制約が一部厳格化されている点に注意が必要です。
Sonnet 4.6の変更点
Sonnet 5は、旧世代のSonnet 4.6と比較して、推論の深さとコーディング能力が飛躍的に向上しました。しかし、システムプロンプトの解釈能力やサンプリング制御の仕組みが刷新されたことで、従来のコードのまま呼び出すと挙動が不安定になる、あるいはエラーを吐くケースが相次いでいます。
特に大きな変更点は、モデルが「自分で考え、必要に応じて推論ステップを拡張する」という思考プロセスのネイティブ実装です。これに伴い、開発者が手動で制御していたいくつかのパラメータが廃止、あるいは必須化されており、これが移行時の大きな壁となっています。
※一般的なブラウザでのUI操作に関するトラブル(ログインできない、画面が固まる等)については、当サイトの別記事「Claudeが使えない場合の原因と対処法」を参照してください。本記事はAPIや開発ツールを用いた実装者向けのエラーに特化しています。
400エラーが出る2つの原因
APIリクエストを送信した直後にHTTP 400 Bad Request(不正なリクエスト)が返ってくる場合、リクエストボディの構成がSonnet 5の仕様に適合していません。主な原因は以下の2つです。
サンプリング設定の禁止
Sonnet 5において「思考(thinking)」機能や特定の最適化モードを使用する場合、temperature(温度)、top_p、top_kといったサンプリングパラメータを規定値以外に設定することが禁止されました。
これまでは、回答の創造性を高めるために値を指定するのが一般的でしたが、Sonnet 5ではこれらの値を明示的に指定すると、「互換性のないパラメータ」として400エラーが返されます。特にエージェント構築において、出力の多様性を制御しようと細かく設定していたコードほど、この制約に抵触しやすくなっています。
手動の拡張思考の廃止
旧モデルであるSonnet 4.6の一部環境で試験的に導入されていた、手動の思考制御パラメータ(thinking: {type: "enabled", budget_tokens: N}など)は、Sonnet 5において完全に廃止されました。
4.6ではこれらの記述が残っていても警告(Warning)のみで処理が継続されるケースもありましたが、5では厳格なバリデーションが適用されます。リクエストボディにこの古い構造が含まれているだけで、APIサーバー側で即座に拒否され、エラーメッセージと共にリクエストが破棄されます。
関連記事:Claude Fable 5が突然使えなくなった理由|エラーの背景を時系列で解説

回答が出ない・途切れる原因
リクエスト自体は成功(HTTP 200)しているものの、期待した回答が返ってこない、あるいは文章の途中でブツ切りになる現象は、Sonnet 5の新しい思考ロジックを理解することで解決できます。
適応的思考のデフォルト化
Sonnet 5では、複雑なタスクに対してモデルが自動的に推論ステップを構築する「適応的思考(adaptive thinking)」が標準の挙動となりました。これにより、以前のモデルであればすぐに回答を書き始めていたような質問に対しても、内部で「思考(thinking tokens)」を生成してから最終回答を出力するようになっています。
この「思考」のプロセスは、モデルが高い精度を維持するために不可欠なものですが、開発者がその存在を計算に入れていないと、後述するトークン上限の問題を引き起こします。
思考トークンの上限算入
これが移行において最も見落とされやすいポイントです。Sonnet 5では、生成される「思考内容(内部モノローグ)」に使用されるトークンも、リクエスト時に指定するmax_tokens(最大生成トークン数)のカウントに含まれます。
例えば、max_tokensの設定が低い場合、モデルが回答の質を高めるために「思考」にトークンを割くと、実際の回答に割り当てられるトークンが不足します。その結果、回答が書き出しの途中で強制終了され、ユーザーには不完全な応答が届くことになります。

見落としやすい注意点
新トークナイザーのコスト
Sonnet 5では、より効率的で多言語対応に優れた新しいトークナイザーが採用されています。しかし、この新トークナイザーは旧モデルとトークンの切り出し方が異なるため、同じテキストを入力してもAnthropic公式の説明では消費トークン数が約30%増加するとされています。
これに関連し、API利用料についても確認が必要です。Sonnet 5の標準価格は入力100万トークンあたり3ドル・出力100万トークンあたり15ドルで、2026年8月31日までは導入価格として入力2ドル・出力10ドルが適用されます(トークン単価自体はSonnet 4.6と同額ですが、消費トークン数の増加で実質コストが変わる点に注意してください)。
セーフガード拒否の挙動
Sonnet 5では、安全性チェック(セーフガード)に抵触して回答を拒否する場合のレスポンス形式が変更されました。従来はHTTPエラーコードを返すことがありましたが、新仕様ではステータス200(成功)を返しつつ、レスポンス内のstop_reasonを"refusal"(拒否)として返却します。
「エラーが出ていないのに中身が空である」という場合、APIのステータスコードだけでなく、レスポンスのJSON構造をパースして拒否理由を確認するロジックを実装する必要があります。
関連記事:Claude Fable 5のセーフガードとは|3つの制限と自動切替の仕組み

正しい移行手順
Sonnet 5のポテンシャルを最大限に引き出し、エラーを解消するための移行手順は以下の4ステップです。
モデルIDの更新
まず、APIリクエストを送信する際のモデル指定を claude-sonnet-4-6 から claude-sonnet-5 に変更します。エイリアス運用を行っている場合も、バックエンドで参照している実体モデルが更新されているか再確認してください。
サンプリング設定の削除
400エラーを回避するため、リクエストボディから temperature、top_p、top_k の設定を削除します。Sonnet 5は思考ロジックを最適化するためにこれらをモデル側で動的に制御するため、開発者はこれらを「未指定(デフォルト)」にすることが推奨されます。
thinking設定の変更
旧式の thinking パラメータが含まれている場合は、それを削除します。最新のSDKを使用している場合は、必要に応じて effort パラメータなどを用いた新しい制御方法への切り替えを検討してください。
特にAIエージェント構築においては、この思考の深さをどう制御するかが鍵となります。具体的な制御方法については、当サイトの関連記事「Claude Codeでのモデル切り替え・effortコマンド運用」にて、エイリアス設定を含めた実践的な手順を詳説しています。
max_tokensの見直し
回答が途切れる問題を解決するために、max_tokens の値を従来の設定値よりも大幅に引き上げてください。思考トークンが消費される可能性を考慮し、余裕を持った値を設定することが安定運用のポイントです。

まとめ
Claude Sonnet 5への移行で直面するトラブルは、単なるバグではなく、AIモデルが「より深く思考する」という進化を遂げたことに伴う仕様変更です。
- 400エラーへの対応: サンプリングパラメータ(temperature等)を削除し、古いthinking設定を破棄する。
- 出力不足への対応:
max_tokensを思考トークン分を見越して大きく設定し、適応的思考(adaptive thinking)を許容する。 - コストと仕様の把握: 新トークナイザーによる消費変動と、最新の標準価格への移行を念頭に置く。
- エラー処理の刷新:
stop_reasonを確認し、セーフガードによる拒否を適切にハンドルする。
これらのステップを確実に踏むことで、Sonnet 5が持つ圧倒的な処理能力を自身のアプリケーションやエージェントに組み込むことができます。今すぐAPIの設定ファイルを開き、古いパラメータを「引き算」することから始めてみてください。
海外の最新AIニュースも、公式発表から日本語に要約してお届け。
「毎日忙しいけど、AIの最先端は知っておきたい」——そんな人のための1通です。




