AWSの新兵器「Nova Act」とは?ブラウザ操作AIエージェントを簡単構築

日本時間2025年12月3日、Amazon Web Services(AWS)は年次イベント「re:Invent」において、新世代の基盤モデル「Amazon Nova」ファミリーと、AIエージェント構築サービス「Nova Act」を発表しました。
この発表は、AWSがAIエージェント市場に本格参入し、特にWebブラウザを操作してタスクを完遂する能力において、実用レベルのソリューションを提供し始めたことを意味します。
AWS基盤を利用する企業にとって、開発工数を劇的に下げるニュースとなるでしょう。
ブラウザ操作に特化した「Nova Act」の実力
今回発表されたサービスの中で、特に注目すべきは「Nova Act」です。これは汎用的な大規模言語モデル(LLM)とは異なり、「Webブラウザを操作してタスクを完了させること」に特化して設計・訓練されています。
強化学習で「迷わない」エージェントを実現
従来のLLMでブラウザ操作エージェントを開発しようとすると、「検索結果のどのボタンを押すべきか判断できない」「無限ループに陥る」といった問題が頻発していました。
AWSは、シミュレートされたWeb環境で数千回以上の試行錯誤(強化学習)を繰り返させることで、Nova Actの判断能力を徹底的に鍛え上げました。その結果、初期のワークフローにおいて90%以上の信頼性を達成したとされています。これにより、競合ECサイトの価格調査や、APIのない社内Webシステムへのデータ入力といった実業務において、エラーで止まることなく稼働するエージェントを構築可能になります。
用途で選べる「Amazon Nova」モデルファミリー
AIエージェントは、一つのタスクを完了するために何度も思考と行動を繰り返す(マルチターン)ため、1回あたりのコストと応答速度が重要になります。新しいAmazon Novaファミリーは、この課題に対して明確な使い分けを提案しています。
-
Nova 2 Lite: 非常に高速かつ低コスト。単純な定型業務エージェントや、リアルタイム性が求められるチャットボットに最適です。
-
Nova 2 Pro: 複雑な推論が可能。複数のドキュメントを読み込んで法的判断を下すエージェントや、コーディング支援などに適しています。
-
Nova 2 Omni: テキストだけでなく、画像や動画も理解するマルチモーダルモデル。
企業は「判断はPro、単純作業はLite」といった使い分けを行うことで、エージェント運用の経済合理性を高めることができます。
「Nova Forge」で自社専用の脳を作る
もう一つの重要な発表が、「Nova Forge」です。これは、AWSが提供するNovaモデルに対し、企業が持つ独自のデータを安全に組み込み、自社専用のモデルを作成(カスタマイズ)できる環境です。
専門用語も社内ルールも学習可能
例えば、専門用語が飛び交う金融機関のカスタマーサポートや、独自の規定が多い製造業の品質管理業務において、汎用モデルでは対応しきれないケースがあります。Nova Forgeを使えば、社内データを追加学習させることで、その会社特有の文脈を理解する「賢い専任エージェント」を作ることができます。
これらはすべてAWSの堅牢なセキュリティ環境下(Amazon Bedrock)で行われるため、機密情報を扱う企業でも安心して自社特化型エージェントの開発に取り組めます。
まとめ
AWSによる「Nova Act」と「Amazon Nova」ファミリーの発表は、AIエージェント開発における「信頼性」と「コスト」という二つの大きな壁を取り払うものです。
特に、Webブラウザ操作という具体的かつ需要の高いタスクに対して、AWSが公式に特化型ソリューションを提供した意義は大きく、今後多くのBtoB企業で、バックオフィス業務やリサーチ業務の自動化が加速することが予想されます。
出典: Amazon






