AWSの新兵器「Nova Act」とは?ブラウザ操作AIエージェントを簡単構築

日本時間2025年12月3日、Amazon Web Services(AWS)は年次イベント「re:Invent」において、新世代の基盤モデル「Amazon Nova」ファミリーと、AIエージェント構築サービス「Nova Act」を発表しました。

この発表は、AWSがAIエージェント市場に本格参入し、特にWebブラウザを操作してタスクを完遂する能力において、実用レベルのソリューションを提供し始めたことを意味します。
AWS基盤を利用する企業にとって、開発工数を劇的に下げるニュースとなるでしょう。

ブラウザ操作に特化した「Nova Act」の実力

今回発表されたサービスの中で、特に注目すべきは「Nova Act」です。これは汎用的な大規模言語モデル(LLM)とは異なり、「Webブラウザを操作してタスクを完了させること」に特化して設計・訓練されています。

強化学習で「迷わない」エージェントを実現

従来のLLMでブラウザ操作エージェントを開発しようとすると、「検索結果のどのボタンを押すべきか判断できない」「無限ループに陥る」といった問題が頻発していました。

AWSは、シミュレートされたWeb環境で数千回以上の試行錯誤(強化学習)を繰り返させることで、Nova Actの判断能力を徹底的に鍛え上げました。その結果、初期のワークフローにおいて90%以上の信頼性を達成したとされています。これにより、競合ECサイトの価格調査や、APIのない社内Webシステムへのデータ入力といった実業務において、エラーで止まることなく稼働するエージェントを構築可能になります。

用途で選べる「Amazon Nova」モデルファミリー

AIエージェントは、一つのタスクを完了するために何度も思考と行動を繰り返す(マルチターン)ため、1回あたりのコストと応答速度が重要になります。新しいAmazon Novaファミリーは、この課題に対して明確な使い分けを提案しています。

  • Nova 2 Lite: 非常に高速かつ低コスト。単純な定型業務エージェントや、リアルタイム性が求められるチャットボットに最適です。

  • Nova 2 Pro: 複雑な推論が可能。複数のドキュメントを読み込んで法的判断を下すエージェントや、コーディング支援などに適しています。

  • Nova 2 Omni: テキストだけでなく、画像や動画も理解するマルチモーダルモデル。

企業は「判断はPro、単純作業はLite」といった使い分けを行うことで、エージェント運用の経済合理性を高めることができます。

「Nova Forge」で自社専用の脳を作る

もう一つの重要な発表が、「Nova Forge」です。これは、AWSが提供するNovaモデルに対し、企業が持つ独自のデータを安全に組み込み、自社専用のモデルを作成(カスタマイズ)できる環境です。

専門用語も社内ルールも学習可能

例えば、専門用語が飛び交う金融機関のカスタマーサポートや、独自の規定が多い製造業の品質管理業務において、汎用モデルでは対応しきれないケースがあります。Nova Forgeを使えば、社内データを追加学習させることで、その会社特有の文脈を理解する「賢い専任エージェント」を作ることができます。

これらはすべてAWSの堅牢なセキュリティ環境下(Amazon Bedrock)で行われるため、機密情報を扱う企業でも安心して自社特化型エージェントの開発に取り組めます。

まとめ

AWSによる「Nova Act」と「Amazon Nova」ファミリーの発表は、AIエージェント開発における「信頼性」と「コスト」という二つの大きな壁を取り払うものです。

特に、Webブラウザ操作という具体的かつ需要の高いタスクに対して、AWSが公式に特化型ソリューションを提供した意義は大きく、今後多くのBtoB企業で、バックオフィス業務やリサーチ業務の自動化が加速することが予想されます。

出典: Amazon

ホワイトペーパー無料配布中!

「AIエージェントがどのような歴史を辿ってきて、なぜ流行っているのか?導入するメリットは何か?活用事例は?」
そんな疑問を解決する1冊になっています。

今なら、メルマガを新規ご登録いただいた方全員にプレゼントしていますので、この機会にどうぞ!