はじめての方へ
商品
サービス
ツール・アプリ
マーケット情報

アマゾンはAIマイルストーンを売り込み、リアルタイムスピーチでは新しいモデルがGPT-4oよりも優れていると述べています

ベンジンガ·04/08/2025 15:39:06
ニュースを聞く

アマゾン・ドットコム株式会社(NASDAQ: AMZN) は、Amazon Nova Sonic と呼ばれる新しい音声ベースの AI モデルをリリースしました。これは、AI 搭載アプリケーションにおけるリアルタイムの音声インタラクションを変えるように設計されています。

このシステムでは、音声認識と音声生成の両方が 1 つの統合アーキテクチャに統合されているため、複数のスタンドアロンモデルで各タスクを個別に管理する必要がなくなります。

Nova Sonic は、認識、通訳、音声出力を別々のシステムで処理していた従来の多段階アプローチを、単一の統合フレームワークに置き換えることで、音声処理を効率化します。

このオールインワンモデルにより、よりスムーズで本物そっくりの対話が可能になります。Amazon Bedrock経由で双方向ストリーミングAPIを介してアクセスできるこのテクノロジーは、医療、旅行、ホスピタリティなど、さまざまな分野をサポートする態勢を整えています。

同社によれば、Nova Sonicはイントネーション、リズム、一時停止などの微妙な音声要素をキャプチャし、人間の会話によく似た感度で応答できるという。

リアルタイムの中断に適応し、文脈上適切な話し方になるまで返信を保留します。この会話認識により、よりリアルで魅力的な対話が可能になり、カスタマーサービスや AI 主導のアシスタンスにおける役割に特に効果的です。

また読む:ロケットラボ株は今、どうなっているのか?

「Alexaによる世界最高のパーソナルAIアシスタントの発明から、幅広い業界で使用されるConnect、Lex、PollyなどのAWSサービスの開発まで、Amazonは長い間、音声駆動型アプリケーションがすべてのお客様の生活をより良く、より簡単にすると信じてきました」と、Amazon人工知能担当上級副社長のRohit Prasadは述べました。

標準化された業界評価では、Nova SonicはいくつかのカテゴリーでOpenAIのGPT-4o(リアルタイム)やGoogleのGemini Flash 2.0などの競合他社を上回りました

特に、Amazonによると、Nova Sonicは、Common EvalやMultiful LibriSpeechなどのデータセットと比較した場合、イギリス英語だけでなく、男性用と女性用の両方のアメリカ英語の声の勝率が高かった。

Nova Sonic は 5 つの主要言語で音声認識結果を提供し、単語の誤り率は 4.2% を記録しました。これは、OpenAI の同等の製品よりも 36% 以上向上しています。

また、厳しいオーディオ条件下でも優れており、ノイズの多い実際のテストでは競合他社を約 47% 上回りました。平均応答速度は 1 秒をわずかに上回り、GPT-4o よりも 80% 近くコストが低く、手頃な価格であることでも際立っています。

Amazonは2月に、カスタマーサービスの改善から在庫管理まで、複数の事業分野にわたって、さまざまな事業部門で約1,000件のジェネレーティブAIプロジェクトが現在進行中またはすでに作成されていると述べました

同社は今年、アルファベット750億ドル)やマイクロソフト(800億ドル)などのライバルと連携して、人工知能の取り組みに約1,000億ドルを投資する予定です

中国のAIスタートアップ企業であるDeepSeek's R1がローンチされ、そのパフォーマンスとコスト削減で波紋を呼んだことで、テクノロジー企業によるAI優位の追求は大きくなりました

価格動向:火曜日の最終チェックでは、AMZN株は178.07ドルで 1.6% 上昇した。

次を読む:

リスク警告: この記事は著者の個人的意見のみを表し、投資アドバイスやウェブルの意見を構成しません。ウェブルは、コンテンツの精度と信頼性を保証することはできません、また、この情報に起因するすべての損失の責任を負いません。