中国のAI企業SenseTimeが、新しいモデル「SenseNova 5.5」を発表しました。このモデルには、中国初のリアルタイム多モーダルモデル「SenseNova 5o」も含まれています。
Contents
SenseNova 5oの特徴
SenseNova 5oは、AIとのやり取りをさらに進化させ、GPT-4oのストリーミング対話機能に匹敵する性能を提供します。これにより、ユーザーはまるで本物の人と会話しているかのようにAIとやり取りできるようになります。特にリアルタイムの会話や音声認識アプリケーションに適しています。
SenseTimeによると、この最新モデルは以下の点で競合を凌駕しています:
- 数学的推論
- 英語の習熟度
- コマンドフォローの能力
CEOのコメント
SenseTimeの取締役会長兼CEOであるXu Li博士は次のようにコメントしています:
「今年は大規模モデルが単一モーダルから多モーダルへ進化する重要な年です。ユーザーのニーズに応じて、SenseTimeはインタラクティビティの向上にも注力しています。アプリケーションがモデルの開発とその能力を推進し、多モーダルのストリーミング対話技術の進展と相まって、人間とAIのやり取りに前例のない変革をもたらすでしょう。」
SenseNova 5.5の改善点
SenseNova 5.5は、前バージョンのSenseNova 5.0に比べて全体の性能が30%向上しています。特に数学的推論、英語の習熟度、コマンドフォロー能力が改善されました。
低コストモデルの導入
SenseTimeは、先進的なAI機能へのアクセスを民主化するため、低コストのエッジサイド大規模モデルを導入しました。これにより、デバイス1台あたりのコストは年間わずか9.90元(約1.36ドル)に抑えられ、さまざまなIoTデバイスでの普及が期待されます。
エンタープライズ向けの「Project $0 Go」
SenseTimeは、OpenAIプラットフォームから移行する企業ユーザー向けに、無料のオンボーディングパッケージ「Project $0 Go」を開始しました。このイニシアチブには、5000万トークンのパッケージとAPI移行コンサルティングサービスが含まれており、企業がSenseNovaの機能を活用するための参入障壁を下げることを目指しています。
その他の新機能
- SenseChat Lite-5.5:前バージョンに比べて推論時間が40%短縮され、わずか0.19秒となりました。また、推論速度も15%向上し、90.2ワード/秒に達しています。
- Vimi:コントローラブルAIアバター動画生成ツール。1枚の写真から顔の表情や上半身の動きを精密にコントロールした短編動画を作成できます。
- SenseTime Raccoonシリーズ:AIネイティブな生産性向上ツールセット。Code Raccoonは応答速度が5倍に向上し、コーディングの精度も10%向上しました。Office Raccoonには消費者向けウェブページとWeChatミニアプリ版が追加されました。
さまざまな産業での活用
SenseTimeの大規模モデル技術は、金融、農業、文化観光などさまざまな産業で活用されています。金融業界では、コンプライアンス、マーケティング、投資リサーチの効率を向上させています。農業では、資材の使用を20%削減しながら収穫量を15%増加させることに成功しています。文化観光業界では、旅行の計画と予約の効率が大幅に向上しています。
現在、SenseNovaは、技術、医療、金融、プログラミング分野で3000以上の政府や企業の顧客によって利用されており、SenseTimeは主要なAIプレイヤーとしての地位を確立しています。