SenseTimeが新しいバージョンのAIモデル「SenseNova 5.5」を発表しました。このモデルには、中国初のリアルタイムマルチモーダルモデル「SenseNova 5o」が含まれています。
SenseNova 5oは、GPT-4oのストリーミングインタラクション機能に匹敵する機能を提供し、ユーザーがまるで本物の人と会話しているかのようにモデルと対話できるようにします。これにより、リアルタイムの会話や音声認識アプリケーションに特に適しています。
SenseTimeによれば、最新のモデルは多くのベンチマークで競合他社を上回る性能を持っています。
SenseTimeの取締役会長兼CEOの徐立博士は、「今年は大規模モデルが単一モーダルからマルチモーダルへと進化する重要な年です。ユーザーのニーズに応じて、SenseTimeもインタラクティビティの向上に注力しています。」とコメントしています。
SenseNova 5.5は、わずか2か月前にリリースされたSenseNova 5.0と比べて全体的なパフォーマンスが30%向上しています。特に、数学的推論、英語力、命令の理解能力が向上しています。
SenseTimeは、先進的なAI機能へのアクセスを広げるために、コスト効果の高いエッジサイド大規模モデルも導入しました。この開発により、デバイスあたりの年間コストが最低RMB 9.90(約1.36ドル)まで低下し、さまざまなIoTデバイスでの広範な採用が促進されるでしょう。
さらに、SenseTimeは「Project $0 Go」という、OpenAIプラットフォームから移行する企業ユーザー向けの無料のオンボーディングパッケージを導入しました。このイニシアチブには、5000万トークンのパッケージとAPI移行コンサルティングサービスが含まれており、SenseNovaの機能を活用したい企業にとって参入障壁を低くしています。
SenseTimeは、エッジサイドAIへの取り組みを強化するために、SenseChat Lite-5.5をリリースしました。このモデルは、推論時間が従来のモデルに比べて40%短縮され、0.19秒にまで改善されました。推論速度も15%向上し、毎秒90.2ワードに達しています。
新しいAIアプリケーションを拡充するために、SenseTimeはVimiという制御可能なAIアバター動画生成ツールを導入しました。このツールは、一枚の写真から表情や上半身の動きを精密に制御して短い動画クリップを作成することができ、エンターテイメントやインタラクティブアプリケーションで新しい可能性を開きます。
さらに、SenseTimeはSenseTime RaccoonシリーズのAIネイティブ生産性ツールもアップグレードしました。Code Raccoonは応答速度が5倍に向上し、コーディング精度も10%増加しました。Office Raccoonは、消費者向けのウェブページとWeChatミニアプリバージョンが追加されました。
SenseTimeの大規模モデル技術は、さまざまな業界で大きな波を起こしています。金融セクターでは、コンプライアンス、マーケティング、投資調査の効率を向上させています。農業では、資材使用を20%削減しながら、作物収量を15%増加させています。文化観光産業では、旅行計画や予約の効率が大幅に向上しています。
既に3000以上の政府機関や企業が技術、医療、金融、プログラミング分野でSenseNovaを使用しており、SenseTimeは主要なAIプレーヤーとしての地位を確固たるものにしています。