当前位置：首页 > news >正文

阿里将发布多模态模型 Qwen3-Omni，主打多语言与复杂推理；DeepvBrowser 上线 AI 语音浏览器丨日报

news 2025/9/23 11:30:07

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@Jerry fong，@鲍勃

01 有话题的技术

1、火山引擎「Doubao-Seed-Translation」上线：豆包翻译模型超越 GPT-4o

火山引擎近日宣布，其全新一代通用多语言翻译模型——Doubao-Seed-Translation（豆包翻译模型）已正式上线。这款模型凭借卓越的性能和强大的场景适配力，在多语言翻译领域树立了新标杆，支持全球 28 种语言的互译，并全面覆盖了中、英、日、韩、德、法、西、俄等主流语种。

在核心性能表现上，豆包翻译模型展现出令人瞩目的实力；中英翻译方面，其性能已逼近甚至媲美 Deepseek-R1 等顶尖模型；多语言翻译能力更是超越或持平了 GPT-4o 与 Gemini-2.5-Pro 等业界领先模型。经多项权威评测，豆包翻译模型在多个维度均达到了 SOTA（State-of-the-Art）水平，彰显了其领先的技术优势。

豆包翻译模型不仅在性能上出类拔萃，更具备了强大的实际应用价值。它能够精准处理各种复杂语境下的翻译需求，无论是严谨的办公文档、典雅的古诗文、鲜活的网络热词，还是专业的科技医疗报告，都能输出自然流畅、地道无「翻译腔」的译文。

在技术层面，该模型支持 4K 上下文输入和 3K 输出长度，为处理长篇复杂文本提供了坚实保障。同时，模型还具备自动识别源语言的功能，用户仅需指定目标语言即可高效调用，极大简化了操作流程。

（@橘鸭 Jeya）

2、阿里下一个要出的新模型：Qwen3-Omni，多模态，主打多语言和复杂推理

Qwen3-Omni，多模态，主打多语言和复杂推理，包括 Instruct 和 Thinking 版本。作为 Qwen-Omini 家族的下一代产品，Qwen-Omini 为全向模型带来了全新的结构、多语言和推理能力，在复杂的多模态任务中实现了卓越的性能。

( @ AIGCLINK)

02 有亮点的产品

1、xAI 融资百亿美元

据报道，Elon Musk 旗下人工智能公司 xAI 正以约 2000 亿美元 估值进行一轮超过 100 亿美元的融资。

CNBC 援引知情人士称，本轮资金将主要用于扩建算力集群**，Valor Capital、卡塔尔投资局** 以及沙特王子 Al Waleed bin Talal 旗下的**Kingdom Holding Co。**已确认参与投资。

2、DeepvBrowser 推出 AI 语音浏览器：无手操作与智能工作流

「DeepvBrowser」正式推出其「AI 语音浏览器」，旨在将传统以点击和打字为主的浏览体验，彻底转变为语音驱动。该浏览器通过理解用户意图并直接执行工作流，提供无手操作、即时 AI 摘要和会话式问答，为用户带来高效、智能且便捷的全新上网方式。

关键亮点

AI 语音驱动 ：告别传统点击与打字，实现纯语音控制的浏览器导航与交互，提升操作效率。
「Say it， Get it」工作流 ：不止是语音搜索，更是「语音 -> 动作 ->工作流」的范式转变，可直接执行复杂任务，例如「显示今日头条 AI 新闻并总结要点」，浏览器将自动完成获取与总结。
智能内容处理 ：提供即时 AI 摘要，将冗长信息浓缩成关键要点；以会话式问答代替无休止的链接列表，更高效地获取所需信息。
高效便捷交互 ：支持无手操作，减少打字和点击，并提供一键邮件分享等快捷功能，显著提升用户在浏览和信息处理时的便利性。