AI 新闻聚合 | Venxine.Vip

~ | 00:00 ~ 08:00

2026-06-17 星期三

2026-06-15 ~ 2026-06-16 | 2026-06-16 00:00 ~ 2026-06-17 08:00

Skills: ai-news-aggregator · AIHOT · ai-news-zh

✨ Hermes Agent 核心洞察

1.Qwen-RobotWorld：具身智能体的无界世界：Qwen-RobotWorld以语言为统一动作接口，采用双流Multimodal Diffusion...。
2.Qwen-RobotNav：面向智能体导航系统的可扩展导航模型：Qwen 发布 Qwen-RobotNav，基于 Qwen3-VL 在 15.6M 样本上...。
3.Google Cloud 推出 OKF v0.1：供应商中立的 Markdown 规范，为 AI 智能体提供结构化上下文：Google Cloud 发布 ...。
4.美国司法部援引国家安全为xAI未经许可的燃气轮机辩护：美国司法部在一份驳回诉讼的动议中称，xAI的聊天机器人Grok对军事行动至关重要，以此为其在密西西比...。
5.SpaceX 以 600 亿美元股票收购 AI 编程公司 Cursor：SpaceX 在历史性 IPO 数天后，同意以 600 亿美元股票收购 AI 编程...。
6.成本砍半，字节跳动推出 Seedance 2.0 Mini 视频生成模型：字节跳动火山引擎旗下火山方舟体验中心于 6 月 15 日上线 Seedance ...。
7.Qwen-RobotManip：对齐解锁机器人操作基础模型的规模化能力：Qwen-RobotManip 是通义千问基于 Qwen-VL 的视觉-语言-动作...。
8.小米 MiMo Claw 正式版发布：旗舰模型+金山办公，全新订阅服务上线：小米推出云端轻量化 Claw 类产品 MiMo Claw 正式版，搭载与 Op...。
9.微软考虑为 Copilot Cowork 集成 DeepSeek V4：微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4...。
10.Grok for PowerPoint 发布：在 Microsoft PowerPoint 内直接生成和编辑幻灯片：xAI 于 6 月 16 日发布 G...。

🔥 今日头条

今日头条

Qwen-RobotWorld：具身智能体的无界世界

Qwen-RobotWorld以语言为统一动作接口，采用双流Multimodal Diffusion Transformer（MMDiT）架构，将Qwen2.5-VL作为动作编码器。在4个基准测试中取得顶尖成绩，统一20余种机器人形态，基于860万跨场景训练对和1300多项操作技能。语言接口标准化500多种动作类别，支持操作、自动驾驶、室内导航的联合训练。还支持Scene2Robot人类到机...

Qwen ↗

今日头条

Qwen-RobotNav：面向智能体导航系统的可扩展导航模型

Qwen 发布 Qwen-RobotNav，基于 Qwen3-VL 在 15.6M 样本上训练，统一了视觉语言导航、目标导航、目标跟踪、自动驾驶和具身问答五个领域，无需修改架构即可在推理时切换任务模式和观察参数。模型在多项基准取得 SOTA：VLN-CE RxR 成功率 76.5%，HM3Dv2 目标导航 75.6%（仅 RGB），EVT-Bench 跟踪率 90.0%，NAVSIM PDM...

Qwen ↗

今日头条

Google Cloud 推出 OKF v0.1：供应商中立的 Markdown 规范，为 AI 智能体提供结构化上下文

Google Cloud 发布 Open Knowledge Format （OKF） v0.1，一种供应商中立的 Markdown 规范，为 AI 智能体提供结构化上下文知识。OKF 将知识表示为带 YAML 前置元数据的 markdown 文件目录，每个概念对应一个文件，通过 `type`、`title`、`description` 等少量保留字段实现互操作。无需专有服务、SDK 或运行...

Marktechpost ↗

今日头条

美国司法部援引国家安全为xAI未经许可的燃气轮机辩护

美国司法部在一份驳回诉讼的动议中称，xAI的聊天机器人Grok对军事行动至关重要，以此为其在密西西比州Southaven的Colossus 2设施运行未经许可的燃气轮机辩护。NAACP已提起诉讼，指控xAI的燃气轮机数量从4月的27台增至57台，导致氮氧化物排放飙升111%。国防部首席数字与人工智能官Cameron Stanley表示，Grok是支持机密和绝密网络军事任务的四款AI模型之一，...

The Decoder ↗

今日头条

SpaceX 以 600 亿美元股票收购 AI 编程公司 Cursor

SpaceX 在历史性 IPO 数天后，同意以 600 亿美元股票收购 AI 编程初创公司 Cursor，旨在帮助其围绕 xAI 构建的 AI 部门追赶主要 AI 实验室。此前 Cursor 正接近完成一轮 20 亿美元融资，估值 500 亿美元，投资方包括 Andreessen Horowitz、Thrive 和 Nvidia。SpaceX 在 IPO 期间向投资者表示，其 AI 产品可寻...

Techcrunch ↗

今日头条

成本砍半，字节跳动推出 Seedance 2.0 Mini 视频生成模型

字节跳动火山引擎旗下火山方舟体验中心于 6 月 15 日上线 Seedance 2.0 Mini 视频生成模型，计划近期开放 API。该模型比 Seedance 2.0 Fast 快 2 倍，输出质量相当。图生视频定价 0.023 元/千 tokens，视频生视频 0.014 元/千 tokens，720P 规格下单秒生成成本约 0.5 元，较 Seedance 2.0 标准版降低约一半。模...

Ithome ↗

今日头条

Qwen-RobotManip：对齐解锁机器人操作基础模型的规模化能力

Qwen-RobotManip 是通义千问基于 Qwen-VL 的视觉-语言-动作（VLA）基础模型，引入覆盖表示、运动和行为三维度的统一对齐框架。仅使用开源机器人数据集和人演示视频，构建约 38，100 小时预训练语料，涵盖 15 种机器人形态。在 LIBERO-Plus 达 91.4%，RoboTwin-C2R Hard 达 69.4%，RoboCasa365 Composite-Uns...

Qwen ↗

今日头条

小米 MiMo Claw 正式版发布：旗舰模型+金山办公，全新订阅服务上线

小米推出云端轻量化 Claw 类产品 MiMo Claw 正式版，搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 旗舰模型。该模型原生兼容 MCP 工具调用协议，内置百万级超长上下文，支持单会话千次以上连续工具调用；依托 MTP 三层解码架构，在 OpenClaw 标准 Agent 工作流中吞吐效率提升约 3 倍。ClawEval 测试中任务达标率（Pass3）达 63...

Mp ↗

🗺️ 海外动态

海外动态

微软考虑为 Copilot Cowork 集成 DeepSeek V4

微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本，作为更便宜的模型选项。Copilot Cowork 将放弃无限定价，转向按使用量计费，原因是成本过高（用户每周执行数百项任务导致费用激增）。若采用 DeepSeek，该模型将是可选的、经过微调与安全防护，并完全托管于 Azure。Axios 报道称微软已微调了一个可用模型，最终决定待定。

X ↗

海外动态

Grok for PowerPoint 发布：在 Microsoft PowerPoint 内直接生成和编辑幻灯片

xAI 于 6 月 16 日发布 Grok for PowerPoint，作为免费 Microsoft 365 插件上线。用户无需离开应用即可利用 Grok 将大纲转为完整幻灯片，进行内容研究、撰写、排版，并支持添加单张幻灯片、调整样式主题、重构章节。插件还能调用 Grok 连接器，从邮件或 SharePoint 中获取信息。该插件同样适用于 Word 和 Excel。

X ↗

海外动态

Copilot Cowork 全球正式可用，支持多模型

Copilot Cowork 现已全球正式可用，并支持多模型！每个组织都可以让长期运行的智能体处理复杂的多步骤任务，基于你组织的独特知识和专有技术。 https：//www.microsoft.com/en-us/microsoft-365/blog/2026/06/16/copilot-cowork-is-now-generally-available/？v=15

X ↗

海外动态

Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型

Cartesia 推出 Sonic 3.5 和 Ink 2 两个模型，作为单一实时语音栈，分别负责文本转语音和语音转文本。Ink 2 在 Artificial Analysis 的流式语音转文字排行榜上排名第一。Sonic 3.5 在实时文本转语音中位列榜首，首音频延迟约 82ms。Cartesia 成为目前唯一同时拥有 #1 听与说模型的提供商。

X ↗

海外动态

公开聊天数据能否预测真实世界AI失调？

OpenAI利用WildChat公开数据集（2023年4月至2024年5月收集的100万条对话）模拟模型部署，预测GPT-5.1、GPT-5.2、GPT-5.4在真实生产环境中的不良行为率。与私有生产数据对比发现，WildChat模拟的平均预测误差约3倍；但对技术性和智能体型失调的预测精度下降。研究验证了公开数据集作为外部审计工具的可行性。

Alignment ↗

海外动态

Meta 解散工程部门引发热议

6月16日，一篇标题为「Why is Meta destroying its engineering organization？「的博客文章出现在 Hacker News，获得110个点赞。文章指出 Meta 正在解散其工程组织，引发业界广泛讨论。具体原因和后续影响尚未明确。

Newsletter ↗

海外动态

Subagent：让模型把琐碎任务委托出去

OpenRouter 推出 openrouter：subagent 服务器工具，允许前沿模型在生成过程中将独立的琐碎任务（如文档总结、结构化数据提取、文本重格式化）委托给更小、更便宜、更快的 worker 模型执行，从而节省前沿模型的 token 消耗。

Openrouter ↗

海外动态

Fable 遭美国政府封禁，TechCrunch 质疑真正原因并非模型越狱

美国政府对 Anthropic 的模型 Fable 实施封禁，但 TechCrunch 发文质疑，实际原因可能并非此前认为的「模型越狱「问题。该文章在 Hacker News 引发讨论，获得 103 个点赞。

Techcrunch ↗

海外动态

IBM Vault Enterprise 2.0 为企业身份安全带来自动化 LDAP 密钥管理

关于「IBM Vault Enterprise 2.0 为企业身份安全带来自动化 LDAP 密钥管理」的详细报道。

Infoq ↗

海外动态

具透 | macOS 27 首个开发者测试版来了，这些是值得你关注的新特性

关于「具透 | macOS 27 首个开发者测试版来了，这些是值得你关注的新特性」的详细报道。

Sspai ↗

🌏 国内动态

国内动态

DeepSeek 完成首轮外部融资，估值超 500 亿美元

中国 AI 初创公司 DeepSeek 完成首轮外部融资，募资超 500 亿元人民币（约 74 亿美元），估值超 500 亿美元。投资结构特殊：多数投资者将资金投入 CEO 梁文锋管理的有限合伙企业，无投票权且锁定期五年；仅国资 AI 基金直接投资并保留投票权。创始人梁文锋个人投入约 200 亿元，腾讯和宁德时代为主要外部投资者。梁文锋表示优先基础 AI 研究与 AGI 开发，将继续开源。D...

The Decoder ↗

国内动态

WorkBuddy日活飙升至行业第二的3-4倍，非技术用户涌入

从3月至今，WorkBuddy日活用户数已达行业第二名的3-4倍，用户不再限于开发者，大量HR、运营、行政等非技术岗位也在使用。其企业版和项目功能进一步扩展了Agent办公场景。同期，Trae Work、QoderWork、Kimi Work等产品纷纷改名或出新，争夺市场。腾讯云认为这可能是十年一遇的机遇。

Mp ↗

国内动态