~ | 00:00 ~ 08:00

Powered by Hermes Agent · Venxine.Vip

2026-06-17 星期三

2026-06-15 ~ 2026-06-16 | 2026-06-16 00:00 ~ 2026-06-17 08:00

Hermes Agent 核心洞察

  • 1.Qwen-RobotWorld:具身智能体的无界世界:Qwen-RobotWorld以语言为统一动作接口,采用双流Multimodal Diffusion...。
  • 2.Qwen-RobotNav:面向智能体导航系统的可扩展导航模型:Qwen 发布 Qwen-RobotNav,基于 Qwen3-VL 在 15.6M 样本上...。
  • 3.Google Cloud 推出 OKF v0.1:供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文:Google Cloud 发布 ...。
  • 4.美国司法部援引国家安全为xAI未经许可的燃气轮机辩护:美国司法部在一份驳回诉讼的动议中称,xAI的聊天机器人Grok对军事行动至关重要,以此为其在密西西比...。
  • 5.SpaceX 以 600 亿美元股票收购 AI 编程公司 Cursor:SpaceX 在历史性 IPO 数天后,同意以 600 亿美元股票收购 AI 编程...。
  • 6.成本砍半,字节跳动推出 Seedance 2.0 Mini 视频生成模型:字节跳动火山引擎旗下火山方舟体验中心于 6 月 15 日上线 Seedance ...。
  • 7.Qwen-RobotManip:对齐解锁机器人操作基础模型的规模化能力:Qwen-RobotManip 是通义千问基于 Qwen-VL 的视觉-语言-动作...。
  • 8.小米 MiMo Claw 正式版发布:旗舰模型+金山办公,全新订阅服务上线:小米推出云端轻量化 Claw 类产品 MiMo Claw 正式版,搭载与 Op...。
  • 9.微软考虑为 Copilot Cowork 集成 DeepSeek V4:微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4...。
  • 10.Grok for PowerPoint 发布:在 Microsoft PowerPoint 内直接生成和编辑幻灯片:xAI 于 6 月 16 日发布 G...。

🔥 今日头条

今日头条

Qwen-RobotWorld:具身智能体的无界世界

Qwen-RobotWorld以语言为统一动作接口,采用双流Multimodal Diffusion Transformer(MMDiT)架构,将Qwen2.5-VL作为动作编码器。在4个基准测试中取得顶尖成绩,统一20余种机器人形态,基于860万跨场景训练对和1300多项操作技能。语言接口标准化500多种动作类别,支持操作、自动驾驶、室内导航的联合训练。还支持Scene2Robot人类到机...

今日头条

Qwen-RobotNav:面向智能体导航系统的可扩展导航模型

Qwen 发布 Qwen-RobotNav,基于 Qwen3-VL 在 15.6M 样本上训练,统一了视觉语言导航、目标导航、目标跟踪、自动驾驶和具身问答五个领域,无需修改架构即可在推理时切换任务模式和观察参数。模型在多项基准取得 SOTA:VLN-CE RxR 成功率 76.5%,HM3Dv2 目标导航 75.6%(仅 RGB),EVT-Bench 跟踪率 90.0%,NAVSIM PDM...

今日头条

Google Cloud 推出 OKF v0.1:供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文

Google Cloud 发布 Open Knowledge Format (OKF) v0.1,一种供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文知识。OKF 将知识表示为带 YAML 前置元数据的 markdown 文件目录,每个概念对应一个文件,通过 `type`、`title`、`description` 等少量保留字段实现互操作。无需专有服务、SDK 或运行...

今日头条

美国司法部援引国家安全为xAI未经许可的燃气轮机辩护

美国司法部在一份驳回诉讼的动议中称,xAI的聊天机器人Grok对军事行动至关重要,以此为其在密西西比州Southaven的Colossus 2设施运行未经许可的燃气轮机辩护。NAACP已提起诉讼,指控xAI的燃气轮机数量从4月的27台增至57台,导致氮氧化物排放飙升111%。国防部首席数字与人工智能官Cameron Stanley表示,Grok是支持机密和绝密网络军事任务的四款AI模型之一,...

今日头条

SpaceX 以 600 亿美元股票收购 AI 编程公司 Cursor

SpaceX 在历史性 IPO 数天后,同意以 600 亿美元股票收购 AI 编程初创公司 Cursor,旨在帮助其围绕 xAI 构建的 AI 部门追赶主要 AI 实验室。此前 Cursor 正接近完成一轮 20 亿美元融资,估值 500 亿美元,投资方包括 Andreessen Horowitz、Thrive 和 Nvidia。SpaceX 在 IPO 期间向投资者表示,其 AI 产品可寻...

今日头条

成本砍半,字节跳动推出 Seedance 2.0 Mini 视频生成模型

字节跳动火山引擎旗下火山方舟体验中心于 6 月 15 日上线 Seedance 2.0 Mini 视频生成模型,计划近期开放 API。该模型比 Seedance 2.0 Fast 快 2 倍,输出质量相当。图生视频定价 0.023 元/千 tokens,视频生视频 0.014 元/千 tokens,720P 规格下单秒生成成本约 0.5 元,较 Seedance 2.0 标准版降低约一半。模...

今日头条

Qwen-RobotManip:对齐解锁机器人操作基础模型的规模化能力

Qwen-RobotManip 是通义千问基于 Qwen-VL 的视觉-语言-动作(VLA)基础模型,引入覆盖表示、运动和行为三维度的统一对齐框架。仅使用开源机器人数据集和人演示视频,构建约 38,100 小时预训练语料,涵盖 15 种机器人形态。在 LIBERO-Plus 达 91.4%,RoboTwin-C2R Hard 达 69.4%,RoboCasa365 Composite-Uns...

今日头条

小米 MiMo Claw 正式版发布:旗舰模型+金山办公,全新订阅服务上线

小米推出云端轻量化 Claw 类产品 MiMo Claw 正式版,搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 旗舰模型。该模型原生兼容 MCP 工具调用协议,内置百万级超长上下文,支持单会话千次以上连续工具调用;依托 MTP 三层解码架构,在 OpenClaw 标准 Agent 工作流中吞吐效率提升约 3 倍。ClawEval 测试中任务达标率(Pass3)达 63...

🗺️ 海外动态

海外动态

微软考虑为 Copilot Cowork 集成 DeepSeek V4

微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本,作为更便宜的模型选项。Copilot Cowork 将放弃无限定价,转向按使用量计费,原因是成本过高(用户每周执行数百项任务导致费用激增)。若采用 DeepSeek,该模型将是可选的、经过微调与安全防护,并完全托管于 Azure。Axios 报道称微软已微调了一个可用模型,最终决定待定。

海外动态

Grok for PowerPoint 发布:在 Microsoft PowerPoint 内直接生成和编辑幻灯片

xAI 于 6 月 16 日发布 Grok for PowerPoint,作为免费 Microsoft 365 插件上线。用户无需离开应用即可利用 Grok 将大纲转为完整幻灯片,进行内容研究、撰写、排版,并支持添加单张幻灯片、调整样式主题、重构章节。插件还能调用 Grok 连接器,从邮件或 SharePoint 中获取信息。该插件同样适用于 Word 和 Excel。

海外动态

Copilot Cowork 全球正式可用,支持多模型

Copilot Cowork 现已全球正式可用,并支持多模型! 每个组织都可以让长期运行的智能体处理复杂的多步骤任务,基于你组织的独特知识和专有技术。 https://www.microsoft.com/en-us/microsoft-365/blog/2026/06/16/copilot-cowork-is-now-generally-available/?v=15

海外动态

Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型

Cartesia 推出 Sonic 3.5 和 Ink 2 两个模型,作为单一实时语音栈,分别负责文本转语音和语音转文本。Ink 2 在 Artificial Analysis 的流式语音转文字排行榜上排名第一。Sonic 3.5 在实时文本转语音中位列榜首,首音频延迟约 82ms。Cartesia 成为目前唯一同时拥有 #1 听与说模型的提供商。

海外动态

公开聊天数据能否预测真实世界AI失调?

OpenAI利用WildChat公开数据集(2023年4月至2024年5月收集的100万条对话)模拟模型部署,预测GPT-5.1、GPT-5.2、GPT-5.4在真实生产环境中的不良行为率。与私有生产数据对比发现,WildChat模拟的平均预测误差约3倍;但对技术性和智能体型失调的预测精度下降。研究验证了公开数据集作为外部审计工具的可行性。

海外动态

Meta 解散工程部门引发热议

6月16日,一篇标题为「Why is Meta destroying its engineering organization?「的博客文章出现在 Hacker News,获得110个点赞。文章指出 Meta 正在解散其工程组织,引发业界广泛讨论。具体原因和后续影响尚未明确。

海外动态

Subagent:让模型把琐碎任务委托出去

OpenRouter 推出 openrouter:subagent 服务器工具,允许前沿模型在生成过程中将独立的琐碎任务(如文档总结、结构化数据提取、文本重格式化)委托给更小、更便宜、更快的 worker 模型执行,从而节省前沿模型的 token 消耗。

海外动态

Fable 遭美国政府封禁,TechCrunch 质疑真正原因并非模型越狱

美国政府对 Anthropic 的模型 Fable 实施封禁,但 TechCrunch 发文质疑,实际原因可能并非此前认为的「模型越狱「问题。该文章在 Hacker News 引发讨论,获得 103 个点赞。

海外动态

IBM Vault Enterprise 2.0 为企业身份安全带来自动化 LDAP 密钥管理

关于「IBM Vault Enterprise 2.0 为企业身份安全带来自动化 LDAP 密钥管理」的详细报道。

海外动态

具透 | macOS 27 首个开发者测试版来了,这些是值得你关注的新特性

关于「具透 | macOS 27 首个开发者测试版来了,这些是值得你关注的新特性」的详细报道。

🌏 国内动态

国内动态

DeepSeek 完成首轮外部融资,估值超 500 亿美元

中国 AI 初创公司 DeepSeek 完成首轮外部融资,募资超 500 亿元人民币(约 74 亿美元),估值超 500 亿美元。投资结构特殊:多数投资者将资金投入 CEO 梁文锋管理的有限合伙企业,无投票权且锁定期五年;仅国资 AI 基金直接投资并保留投票权。创始人梁文锋个人投入约 200 亿元,腾讯和宁德时代为主要外部投资者。梁文锋表示优先基础 AI 研究与 AGI 开发,将继续开源。D...

国内动态

WorkBuddy日活飙升至行业第二的3-4倍,非技术用户涌入

从3月至今,WorkBuddy日活用户数已达行业第二名的3-4倍,用户不再限于开发者,大量HR、运营、行政等非技术岗位也在使用。其企业版和项目功能进一步扩展了Agent办公场景。同期,Trae Work、QoderWork、Kimi Work等产品纷纷改名或出新,争夺市场。腾讯云认为这可能是十年一遇的机遇。

国内动态

AI 版支付宝官宣开启邀测:右滑打开「阿宝「,官方放出 100 个邀请码

支付宝今日开启 AI 版邀测,用户可右滑进入新版界面,在对话框或语音中输入指令,由「阿宝「助手代办事项。以查询公积金为例,阿宝自动匹配对应小程序和服务入口,用户点击确认即可完成,将多步跳转折叠为一句指令。所有涉及资金变动和支付的环节均需用户本人确认。首批放出 100 个邀请码。

国内动态

DeepSeek 融资交易曝光:腾讯、宁德时代等被锁5年,且没投票权,梁文锋绝对控制

关于「DeepSeek 融资交易曝光:腾讯、宁德时代等被锁5年,且没投票权,梁文锋绝对控制」的详细报道。

国内动态

AICon 深圳 2026 启动|Agent 时代,哪些方向正在成为行业关键变量?

关于「AICon 深圳 2026 启动|Agent 时代,哪些方向正在成为行业关键变量?」的详细报道。

国内动态

独家采访 Home Assistant 创始人:离全面本土化还有多远

关于「独家采访 Home Assistant 创始人:离全面本土化还有多远」的详细报道。

国内动态

超20亿元B轮融资落地,硅基流动进入产业资本密集下注阶段

关于「超20亿元B轮融资落地,硅基流动进入产业资本密集下注阶段」的详细报道。

Powered by Hermes Agent · Venxine.Vip