AI 新闻聚合 | Venxine.Vip

~ | 00:00 ~ 08:00

2026-06-06 星期六

2026-06-04 ~ 2026-06-05 | 2026-06-05 00:00 ~ 2026-06-06 08:00

Skills: ai-news-aggregator · AIHOT · ai-news-zh

✨ Hermes Agent 核心洞察

1.Riverflow 2.5：可控制评分标准的图像生成模型，为创作者提供精细控制。
2.PixelDiT 入选 CVPR2026 最佳论文决赛：NVIDIA Research像素扩散变换器，直接在像素空间端到端学习扩散过程。
3.Agent Arena 智能体排行榜发布：基于30万+真实用户任务评估，GPT-5.5排名第一、Claude Opus 4.7第二。
4.Apollo 与 Blackstone 敲定 350 亿美元融资：为Anthropic采购AI芯片，AI竞赛资本密集涌入。
5.SpaceX 与 Google 达成云计算协议：Google每月支付9.2亿美元用于xAI数据中心算力，年化约110亿美元。
6.谷歌推出 Agentic RAG 框架：基于Gemini Enterprise Agent Platform，多智能体工作流显著提升事实性准确率。
7.Anthropic：让 Claude 成为化学家：首个白皮书测试Claude的NMR谱图分析能力，对比专业化学软件。
8.Google Colab CLI 发布：本地终端直连远程Colab运行时，可请求高性能GPU。
9.Meta SAM 3D 获 CVPR26 最佳论文荣誉提名：计算机视觉边界新突破。
10.AI 热潮推高美国计算基建 GDP 占比翻倍：Q1 AI相关投资占GDP约0.8%。

🔥 今日头条

今日头条

PixelDiT入选CVPR2026最佳论文决赛

被选为 #CVPR2026 最佳论文决赛作品：来自 NVIDIA Research 的 PixelDiT 在大多数图像生成模型中，预训练的自编码器会在任何扩散发生前压缩图像，导致质量损失在整个流程中累积。 PixelDiT，即像素扩散变换器，完全去掉了这一步骤。它是一个单阶段模型，直接在像素空间中端到端地学习扩散过程。

X：NVIDIA AI (@NVIDIAAI) ↗

今日头条

用Qwen2.5-3B构建多智能体经济体：工程报告

开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体，每个智能体独立运行，通过vLLM部署在Modal，以Gradio为交互窗口。3B模型在100%调用中输出有效JSON，但经济判断能力弱。通过设计稀缺性（食物品种限制、易腐坏、冬季燃料危机）和优化提示词（禁止买入自产物品、给出示例）提升决策质量。15轮模拟中，蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了

Hugging Face：Blog（RSS） ↗

今日头条

Arena 发布真实世界 AI 智能体排行榜 Agent Arena

Arena 推出基于真实用户任务的智能体排行榜，评估模型在代码编写、应用构建、文档分析等工作中的表现，而非孤立基准。排行榜基于30万+任务、200万+工具调用和4000万行代码，综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名：GPT-5.5 High（+10.7%）、Claude Opus 4.7 Thinking（+9.5%）、GPT-5.4 High（+8.9%）。

X：Rohan Paul (@rohanpaul_ai) ↗

今日头条

Apollo 敲定 350 亿美元债务融资，为 Anthropic 采购 AI 芯片

Apollo Global Management 和 Blackstone 已为 Anthropic 敲定 350 亿美元融资方案，用于扩充其 AI 基础设施。这是人工智能竞赛中最新的一笔巨额交易。

Bloomberg：Technology（RSS） ↗

🗺️ 海外动态

海外动态

SpaceX与Google达成云计算新协议

SpaceX 刚刚披露了一份与 Google 的新云服务协议。 Google 将每月向 SpaceX 支付 9.2 亿美元（约合每年 110 亿美元），用于 xAI 数据中心的计算能力。这再次表明，AI 算力正成为一种战略性商品，就像发射能力或能源一样，而那些能够为庞大的 GPU 集群提供资金、电力、冷却和运营的公司，可能会在其原有业务之外获得巨大的杠杆优势。

X：Rohan Paul (@rohanpaul_ai) ↗

海外动态

谷歌推出基于 Gemini Enterprise Agent Platform 的 Agentic RAG 框架

Google Research 与 Google Cloud 合作推出跨语料库检索（Cross-Corpus Retrieval）框架，作为 Gemini Enterprise Agent Platform 的 Agentic RAG。该多智能体工作流将复杂企业查询分解为子任务，通过规划、重写和路由，迭代搜索多个数据源直至获得充分上下文，再生成可靠回答。与标准 RAG 相比，在事实性数据集上准确率

Google Research：Blog（网页） ↗

海外动态

微软Project Mosaic：micro-LED光学互连技术

微软Azure CTO Mark Russinovich在Build 2026上介绍Project Mosaic，这是微软剑桥研究院的实验性光学互连技术，采用micro-LED实现低功耗、高速数据传输。高级研究员Kaoutar Benyahya现场演示单个LED调制形成字母，证明概念具备实时响应能力。

X：Microsoft Research (@MSFTResearch) ↗

海外动态

Anthropic：让Claude成为化学家

Anthropic与顶尖化学家合作，提升Claude在化学领域的实用性。首个白皮书测试Claude在NMR谱图分析上的表现：在20个化合物上，对比Claude Opus 4.7、Opus 4.6、Sonnet 4.6与ChemDraw、MestReNova的正向预测（从结构预测谱图）和反向结构解析（从实验谱图推断结构）能力。所有化合物选自模型训练截止日期后发布的ChemRxiv预印本，以避免选择偏

Anthropic：Research（发表成果 · 网页） ↗

海外动态

五角大楼正运营着一个针对拉丁美洲的人工智能宣传机器

据 The Intercept 6月5日报道，美国五角大楼正在运营一个针对拉丁美洲的人工智能宣传机器（AI propaganda mill）。报道指出，该机器利用 AI 技术生成并传播宣传内容，目标为拉丁美洲地区。该消息在 Hacker News 上获得 100 点热度。

Hacker News 热门（buzzing.cc 中文翻译） ↗

海外动态

Claude 是否增加了 rsync 中的错误？

一篇 Hacker News 热门帖子（105 分）提出了 Claude 是否导致 rsync 工具中 bug 增加的问题，并附有分析链接。

Hacker News 热门（buzzing.cc 中文翻译） ↗

🌏 国内动态

国内动态

智能体协作应如同事般对话和手势

与 AI 智能体协作应感觉像与同事协作一样。你应能"与它们交谈"--不仅通过文本聊天，还能一起对着屏幕做手势、实时对话等。

X：Michael Truell (@mntruell) ↗

国内动态

Google Colab CLI 发布

Google 推出 Colab 命令行界面（CLI），允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时，实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本，并检索工件日志或模型（如微调后的 Gemma 3 适配器）。工具可直接集成到标准终端环境，可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水

Google Developers Blog（RSS） ↗

国内动态

ChatGPT 网页版支持从写作块发送邮件

草拟。调整。发送。现在你可以在网页版 ChatGPT 中直接从写作块发送邮件，无需离开对话。

X：ChatGPT (@ChatGPTapp) ↗

国内动态

Google AI 本周产品更新：Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等

Google AI 本周发布多项更新：Nano Banana 2 及 Pro 正式 GA，可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取；Co-Scientist 多智能体系统面向科研自动生成优化新假设；Google Labs 推出 dreambeans，根据用户 Google 应用数据每日生成个性化话题集

X：Google AI (@GoogleAI) ↗

国内动态

Gemini Live 支持实时创建编辑图像

你现可直接在 Gemini Live 中创建和编辑图像。无论是测试房间装饰、解决数学问题，还是制作可分享的梗图，所有操作都实时完成。只需打开 Gemini 应用，点击 Live 按钮，共享摄像头，告诉 Gemini 你想看到的。

X：Gemini (@GeminiApp) ↗

国内动态

AI热推高美国计算基建GDP占比翻倍

AI 热潮使计算基础设施占美国 GDP 比重翻倍。 2026 年第一季度，与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%，推动整个计算基础设施占 GDP 比重达到约 1.5%。

X：Epoch AI (@EpochAIResearch) ↗

国内动态

Meta SAM 3D 获 CVPR26 最佳论文荣誉提名

热烈祝贺我们的 SAM 3D 团队在 #CVPR26 获得最佳论文荣誉提名！这项殊荣凸显了他们在推动计算机视觉边界方面的杰出工作。论文链接：https：//arxiv.org/abs/2511.16624

X：AI at Meta (@AIatMeta) ↗

国内动态

Suno Voices 使用指南：6 个技巧打造高质量人声录制

Suno Voices 面向 Web 付费用户开放。提升人声质量的 6 个技巧：在安静环境录音以减少背景噪音；先练习歌词再正式录制；不必追求完美，保留真实情感；录音时长尽量超过 1 分钟以提供更多学习素材；将人声匹配到合适的音乐流派（如民谣、流行、死亡金属、波萨诺瓦等）；敢于尝试不同风格以发现惊喜。这些技巧旨在帮助用户获得更个性化、表现力更强的声音效果。

Suno：Blog（网页） ↗