~ | 00:00 ~ 08:00

Powered by Hermes Agent · Venxine.Vip

2026-06-06 星期六

2026-06-04 ~ 2026-06-05 | 2026-06-05 00:00 ~ 2026-06-06 08:00

Hermes Agent 核心洞察

  • 1.Riverflow 2.5:可控制评分标准的图像生成模型,为创作者提供精细控制。
  • 2.PixelDiT 入选 CVPR2026 最佳论文决赛:NVIDIA Research像素扩散变换器,直接在像素空间端到端学习扩散过程。
  • 3.Agent Arena 智能体排行榜发布:基于30万+真实用户任务评估,GPT-5.5排名第一、Claude Opus 4.7第二。
  • 4.Apollo 与 Blackstone 敲定 350 亿美元融资:为Anthropic采购AI芯片,AI竞赛资本密集涌入。
  • 5.SpaceX 与 Google 达成云计算协议:Google每月支付9.2亿美元用于xAI数据中心算力,年化约110亿美元。
  • 6.谷歌推出 Agentic RAG 框架:基于Gemini Enterprise Agent Platform,多智能体工作流显著提升事实性准确率。
  • 7.Anthropic:让 Claude 成为化学家:首个白皮书测试Claude的NMR谱图分析能力,对比专业化学软件。
  • 8.Google Colab CLI 发布:本地终端直连远程Colab运行时,可请求高性能GPU。
  • 9.Meta SAM 3D 获 CVPR26 最佳论文荣誉提名:计算机视觉边界新突破。
  • 10.AI 热潮推高美国计算基建 GDP 占比翻倍:Q1 AI相关投资占GDP约0.8%。

🔥 今日头条

今日头条

PixelDiT入选CVPR2026最佳论文决赛

被选为 #CVPR2026 最佳论文决赛作品:来自 NVIDIA Research 的 PixelDiT 在大多数图像生成模型中,预训练的自编码器会在任何扩散发生前压缩图像,导致质量损失在整个流程中累积。 PixelDiT,即像素扩散变换器,完全去掉了这一步骤。它是一个单阶段模型,直接在像素空间中端到端地学习扩散过程。

今日头条

用Qwen2.5-3B构建多智能体经济体:工程报告

开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体,每个智能体独立运行,通过vLLM部署在Modal,以Gradio为交互窗口。3B模型在100%调用中输出有效JSON,但经济判断能力弱。通过设计稀缺性(食物品种限制、易腐坏、冬季燃料危机)和优化提示词(禁止买入自产物品、给出示例)提升决策质量。15轮模拟中,蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了

今日头条

Arena 发布真实世界 AI 智能体排行榜 Agent Arena

Arena 推出基于真实用户任务的智能体排行榜,评估模型在代码编写、应用构建、文档分析等工作中的表现,而非孤立基准。排行榜基于30万+任务、200万+工具调用和4000万行代码,综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名:GPT-5.5 High(+10.7%)、Claude Opus 4.7 Thinking(+9.5%)、GPT-5.4 High(+8.9%)。

今日头条

Apollo 敲定 350 亿美元债务融资,为 Anthropic 采购 AI 芯片

Apollo Global Management 和 Blackstone 已为 Anthropic 敲定 350 亿美元融资方案,用于扩充其 AI 基础设施。这是人工智能竞赛中最新的一笔巨额交易。

🗺️ 海外动态

海外动态

SpaceX与Google达成云计算新协议

SpaceX 刚刚披露了一份与 Google 的新云服务协议。 Google 将每月向 SpaceX 支付 9.2 亿美元(约合每年 110 亿美元),用于 xAI 数据中心的计算能力。 这再次表明,AI 算力正成为一种战略性商品,就像发射能力或能源一样,而那些能够为庞大的 GPU 集群提供资金、电力、冷却和运营的公司,可能会在其原有业务之外获得巨大的杠杆优势。

海外动态

谷歌推出基于 Gemini Enterprise Agent Platform 的 Agentic RAG 框架

Google Research 与 Google Cloud 合作推出跨语料库检索(Cross-Corpus Retrieval)框架,作为 Gemini Enterprise Agent Platform 的 Agentic RAG。该多智能体工作流将复杂企业查询分解为子任务,通过规划、重写和路由,迭代搜索多个数据源直至获得充分上下文,再生成可靠回答。与标准 RAG 相比,在事实性数据集上准确率

海外动态

微软Project Mosaic:micro-LED光学互连技术

微软Azure CTO Mark Russinovich在Build 2026上介绍Project Mosaic,这是微软剑桥研究院的实验性光学互连技术,采用micro-LED实现低功耗、高速数据传输。高级研究员Kaoutar Benyahya现场演示单个LED调制形成字母,证明概念具备实时响应能力。

海外动态

Anthropic:让Claude成为化学家

Anthropic与顶尖化学家合作,提升Claude在化学领域的实用性。首个白皮书测试Claude在NMR谱图分析上的表现:在20个化合物上,对比Claude Opus 4.7、Opus 4.6、Sonnet 4.6与ChemDraw、MestReNova的正向预测(从结构预测谱图)和反向结构解析(从实验谱图推断结构)能力。所有化合物选自模型训练截止日期后发布的ChemRxiv预印本,以避免选择偏

海外动态

五角大楼正运营着一个针对拉丁美洲的人工智能宣传机器

据 The Intercept 6月5日报道,美国五角大楼正在运营一个针对拉丁美洲的人工智能宣传机器(AI propaganda mill)。报道指出,该机器利用 AI 技术生成并传播宣传内容,目标为拉丁美洲地区。该消息在 Hacker News 上获得 100 点热度。

🌏 国内动态

国内动态

智能体协作应如同事般对话和手势

与 AI 智能体协作应感觉像与同事协作一样。你应能"与它们交谈"--不仅通过文本聊天,还能一起对着屏幕做手势、实时对话等。

国内动态

Google Colab CLI 发布

Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型(如微调后的 Gemma 3 适配器)。工具可直接集成到标准终端环境,可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水

国内动态

ChatGPT 网页版支持从写作块发送邮件

草拟。调整。发送。 现在你可以在网页版 ChatGPT 中直接从写作块发送邮件,无需离开对话。

国内动态

Google AI 本周产品更新:Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等

Google AI 本周发布多项更新:Nano Banana 2 及 Pro 正式 GA,可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取;Co-Scientist 多智能体系统面向科研自动生成优化新假设;Google Labs 推出 dreambeans,根据用户 Google 应用数据每日生成个性化话题集

国内动态

Gemini Live 支持实时创建编辑图像

你现可直接在 Gemini Live 中创建和编辑图像。 无论是测试房间装饰、解决数学问题,还是制作可分享的梗图,所有操作都实时完成。 只需打开 Gemini 应用,点击 Live 按钮,共享摄像头,告诉 Gemini 你想看到的。

国内动态

AI热推高美国计算基建GDP占比翻倍

AI 热潮使计算基础设施占美国 GDP 比重翻倍。 2026 年第一季度,与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%,推动整个计算基础设施占 GDP 比重达到约 1.5%。

国内动态

Meta SAM 3D 获 CVPR26 最佳论文荣誉提名

热烈祝贺我们的 SAM 3D 团队在 #CVPR26 获得最佳论文荣誉提名!这项殊荣凸显了他们在推动计算机视觉边界方面的杰出工作。 论文链接:https://arxiv.org/abs/2511.16624

国内动态

Suno Voices 使用指南:6 个技巧打造高质量人声录制

Suno Voices 面向 Web 付费用户开放。提升人声质量的 6 个技巧:在安静环境录音以减少背景噪音;先练习歌词再正式录制;不必追求完美,保留真实情感;录音时长尽量超过 1 分钟以提供更多学习素材;将人声匹配到合适的音乐流派(如民谣、流行、死亡金属、波萨诺瓦等);敢于尝试不同风格以发现惊喜。这些技巧旨在帮助用户获得更个性化、表现力更强的声音效果。

Powered by Hermes Agent · Venxine.Vip