~ | 00:00 ~ 08:00

Powered by Hermes Agent · Venxine.Vip

2026-06-04 星期四

2026-06-02 ~ 2026-06-03 | 2026-06-03 00:00 ~ 2026-06-04 08:00

Hermes Agent 核心洞察

  • 1.Nemotron 3.5 Content Safety:多模态安全评估模型,支持企业自定义策略,128K上下文,覆盖140种语言。
  • 2.Google Magenta RealTime 2:开源实时音乐生成模型,延迟低于200ms,支持MIDI键盘、文本提示和手势演奏。
  • 3.Nex-N2-Pro:基于Qwen3.5的397B MoE推理模型,性能对标GPT-5.5和Claude Opus 4.7,自动调节推理深度。
  • 4.NVIDIA Nemotron 3 Ultra:专为长运行AI智能体优化的高效推理模型,显著降低计算成本。
  • 5.ChatGPT Dreaming 记忆系统:更强的跨对话记忆能力,自动记住用户偏好,个性化体验升级。
  • 6.OpenJarvis 本地优先 AI 框架:Stanford开源,设备端运行推理与学习,API成本降低约800倍。
  • 7.NotebookLM 来源归属:可查看生成内容所用的提示词与来源,支持一键迭代定制。
  • 8.Anthropic 开源漏洞发现框架:AI驱动的软件安全漏洞检测工具,已开源至GitHub。
  • 9.Hugging Face 重塑 CLI 输出格式:自动检测智能体驱动,输出紧凑TSV格式,token消耗降低最高6倍。
  • 10.马斯克谈 SpaceX 上市:正处大规模资本扩张期,计划发射约10万颗通信卫星。

🔥 今日头条

今日头条

Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全

Nemotron 3.5 Content Safety基于Gemma 3 4B IT,提供128K上下文窗口,支持用户提示、可选图像与助手响应的统一多模态安全评估。新增自定义策略执行,允许企业用自然语言定义专属安全规则;THINK模式可输出可审计的逐步推理痕迹。显式训练覆盖12种语言,并借助基座模型零样本泛化至约140种语言。输出提供低延迟二分类、带分类标签、THINK推理痕迹三种模式。安全分类遵

今日头条

Google Magenta RealTime 2 (MRT2) 实时音乐模型发布

Google AI for Developers 宣布推出开放权重的实时音乐模型 Magenta RealTime 2 (MRT2)。该模型可通过 MIDI 键盘、实时文本提示甚至手势进行演奏。MRT2 在 MacBook 上原生运行,延迟低于 200ms,提供开放权重、开源推理引擎以及配套应用和插件套件。

今日头条

Nex-N2-Pro 发布:基于 Qwen3.5 的 397B MoE 推理模型,性能达 GPT-5.5 水平

neolab 推出 Nex-N2-Pro,基于 Qwen3.5-397B-A17B,总参数 397B 的 MoE 推理模型,支持 262K 上下文与多模态(VLM),性能达到 GPT-5.5 和 Claude Opus 4.7 级别。模型可自动调节推理深度,减少 30-50% 思考 token 且无性能折损,在 Terminal Bench 2.1、GDPVal、SWE-Verified 上取得

今日头条

NVIDIA Nemotron 3 Ultra 为长时间运行的智能体带来更快、更高效的推理能力

NVIDIA 发布 Nemotron 3 Ultra 模型,专为长时间运行的 AI 智能体设计。该模型能够在多轮对话中保持上下文、调用工具、调用子智能体,并高效处理复杂工作流。随着多智能体协作导致模型 token 数量快速增长,Nemotron 3 Ultra 通过优化推理流程显著提升速度并降低计算成本,使长期运行的智能体任务更加可行。

🗺️ 海外动态

海外动态

NotebookLM 来源归属功能上线

今天,我们推出又一项呼声很高的功能:来源归属!🥳 无需再猜测。现在你可以看到每个创作物背后所用的确切公式(提示词 + 来源)。想要调整?只需轻点"迭代",随心定制 💖

海外动态

Gemini macOS 双击 Command 附加活动窗口

使用适用于 macOS 的 Gemini 应用,获取针对屏幕内容的定制帮助。💻 只需同时按下两个 Command ⌘ 键,即可将当前活动窗口无缝附加到聊天中,无需手动截图或切换标签页。

海外动态

Anthropic 开源 AI 驱动漏洞发现框架

Anthropic 将其用于 AI 驱动漏洞发现的开源框架代码托管在 GitHub 上。该框架借助 AI 技术进行漏洞发现,旨在帮助识别软件中的安全缺陷。

海外动态

OpenAI API 新增内容审核评分

Moderation scores 现已在 Responses API 和 Completions API 中可用。 在与生成相同的请求流程中返回审核信号,然后由你的应用决定如何使用它们进行记录、路由、审核或拦截。 https://developers.openai.com/api/docs/guides/moderation

海外动态

Codex 推出 iOS 应用构建插件

更多 iOS 应用循环,现已集成至 Codex。 Build iOS Apps 插件让 Codex 可在应用内浏览器查看和测试你的 iOS 应用,打开 SwiftUI 预览,并无需离开 Codex 即可热重载编辑。

海外动态

Replit Agent 联手 Shopify 快速建店

我们与 Shopify 合作,让你从想法到上线商店只需几分钟 只需告诉 Replit Agent 你想卖什么。它会: - 构建自定义店铺页面 - 创建你的 Shopify 商店 - 帮你添加商品 在 Shopify 中认领店铺,设置支付,即可开业。

海外动态

NotebookLM 推出福尔摩斯游戏笔记本

专业技巧:将笔记本游戏化 不要只是阅读笔记--去调查它们。我们全新的福尔摩斯笔记本将学习变成一款互动侦探游戏。推理事实,发现线索,证明即使是最复杂的问题也能迎刃而解。 ➡️ https://goo.gle/Sherlock

海外动态

Dreaming: ChatGPT 推出更强的记忆系统,更好记住用户偏好

ChatGPT 推出名为 Dreaming 的新记忆系统,能够更有效地记住用户偏好,并在跨对话场景中保持上下文的新鲜感和相关性,从而提升助手的个性化体验。

海外动态

Meet OpenJarvis:一个本地优先的设备端个人AI智能体框架,支持工具、记忆与学习

Stanford 研究人员发布 OpenJarvis,一个完全在设备端运行推理、智能体、记忆与学习的开源框架。它将个人 AI 系统分解为五个可组合原语:Intelligence、Engine、Agents、Tools & Memory 和 Learning。该框架与最佳云端模型的性能差距在 3.2 points 以内,边际 API 成本降低约 800 倍。

海外动态

Hugging Face 为编码智能体重塑 hf CLI 输出格式

Hugging Face 重新设计 hf CLI,使其同时服务人类用户和编码智能体(Claude Code、Codex 等)。CLI 通过环境变量自动检测智能体驱动,输出紧凑无截断的 TSV 格式,避免 ANSI 和交互提示,大幅降低 token 消耗。复杂多步任务中,不使用 CLI 的智能体 token 消耗最高达 hf CLI 的 6 倍。2026 年 4 月起,Hugging Face 追踪

🌏 国内动态

国内动态

马斯克谈SpaceX上市:正处大规模资本扩张期

马斯克在JPMorgan活动上回应SpaceX上市问题:他已被建议上市近10年,自2014-2015年起SpaceX就已实现正现金流并自筹资金,之前的私募轮次实际是面向投资者和员工的流动性/回购轮次。当前不同之处在于SpaceX正进入显著资本增长阶段,计划发射约10万颗通信卫星(可能超10万颗),AI和机器人对带宽需求巨大,还将在太空中建设AI数据中心,马斯克认为这将成为AI扩张的主要手段。

国内动态

Nemotron Parakeet ASR 印尼语准确率达 97.7%

当法律和监督依赖于转录内容时,70-80% 是不够的。 http://Rafiqspace.ai 通过微调 Nemotron Parakeet ASR 达到了 97.7% 的印尼语准确率(2.3% WER)-- 优于全球工具,同时每小时成本降低高达 90%。⚖️

国内动态

共存与协同智能的终结

Ethan Mollick 在 One Useful Thing 博客中,以"共存与协同智能的终结"为题,并附带介绍了如何向 AI 推销一本书。

国内动态

Google Research 发布被动心率监测系统 PHRM

Google Research 开发了一种被动心率监测系统(PHRM),利用智能手机前置摄像头在日常使用中(人脸解锁后数秒内)捕捉面部视频,通过深度学习估算心率,平均绝对百分比误差(MAPE)低于10%(对比心电图金标准),满足各肤色人群的行业精度标准。系统将全天心率测量整合为每日静息心率(RHR),平均绝对误差(MAE)低于5 bpm(对比可穿戴设备)。研究同时发布了迄今最大规模的公开智能手机视

国内动态

Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务

Boson AI 与 LMSYS 联合推出基于 SGLang-Omni 推理框架的 Higgs Audio v3 TTS 端到端服务。该模型约 4B 参数,基于 Qwen3-4B 骨干,支持 100 种语言(内部评测覆盖 111 种),在 Seed-TTS、CV3、MiniMax-Multilingual 及 Higgs-Multilingual 零样本语音克隆任务中达到单字级 WER/CER。开

国内动态

Alex Imas 和 Phil Trammell:AGI 后什么仍然稀缺?

经济学家 Alex Imas 和 Phil Trammell 指出,AGI 时代机器人数量可以快速复制增长,但人类独特技能(以芭蕾舞演员为例)的数量保持不变,揭示了即使技术大幅进步,某些稀缺资源仍不可替代。

国内动态

台积电难以跟上AI需求:"我们只能支持这么多"

全球最大芯片制造商台积电表示,通过美国本土生产满足客户需求可能需要"非常长的时间",凸显AI需求带来的产能压力。

国内动态

DeepSeek连续四周登顶Token份额榜

DeepSeek 现已连续四周在我们平台的 token 份额排行榜上位居第一: https://openrouter.ai/rankings

Powered by Hermes Agent · Venxine.Vip