老黄也来养马了!英伟达版Hermes Agent发布
英伟达版Hermes Agent也来了!今天凌晨,英伟达官方连发两条帖子,力推Hermes Agent+NemoClaw方案。直接哐哐两支视频,教你把Hermes配上英伟达自家的部署方案,做一个“会自我进化、还跑得安全”的企业级AI。
详细介绍
英伟达版Hermes Agent也来了!
今天凌晨,英伟达官方连发两条帖子,力推Hermes Agent+NemoClaw方案。

这咋说呢…老黄你最终还是对Hermes下手了哈。
直接哐哐两支视频,教你把Hermes配上英伟达自家的部署方案,做一个“会自我进化、还跑得安全”的企业级AI。

官方X上发的那条视频,长达55分钟,技术博客、代码仓库什么的,也都一应俱全了。
由于视频太长,实在是看不完。
于是我总结了一下,英伟达版Hermes Agent的核心主要有三件事:
越用越聪明、数据不出本地、学到的技能重装系统都忘不掉。
英伟达版Hermes Agent,有啥特别?
这次发布的主角呢,就是大名鼎鼎的Hermes。
如果你要问Hermes是什么,我只能说…
不会吧不会吧,不会还有人不知道Hermes是什么吧??
咳咳,正经解释一下,Hermes是Nous Research开源的agent框架,MIT协议,代码完全公开。

目前在github上也是跑到17万星了。
自从Hermes释出之后,不少人觉得它比OpenClaw更加稳定,所以热度一直只增不减。
在最近的GTC Taipei上,老黄在发布RTXSpark时,也把Hermes和OpenClaw并列提及。
Hermes最核心的设计,是一套内置的学习闭环。
完成一个复杂任务之后,它会把自己的做法总结成一个技能存下来,下次遇到类似的事直接调用,不用再从头摸索。
用的时间越长,积累的技能越多,越趁手。
更厉害的是,Hermes还会随着时间建立一个“你是谁、你习惯怎么工作”的用户模型。
版本较新的Hermes还有一个自主运行的Curator,会按周期给技能库打分、合并重复的、归档过时的,让整个库保持干净。相当于agent自己在给自己做性能调优。
那么这次,英伟达给它配了一套完整的企业级装备:
NemoClaw作为整体部署蓝图,OpenShell在里面负责安全沙箱,底层推理默认跑Nemotron3Super模型。
从消费级的RTXPC到企业级的DGXSpark,整套方案主打全本地运行。

整个架构主要分为三层:
- 模型层(Nemotron 3 Super 120B-A12B):负责推理、选工具、起草回复;
- Harness层(Hermes):负责技能、记忆、会话管理、消息桥接;
- 运行时层(OpenShell):负责文件和网络策略、凭证代理、沙箱隔离。

使用场景上,英伟达特意出了个官方视频,来演示如何把它接入Slack、Outlook、GitHub和NVIDIA开发者论坛。
大家可以看看:

里面也演示了Hermes的自我进化能力:
比如你让agent每天拉一份GitHub issue日报,它回了一堆散装文字,格式太乱。
你说:
我只要5个issue加3个讨论,每条带编号、标题、状态、链接和一句话说明。
它给的格式对了,你就顺口夸一句:
对,以后都这样。
就这一句夸,Hermes自己就写了个SKILL.md文件存了下来。
第二天换个全新的对话窗口,同样的问题问下去,格式直接对了,数据是最新的,完全不需要重说之前的要求。
因为它存进了技能文件,而不是那次对话的记忆里。就算把沙箱整个删掉、重建、恢复,但技能还在。
那么,如何部署呢?
官网给出了一行命令:
curl -fsSL https://www.nvidia.com/nemoclaw.sh | NEMOCLAW_AGENT=hermes bash
如果你实在懒得打命令行,官网也提供了其他方式:
Help me install nvidia.com/nemoclaw
直接把这行命令复制给你的AI助手,让它帮你装上。
这行命令能拉起Hermes+NemoClaw的基础环境,但要复现演示里的四路数据源接入,还需要额外的配置步骤,具体可以参考技术博客。
演示的视频里接的是四个数据源(Slack、Outlook、GitHub、英伟达开发者论坛),但社区仓库里能接的远不止这些:
Google Workspace全家桶(Gmail、日历、Drive、Docs、Sheets)、实时航班追踪、卫星图像(Planet)、定时唤醒任务……
还有一个多模态版本,把Hermes接上Nemotron Omni,直接能处理视频、音频、图片和PDF。
基本上,你想接什么数据源,自己加集成就行。
主打一手安全牌
讲真,“越用越聪明”这件事对企业来说不是最大的顾虑。
他们担心的主要问题是:这玩意儿能不能别把内部数据传出去?
英伟达这套方案在安全上做了几层设计,而且有意思的地方在于,它的安全靠的是策略代码,而非靠模型自觉。
这部分在技术博客中也有详细说明。
首先,agent根本看不到你的Slack或Outlook令牌。
鉴权发生在沙箱代理的出口,token压根不会进入agent的视野。agent只管发出请求,真正的凭证由外面的代理注入,两者隔离。
其次,能接触内部敏感数据的agent,被硬性禁止访问公网。
就算这个agent哪天出了什么问题被人钻了空子,它也没有路径把数据发出去。
演示里的GitHub数据和论坛数据,是另走ETL流程同步好存下来,agent只有只读权限,不能主动拉取外部信息。

△图片由AI生成
第三,网络策略写在一个policy.yaml文件里:哪些主机、哪些端口、哪些HTTP方法——全部列死。
agent想碰白名单以外的目标,代理会直接返回403,Hermes把它当成一次普通的工具报错处理,连闹幺蛾子的机会都没有。
最后是可观测性。
agent每一步的决策——用了哪个技能、调了哪个工具、传了什么参数、回了什么——都会以轨迹的形式记录下来,通过NeMo Relay和Arize Phoenix查看。
出了问题不是黑盒,有迹可查。
英伟达盯上Hermes,不是一天两天了
本来文章到这里就差不多结束了。
但经过一番深扒,我发现英伟达早就对Hermes Agent有想法了。
如果把时间线往前翻一翻,会发现英伟达在5月13日发布了一篇博客。

这篇博客的内容是,把Hermes优化适配到了RTX PC和DGX Spark上,走的是面向个人开发者的消费侧路线,配的模型是阿里的Qwen 3.6。
而在5月31日的GTC Taipei,英伟达又来了一波:
发布了面向个人agent的Windows PC新品RTX Spark,把OpenShell运行时带上Windows,NemoClaw蓝图扩展到全线RTX和DGX产品。

同时,也宣布Hermes Agent和OpenClaw都将把OpenShell集成进各自即将推出的Windows原生应用。
这背后反映出一个大的趋势:英伟达也在抢agent入口。
从“卖芯片、扔个模型权重让你自己折腾”,一路往上做到了模型+蓝图+安全运行时+技能库这一层。
谁掌握了好用又安全的部署层,谁就掌握了agent时代真正的入口。
但说到底,当agent从一次性的问答工具变成常驻的、会越来越了解你工作习惯的“同事”——
企业敢不敢把数据交给会自己写技能的agent,才是真考验。
参考链接:
[1]https://x.com/NVIDIAAI/status/2061870499232190967
[2]https://x.com/NVIDIAAI/status/2061858457519575280
[3]https://developer.nvidia.com/blog/deploy-self-evolving-agents-for-faster-more-secure-research-with-a-hermes-agent-and-nvidia-nemoclaw
[4]https://github.com/NVIDIA/nemoclaw-community
文章来自于微信公众号 “量子位”,作者 “量子位”
