Hermes Agent 版本演进全记录
数据来源:GitHub NousResearch/hermes-agent 官方 Release Notes + 公开技术博客
最后更新:2026-05-02
版本总览
| 版本 | 日期 | 代号 | 核心技术标签 |
|---|---|---|---|
| v0.1.0 | 2026.2.25 | 起点 | 自进化框架、学习循环 |
| v0.2.0 | 2026.3.12 | 集成加速 | MCP+IDE集成、GLM/Kimi |
| v0.3.0 | 2026.3.x | 插件时代 | 插件架构、CDP浏览器、流式输出 |
| v0.4.0 | 2026.3.x | API Server | OpenAI兼容、前端生态 |
| v0.5.0 | 2026.3.x | 模型爆炸 | 400+模型、安全强化 |
| v0.6.0 | 2026.4.x | 多实例 | Profiles隔离、MCP Server、故障转移 |
| v0.7.0 | 2026.4.x | 内存插件化 | 记忆系统可插拔 |
| v0.8.0 | 2026.4.8 | Intelligence | 后台通知、实时切换、自优化 |
| v0.9.0 | 2026.4.13 | Everywhere | 移动端、微信iMessage、Web面板 |
| v0.10.0 | 2026.4.16 | Tool Gateway | 零门槛工具、118 Skills |
| v0.11.0 | 2026.4.23 | Interface | React/Ink重写、插件架构 |
| v0.12.0 | 2026.4.30 | 最新 | 性能+40%、Token-30%、原生微信 |
v0.1.0 — 2026.2.25 — 起点
代号:"An agent that grows with you"
Hermes Agent 由 Nous Research(团队约20人,核心成员来自 StabilityAI)于 2026 年 2 月 25 日正式发布。
核心特性
- 一行安装命令即可完成部署
- 产品定位:会与你一起成长的 AI Agent
- 内置学习循环框架(Learning Loop):从任务中自动提炼技能
- 跨会话记忆:长期记住用户偏好
- 自动生成 Skills:运行时自动创建可复用技能脚本
- 当时社区几乎无人关注——整个开源世界都在盯着 OpenClaw(小龙虾)
"An agent that grows with you" — 这是 Hermes 区别于所有其他 Agent 框架的核心定位。
v0.2.0 — 2026.3.12 — 集成加速
首个有标签的正式版本
首个正式 Release Tag,在 v0.1.0 基础上快速迭代。
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| MCP 客户端 + ACP 服务器 | 完整集成 Model Context Protocol |
| IDE 无缝连接 | 支持 VS Code 和 JetBrains 全家桶 |
| 国产模型接入 | 接入智谱 GLM、Kimi 等国内大模型 |
| 消息网关架构 | 消息平台接入架构初步建立 |
v0.3.0 — 2026.3.x — 插件时代
距 v0.2.0 仅 5 天,合并 248 个 PR。
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| 完整插件系统 | 引入可扩展插件架构,第三方可自由接入 |
| 统一流式输出 | 所有交互统一流式响应,实时可见 |
| CDP 原生支持 | 原生 Chrome DevTools Protocol,可程序化操控浏览器 |
| 实时交互 | 用户输入与 Agent 输出同步呈现 |
社区评价:"5天248个PR,原生支持Chrome操控、插件架构、实时流式输出"
v0.4.0 — 2026.3.x — API Server
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| OpenAI 兼容 API Server | Hermes 自身作为 OpenAI 兼容 HTTP 端点暴露 |
| 全前端生态接入 | Open WebUI、LobeChat、NextChat、LibreChat、ChatBox 等任意 OpenAI 格式前端直连 |
| 完整工具集保留 | 对接后仍保留 terminal/file/记忆/Skills 全部工具能力 |
意义:Hermes 从一个 Agent 工具,蜕变为可接入任意 AI 前端的 Agent 服务端。
v0.5.0 — 2026.3.x — 模型爆炸
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| 400+ 模型支持 | 在单一 Agent 内同时支持 400+ 个不同模型 |
| 安全强化 | 实际工作流安全加固,修复多项潜在安全漏洞 |
| 可靠推理 | 推理链路稳定性提升,确保长时间自动化任务可靠执行 |
推理创造可靠的自动化。安全更新决定了代理能否真正用于生产环境。
v0.6.0 — 2026.4.x — 多实例
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| Profiles 多实例隔离 | 支持多配置文件,每个 Profile 独立运行、互不干扰 |
| MCP Server Mode | Hermes 本身作为 MCP Server 暴露给外部工具调用 |
| 备用提供者链 | 多模型 fallback 链,主模型故障自动切换备选 |
| 自动故障转移 | 推理服务不间断 |
总结:两个改变日常的核心功能——多实例配置(日常高频)和备用提供者链(生产级高可用)
v0.7.0 — 2026.4.x — 内存插件化
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| 内存插件化 | Memory(记忆系统)变为可插拔插件,可替换任意后端或自行实现 |
| 韧性强化 | 异常处理和网络波动抵抗力显著增强 |
| 自定义记忆后端 | 用户可基于插件接口开发自己的记忆存储(如 Redis、向量数据库等) |
v0.8.0 — 2026.4.8 — Intelligence Release
合并 209 个 PRs,解决 82 个 issues。
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| 后台任务自动通知 | 长任务完成后自动推送通知,无需持续轮询 |
| 实时模型切换 | 全平台支持运行中动态切换模型,无须重启 |
| 自优化 GPT/Codex | 内置自我优化指导策略,模型可自主改进推理路径 |
| Google AI Studio 原生 | 官方接入 Google AI Studio |
| 智能空闲超时 | Smart inactivity timeouts,节省资源 |
| 审批按钮 | Approval buttons,任务执行前人工审批确认 |
| MCP OAuth 2.1 | MCP 认证协议全新升级 |
| 免费 MiMo v2 Pro | Nous Portal 用户免费获赠 |
v0.9.0 — 2026.4.13 — Everywhere Release
合并 487 个 commits + 269 个 PRs,规模创历史之最。
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| Termux/Android | 首次支持手机端运行,Hermes 进入移动时代 |
| iMessage 接入 | 苹果 iMessage 消息平台原生接入 |
| WeChat 接入 | 微信消息平台原生接入 |
| Fast Mode | OpenAI 和 Anthropic 推理加速模式,延迟大幅降低 |
| 后台进程监控 | 进程生命周期完整管理,进程状态可视化 |
| 本地 Web Dashboard | 可视化 Web 管理面板,任务状态实时监控 |
| 生命周期表情 | 状态用 emoji 直观显示(🟢运行中/🟡等待/🔴错误等) |
| 语音通道管理 | 语音交互支持 |
v0.10.0 — 2026.4.16 — Tool Gateway Release
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| Nous Tool Gateway | 付费订阅用户无需配置任何 API Key,直接使用联网搜索/图像生成/TTS/浏览器自动化 |
| 118 个内置 Skills | 开箱即用的任务技能库,覆盖主流工作场景 |
| 三层记忆体系 | Session(会话)→ User Profile(用户画像)→ Long-term(长期记忆) |
| 6 个消息平台 | 集成微信、WhatsApp、Telegram 等主流 IM |
| 运行时自进化 | 自动生成 Skills + 自我改进回路,愈用愈聪明 |
意义:180+ 项改进,开启"零门槛 AI 工具时代"——普通用户无需任何配置,开箱即用高阶 AI 能力。
v0.11.0 — 2026.4.23 — Interface Release
⚠️ 有 Breaking Change:旧版 terminal UI 被 Ink 完全替换,升级后 TUI 配置需要调整。
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| React/Ink 重写 TUI | 交互式 CLI 底层完全重构,体验焕然一新 |
| Pluggable Transport | 传输层架构完全插件化,可自由替换底层传输实现 |
| 原生 AWS Bedrock | 云端大模型(AWS 托管)原生支持 |
| 5 条新推理路径 | 推理效率进一步提升 |
| QQBot | 第 17 个消息平台 |
| GPT-5.5 via Codex OAuth | OpenAI 最新模型官方接入 |
| Web 控制台插件化 | 第三方可直接扩展控制台插件功能 |
v0.12.0 — 2026.4.30 — Curator Release
发布规模:1,096 commits · 550 个 PRs · 217,776 行新增代码 · 213 位贡献者
代号"Curator"——Hermes 现在学会自我维护了。
核心技术更新
| 技术方向 | 具体内容 |
|---|---|
| 🤖 Autonomous Curator | 后台自主 Curator Agent(默认7天周期),自动评分/裁剪/合并 Skills 库,写入 logs/curator/run.json + REPORT.md 报告。内置防御保护,防止核心 Skills 被误删 |
| 🔄 自我改进回路重写 | 从自由形式 → 规则评分制(rubric-based);偏好更新刚用过的技能;正确继承父进程 provider/credentials;内存插件干净关闭;上一轮工具消息不进入摘要,保证干净上下文 |
| 🎨 ComfyUI v5 | 官方 CLI + REST + 硬件检测本地安装,从可选升级为默认内置 |
| 🖼️ TouchDesigner-MCP | 默认内置,新增 GLSL/post-FX/audio/geometry 支持 + 9份新参考文档 |
| 🎵 Spotify 原生集成 | 7个工具(播放/搜索/队列/歌单/设备)+ PKCE OAuth + 交互向导 + cron 用法文档 |
| 📹 Google Meet 插件 | 加入会议/转录/发言/跟进,OpenAI Realtime Transport + Node bot 服务端 |
| 💬 Microsoft Teams | 成为第 19 个消息平台(作为 Gateway 插件架构的首个第三方插件) |
| 💬 腾讯元宝 | 成为第 18 个消息平台,原生支持文本+媒体发送 |
| ⚡ TUI 冷启动 | 提速约 57% |
| 🖥️ LM Studio | 从自定义端点别名升级为一等公民 Provider,完整 auth + hermes doctor 检测 + 推理传输 + 实时 /models 列表 |
| ☁️ 4 个新推理 Provider | GMI Cloud(原生)、Azure AI Foundry(自动检测)、MiniMax OAuth(PKCE 浏览器流程)、Tencent Tokenhub |
| 📊 Models Dashboard | 丰富的 per-model 分析标签页,Dashboard 内直接切换主模型+辅助模型 |
| 🖼️ 多模态图片路由 | 图片根据模型实际视觉能力路由,而非 Provider 默认值 |
🚀 hermes -z 单次模式 |
非交互式 hermes -z "<prompt>" + --model/--provider/HERMES_INFERENCE_MODEL 参数 |
🔍 hermes update --check |
更新前预检,Opt-in 预升级 HERMES_HOME 备份 |
| 🌐 远程模型目录 | OpenRouter + Nous Portal 模型目录从远程 manifest 拉取,新模型无需发版即可出现 |
| 📱 Gateway 媒体能力对齐 | 多图发送覆盖 Telegram/Discord/Slack/Mattermost/Email/Signal;FLAC 支持 + Telegram 文档回退 |
技术演进总结
42 天 8 个大版本,核心演进逻辑
第1阶段(2-3月):基础设施
v0.1 → v0.2 → v0.3 → v0.4 → v0.5
核心:插件架构 → IDE集成 → 流式输出 → API Server → 400+模型
第2阶段(4月上旬):韧性扩展
v0.6 → v0.7 → v0.8
核心:多实例隔离 → 内存插件化 → 后台任务 + 实时切换
第3阶段(4月中旬起):生态与性能
v0.9 → v0.10 → v0.11 → v0.12
核心:全平台 → 零门槛工具 → TUI重构 → 性能突破
关键里程碑
| 里程碑 | 版本 | 意义 |
|---|---|---|
| 自进化框架诞生 | v0.1.0 | 定位"与你共同成长",区别所有竞品 |
| 插件架构引入 | v0.3.0 | 生态开放的基础 |
| 成为 API Server | v0.4.0 | 从工具到平台的转折点 |
| 全平台覆盖 | v0.9.0 | 移动端突破 |
| 零门槛工具 | v0.10.0 | 非技术用户也能用 |
| 性能飞跃 | v0.12.0 | Token 消耗降低 30-50%,原生微信 |
核心技术壁垒
- 内置学习闭环:运行时自动生成 Skills、记忆用户偏好、持续自我改进
- 三层记忆体系:Session → User Profile → Long-term,跨越会话理解用户
- Nous Tool Gateway:订阅制免 API Key,降低使用门槛
- 全平台消息集成:微信/iMessage/Telegram/WhatsApp/Slack/Discord/腾讯元宝/Teams 等 19 个消息平台
- Autonomous Curator:后台自动整理 Skills 库,无需人工干预
数据来源:GitHub NousResearch/hermes-agent, NewReleases.io, Foresight News, 各社区翻译整理