x

Hermes Agent 版本演进全记录

数据来源:GitHub NousResearch/hermes-agent 官方 Release Notes + 公开技术博客
最后更新:2026-05-02

版本总览

版本 日期 代号 核心技术标签
v0.1.0 2026.2.25 起点 自进化框架、学习循环
v0.2.0 2026.3.12 集成加速 MCP+IDE集成、GLM/Kimi
v0.3.0 2026.3.x 插件时代 插件架构、CDP浏览器、流式输出
v0.4.0 2026.3.x API Server OpenAI兼容、前端生态
v0.5.0 2026.3.x 模型爆炸 400+模型、安全强化
v0.6.0 2026.4.x 多实例 Profiles隔离、MCP Server、故障转移
v0.7.0 2026.4.x 内存插件化 记忆系统可插拔
v0.8.0 2026.4.8 Intelligence 后台通知、实时切换、自优化
v0.9.0 2026.4.13 Everywhere 移动端、微信iMessage、Web面板
v0.10.0 2026.4.16 Tool Gateway 零门槛工具、118 Skills
v0.11.0 2026.4.23 Interface React/Ink重写、插件架构
v0.12.0 2026.4.30 最新 性能+40%、Token-30%、原生微信

v0.1.0 — 2026.2.25 — 起点

代号:"An agent that grows with you"

Hermes Agent 由 Nous Research(团队约20人,核心成员来自 StabilityAI)于 2026 年 2 月 25 日正式发布。

核心特性

  • 一行安装命令即可完成部署
  • 产品定位:会与你一起成长的 AI Agent
  • 内置学习循环框架(Learning Loop):从任务中自动提炼技能
  • 跨会话记忆:长期记住用户偏好
  • 自动生成 Skills:运行时自动创建可复用技能脚本
  • 当时社区几乎无人关注——整个开源世界都在盯着 OpenClaw(小龙虾)

"An agent that grows with you" — 这是 Hermes 区别于所有其他 Agent 框架的核心定位。

v0.2.0 — 2026.3.12 — 集成加速

首个有标签的正式版本

首个正式 Release Tag,在 v0.1.0 基础上快速迭代。

核心技术更新

技术方向 具体内容
MCP 客户端 + ACP 服务器 完整集成 Model Context Protocol
IDE 无缝连接 支持 VS Code 和 JetBrains 全家桶
国产模型接入 接入智谱 GLM、Kimi 等国内大模型
消息网关架构 消息平台接入架构初步建立

v0.3.0 — 2026.3.x — 插件时代

距 v0.2.0 仅 5 天,合并 248 个 PR

核心技术更新

技术方向 具体内容
完整插件系统 引入可扩展插件架构,第三方可自由接入
统一流式输出 所有交互统一流式响应,实时可见
CDP 原生支持 原生 Chrome DevTools Protocol,可程序化操控浏览器
实时交互 用户输入与 Agent 输出同步呈现

社区评价:"5天248个PR,原生支持Chrome操控、插件架构、实时流式输出"

v0.4.0 — 2026.3.x — API Server

核心技术更新

技术方向 具体内容
OpenAI 兼容 API Server Hermes 自身作为 OpenAI 兼容 HTTP 端点暴露
全前端生态接入 Open WebUI、LobeChat、NextChat、LibreChat、ChatBox 等任意 OpenAI 格式前端直连
完整工具集保留 对接后仍保留 terminal/file/记忆/Skills 全部工具能力

意义:Hermes 从一个 Agent 工具,蜕变为可接入任意 AI 前端的 Agent 服务端

v0.5.0 — 2026.3.x — 模型爆炸

核心技术更新

技术方向 具体内容
400+ 模型支持 在单一 Agent 内同时支持 400+ 个不同模型
安全强化 实际工作流安全加固,修复多项潜在安全漏洞
可靠推理 推理链路稳定性提升,确保长时间自动化任务可靠执行

推理创造可靠的自动化。安全更新决定了代理能否真正用于生产环境。

v0.6.0 — 2026.4.x — 多实例

核心技术更新

技术方向 具体内容
Profiles 多实例隔离 支持多配置文件,每个 Profile 独立运行、互不干扰
MCP Server Mode Hermes 本身作为 MCP Server 暴露给外部工具调用
备用提供者链 多模型 fallback 链,主模型故障自动切换备选
自动故障转移 推理服务不间断

总结:两个改变日常的核心功能——多实例配置(日常高频)和备用提供者链(生产级高可用)

v0.7.0 — 2026.4.x — 内存插件化

核心技术更新

技术方向 具体内容
内存插件化 Memory(记忆系统)变为可插拔插件,可替换任意后端或自行实现
韧性强化 异常处理和网络波动抵抗力显著增强
自定义记忆后端 用户可基于插件接口开发自己的记忆存储(如 Redis、向量数据库等)

v0.8.0 — 2026.4.8 — Intelligence Release

合并 209 个 PRs,解决 82 个 issues

核心技术更新

技术方向 具体内容
后台任务自动通知 长任务完成后自动推送通知,无需持续轮询
实时模型切换 全平台支持运行中动态切换模型,无须重启
自优化 GPT/Codex 内置自我优化指导策略,模型可自主改进推理路径
Google AI Studio 原生 官方接入 Google AI Studio
智能空闲超时 Smart inactivity timeouts,节省资源
审批按钮 Approval buttons,任务执行前人工审批确认
MCP OAuth 2.1 MCP 认证协议全新升级
免费 MiMo v2 Pro Nous Portal 用户免费获赠

v0.9.0 — 2026.4.13 — Everywhere Release

合并 487 个 commits + 269 个 PRs,规模创历史之最。

核心技术更新

技术方向 具体内容
Termux/Android 首次支持手机端运行,Hermes 进入移动时代
iMessage 接入 苹果 iMessage 消息平台原生接入
WeChat 接入 微信消息平台原生接入
Fast Mode OpenAI 和 Anthropic 推理加速模式,延迟大幅降低
后台进程监控 进程生命周期完整管理,进程状态可视化
本地 Web Dashboard 可视化 Web 管理面板,任务状态实时监控
生命周期表情 状态用 emoji 直观显示(🟢运行中/🟡等待/🔴错误等)
语音通道管理 语音交互支持

v0.10.0 — 2026.4.16 — Tool Gateway Release

核心技术更新

技术方向 具体内容
Nous Tool Gateway 付费订阅用户无需配置任何 API Key,直接使用联网搜索/图像生成/TTS/浏览器自动化
118 个内置 Skills 开箱即用的任务技能库,覆盖主流工作场景
三层记忆体系 Session(会话)→ User Profile(用户画像)→ Long-term(长期记忆)
6 个消息平台 集成微信、WhatsApp、Telegram 等主流 IM
运行时自进化 自动生成 Skills + 自我改进回路,愈用愈聪明

意义:180+ 项改进,开启"零门槛 AI 工具时代"——普通用户无需任何配置,开箱即用高阶 AI 能力。

v0.11.0 — 2026.4.23 — Interface Release

⚠️ 有 Breaking Change:旧版 terminal UI 被 Ink 完全替换,升级后 TUI 配置需要调整。

核心技术更新

技术方向 具体内容
React/Ink 重写 TUI 交互式 CLI 底层完全重构,体验焕然一新
Pluggable Transport 传输层架构完全插件化,可自由替换底层传输实现
原生 AWS Bedrock 云端大模型(AWS 托管)原生支持
5 条新推理路径 推理效率进一步提升
QQBot 第 17 个消息平台
GPT-5.5 via Codex OAuth OpenAI 最新模型官方接入
Web 控制台插件化 第三方可直接扩展控制台插件功能

v0.12.0 — 2026.4.30 — Curator Release

发布规模:1,096 commits · 550 个 PRs · 217,776 行新增代码 · 213 位贡献者

代号"Curator"——Hermes 现在学会自我维护了。

核心技术更新

技术方向 具体内容
🤖 Autonomous Curator 后台自主 Curator Agent(默认7天周期),自动评分/裁剪/合并 Skills 库,写入 logs/curator/run.json + REPORT.md 报告。内置防御保护,防止核心 Skills 被误删
🔄 自我改进回路重写 从自由形式 → 规则评分制(rubric-based);偏好更新刚用过的技能;正确继承父进程 provider/credentials;内存插件干净关闭;上一轮工具消息不进入摘要,保证干净上下文
🎨 ComfyUI v5 官方 CLI + REST + 硬件检测本地安装,从可选升级为默认内置
🖼️ TouchDesigner-MCP 默认内置,新增 GLSL/post-FX/audio/geometry 支持 + 9份新参考文档
🎵 Spotify 原生集成 7个工具(播放/搜索/队列/歌单/设备)+ PKCE OAuth + 交互向导 + cron 用法文档
📹 Google Meet 插件 加入会议/转录/发言/跟进,OpenAI Realtime Transport + Node bot 服务端
💬 Microsoft Teams 成为第 19 个消息平台(作为 Gateway 插件架构的首个第三方插件)
💬 腾讯元宝 成为第 18 个消息平台,原生支持文本+媒体发送
⚡ TUI 冷启动 提速约 57%
🖥️ LM Studio 从自定义端点别名升级为一等公民 Provider,完整 auth + hermes doctor 检测 + 推理传输 + 实时 /models 列表
☁️ 4 个新推理 Provider GMI Cloud(原生)、Azure AI Foundry(自动检测)、MiniMax OAuth(PKCE 浏览器流程)、Tencent Tokenhub
📊 Models Dashboard 丰富的 per-model 分析标签页,Dashboard 内直接切换主模型+辅助模型
🖼️ 多模态图片路由 图片根据模型实际视觉能力路由,而非 Provider 默认值
🚀 hermes -z 单次模式 非交互式 hermes -z "<prompt>" + --model/--provider/HERMES_INFERENCE_MODEL 参数
🔍 hermes update --check 更新前预检,Opt-in 预升级 HERMES_HOME 备份
🌐 远程模型目录 OpenRouter + Nous Portal 模型目录从远程 manifest 拉取,新模型无需发版即可出现
📱 Gateway 媒体能力对齐 多图发送覆盖 Telegram/Discord/Slack/Mattermost/Email/Signal;FLAC 支持 + Telegram 文档回退

技术演进总结

42 天 8 个大版本,核心演进逻辑

第1阶段(2-3月):基础设施
  v0.1 → v0.2 → v0.3 → v0.4 → v0.5
  核心:插件架构 → IDE集成 → 流式输出 → API Server → 400+模型

第2阶段(4月上旬):韧性扩展
  v0.6 → v0.7 → v0.8
  核心:多实例隔离 → 内存插件化 → 后台任务 + 实时切换

第3阶段(4月中旬起):生态与性能
  v0.9 → v0.10 → v0.11 → v0.12
  核心:全平台 → 零门槛工具 → TUI重构 → 性能突破

关键里程碑

里程碑 版本 意义
自进化框架诞生 v0.1.0 定位"与你共同成长",区别所有竞品
插件架构引入 v0.3.0 生态开放的基础
成为 API Server v0.4.0 从工具到平台的转折点
全平台覆盖 v0.9.0 移动端突破
零门槛工具 v0.10.0 非技术用户也能用
性能飞跃 v0.12.0 Token 消耗降低 30-50%,原生微信

核心技术壁垒

  1. 内置学习闭环:运行时自动生成 Skills、记忆用户偏好、持续自我改进
  2. 三层记忆体系:Session → User Profile → Long-term,跨越会话理解用户
  3. Nous Tool Gateway:订阅制免 API Key,降低使用门槛
  4. 全平台消息集成:微信/iMessage/Telegram/WhatsApp/Slack/Discord/腾讯元宝/Teams 等 19 个消息平台
  5. Autonomous Curator:后台自动整理 Skills 库,无需人工干预

数据来源:GitHub NousResearch/hermes-agent, NewReleases.io, Foresight News, 各社区翻译整理

Left-click: follow link, Right-click: select node, Scroll: zoom
x