2026-05-01AI 实践10 分钟阅读

我让AI当图书管理员，3个月建出了自己的「第二大脑」

从 Karpathy 工作流到 Hermes 记忆架构，一套能跑通的本地知识库自动化方案

一、我们都有个共同的痛点

你一定有过这样的体验：收藏夹里塞了 500 篇文章，但真正用到时找不到；Evernote/Notion 里存了 2000 条笔记，却变成了一个"数字坟墓"——只存不取。

我试过的知识管理工具不下十个，最终都回到了同一个问题：存储不是问题，检索和综合才是。

二、Karpathy 工作流：四个字改变一切

Karpathy 的核心思路极其简单——把知识分成两层：

raw（原始素材）：你收集的文章、论文、笔记，只增不改，作为唯一事实源
wiki（知识库）：由 LLM 从 raw 中提取、综合、生成的结构化知识

整个过程里，我的角色从"知识工人"变成了"知识策展人"——我只负责决定什么值得放进 raw，AI 负责剩下的脏活。

三、但这还不够——直到我遇到了 Hermes

Karpathy 的工作流解决了"怎么建知识库"的问题，但没有回答另一个更关键的问题：AI 本身怎么记住我和它的对话？

这就是 Hermes Agent 四层记忆架构解决的问题。

第一层：工作记忆

当前的对话上下文窗口。一旦 session 结束，这些内容就被丢弃——除非被抢救。

第二层：MEMORY.md & USER.md

长期事实存储在 Markdown 文件里。角色偏好、历史项目经验、技术决策——跨 session 持久化。

第三层：SQLite 数据库

完整的会话历史，支持 FTS5 全文搜索引擎。三阶段检索：粗搜 → 重构上下文 → 定向摘要。

第四层：外部 Memory Provider

可扩展的知识召回后端，但有一个铁律：外部 recall 结果不写回原始 transcript。 这叫做"反自我污染"。

四、它们是怎么配合的？

知识摄入（Ingest）

把收藏的好文章、论文、笔记复制到 raw 目录，然后让 AI 自动读取，提取实体、创建摘要、更新主题索引。

AI 编译（Compile）

AI 会自动创建摘要、提取新概念、更新相关主题页面、更新全局索引。所有 wiki 页面都采用 Obsidian 的 [[双向链接]] 格式。

知识综合（Synthesize）

当某个主题积累了足够多的素材，我会要求 AI 做深度综合分析。

问答查询（Query）

问 AI 一个技术问题，它先去 wiki 里搜索相关实体和主题，然后综合多源信息回答，并标注每个声明的来源和置信度。

置信度分四级：EXTRACTED（直接来自源材料）、INFERRED（从多个源推断）、AMBIGUOUS（模糊或矛盾）、UNVERIFIED（AI 背景知识，无源证据）。

五、你也可以这样做

第一步：选工具 — Obsidian 作为知识库载体（本地 Markdown，支持双向链接），Claude Code / Hermes Agent 作为 AI 编译器，Git 做版本控制。

第二步：建目录

vault/
├── raw/       # 你的原始素材
└── wiki/      # AI 生成的知识库

第三步：写一条 schema — 创建一个 .wiki-schema.md，定义目录结构、命名规范、标签词汇。这是 AI 的"操作手册"。

第四步：开始投喂 — 把你有价值的文章扔进 raw/，然后让 AI 执行一次 ingest 流程。

第五步：提问、验证、迭代 — 问 AI 一个你领域内的问题，看它能否基于 wiki 给出有来源的回答。

六、最后的思考

很多人问我：AI 时代还需要个人知识库吗？

我的回答是：正因为在 AI 时代，才更需要个人知识库。

没有知识库的 AI，就像一个记忆力超群但没有知识储备的天才——它能推理，但没有事实支撑。有了知识库的 AI，则是把你多年的积累、判断、经验结构化地交给它，让它在你的知识地基上做增量思考。

Karpathy 说 raw data → LLM compile → wiki → Q&A。我说，这就是 2026 年最被低估的个人竞争力。