我让AI当图书管理员,3个月建出了自己的「第二大脑」
从 Karpathy 工作流到 Hermes 记忆架构,一套能跑通的本地知识库自动化方案
一、我们都有个共同的痛点
你一定有过这样的体验:收藏夹里塞了 500 篇文章,但真正用到时找不到;Evernote/Notion 里存了 2000 条笔记,却变成了一个"数字坟墓"——只存不取。
我试过的知识管理工具不下十个,最终都回到了同一个问题:存储不是问题,检索和综合才是。
二、Karpathy 工作流:四个字改变一切
Karpathy 的核心思路极其简单——把知识分成两层:
- raw(原始素材):你收集的文章、论文、笔记,只增不改,作为唯一事实源
- wiki(知识库):由 LLM 从 raw 中提取、综合、生成的结构化知识
整个过程里,我的角色从"知识工人"变成了"知识策展人"——我只负责决定什么值得放进 raw,AI 负责剩下的脏活。
三、但这还不够——直到我遇到了 Hermes
Karpathy 的工作流解决了"怎么建知识库"的问题,但没有回答另一个更关键的问题:AI 本身怎么记住我和它的对话?
这就是 Hermes Agent 四层记忆架构解决的问题。
第一层:工作记忆
当前的对话上下文窗口。一旦 session 结束,这些内容就被丢弃——除非被抢救。
第二层:MEMORY.md & USER.md
长期事实存储在 Markdown 文件里。角色偏好、历史项目经验、技术决策——跨 session 持久化。
第三层:SQLite 数据库
完整的会话历史,支持 FTS5 全文搜索引擎。三阶段检索:粗搜 → 重构上下文 → 定向摘要。
第四层:外部 Memory Provider
可扩展的知识召回后端,但有一个铁律:外部 recall 结果不写回原始 transcript。 这叫做"反自我污染"。
四、它们是怎么配合的?
知识摄入(Ingest)
把收藏的好文章、论文、笔记复制到 raw 目录,然后让 AI 自动读取,提取实体、创建摘要、更新主题索引。
AI 编译(Compile)
AI 会自动创建摘要、提取新概念、更新相关主题页面、更新全局索引。所有 wiki 页面都采用 Obsidian 的 [[双向链接]] 格式。
知识综合(Synthesize)
当某个主题积累了足够多的素材,我会要求 AI 做深度综合分析。
问答查询(Query)
问 AI 一个技术问题,它先去 wiki 里搜索相关实体和主题,然后综合多源信息回答,并标注每个声明的来源和置信度。
置信度分四级:EXTRACTED(直接来自源材料)、INFERRED(从多个源推断)、AMBIGUOUS(模糊或矛盾)、UNVERIFIED(AI 背景知识,无源证据)。
五、你也可以这样做
第一步:选工具 — Obsidian 作为知识库载体(本地 Markdown,支持双向链接),Claude Code / Hermes Agent 作为 AI 编译器,Git 做版本控制。
第二步:建目录
vault/
├── raw/ # 你的原始素材
└── wiki/ # AI 生成的知识库
第三步:写一条 schema — 创建一个 .wiki-schema.md,定义目录结构、命名规范、标签词汇。这是 AI 的"操作手册"。
第四步:开始投喂 — 把你有价值的文章扔进 raw/,然后让 AI 执行一次 ingest 流程。
第五步:提问、验证、迭代 — 问 AI 一个你领域内的问题,看它能否基于 wiki 给出有来源的回答。
六、最后的思考
很多人问我:AI 时代还需要个人知识库吗?
我的回答是:正因为在 AI 时代,才更需要个人知识库。
没有知识库的 AI,就像一个记忆力超群但没有知识储备的天才——它能推理,但没有事实支撑。有了知识库的 AI,则是把你多年的积累、判断、经验结构化地交给它,让它在你的知识地基上做增量思考。
Karpathy 说 raw data → LLM compile → wiki → Q&A。我说,这就是 2026 年最被低估的个人竞争力。
