2026-05-01AI 实践10 分钟阅读

我让AI当图书管理员,3个月建出了自己的「第二大脑」

从 Karpathy 工作流到 Hermes 记忆架构,一套能跑通的本地知识库自动化方案

一、我们都有个共同的痛点

你一定有过这样的体验:收藏夹里塞了 500 篇文章,但真正用到时找不到;Evernote/Notion 里存了 2000 条笔记,却变成了一个"数字坟墓"——只存不取。

我试过的知识管理工具不下十个,最终都回到了同一个问题:存储不是问题,检索和综合才是。

二、Karpathy 工作流:四个字改变一切

Karpathy 的核心思路极其简单——把知识分成两层

  • raw(原始素材):你收集的文章、论文、笔记,只增不改,作为唯一事实源
  • wiki(知识库):由 LLM 从 raw 中提取、综合、生成的结构化知识

整个过程里,我的角色从"知识工人"变成了"知识策展人"——我只负责决定什么值得放进 raw,AI 负责剩下的脏活。

三、但这还不够——直到我遇到了 Hermes

Karpathy 的工作流解决了"怎么建知识库"的问题,但没有回答另一个更关键的问题:AI 本身怎么记住我和它的对话?

这就是 Hermes Agent 四层记忆架构解决的问题。

第一层:工作记忆

当前的对话上下文窗口。一旦 session 结束,这些内容就被丢弃——除非被抢救。

第二层:MEMORY.md & USER.md

长期事实存储在 Markdown 文件里。角色偏好、历史项目经验、技术决策——跨 session 持久化。

第三层:SQLite 数据库

完整的会话历史,支持 FTS5 全文搜索引擎。三阶段检索:粗搜 → 重构上下文 → 定向摘要。

第四层:外部 Memory Provider

可扩展的知识召回后端,但有一个铁律:外部 recall 结果不写回原始 transcript。 这叫做"反自我污染"。

四、它们是怎么配合的?

知识摄入(Ingest)

把收藏的好文章、论文、笔记复制到 raw 目录,然后让 AI 自动读取,提取实体、创建摘要、更新主题索引。

AI 编译(Compile)

AI 会自动创建摘要、提取新概念、更新相关主题页面、更新全局索引。所有 wiki 页面都采用 Obsidian 的 [[双向链接]] 格式。

知识综合(Synthesize)

当某个主题积累了足够多的素材,我会要求 AI 做深度综合分析。

问答查询(Query)

问 AI 一个技术问题,它先去 wiki 里搜索相关实体和主题,然后综合多源信息回答,并标注每个声明的来源和置信度

置信度分四级:EXTRACTED(直接来自源材料)、INFERRED(从多个源推断)、AMBIGUOUS(模糊或矛盾)、UNVERIFIED(AI 背景知识,无源证据)。

五、你也可以这样做

第一步:选工具 — Obsidian 作为知识库载体(本地 Markdown,支持双向链接),Claude Code / Hermes Agent 作为 AI 编译器,Git 做版本控制。

第二步:建目录

vault/
├── raw/       # 你的原始素材
└── wiki/      # AI 生成的知识库

第三步:写一条 schema — 创建一个 .wiki-schema.md,定义目录结构、命名规范、标签词汇。这是 AI 的"操作手册"。

第四步:开始投喂 — 把你有价值的文章扔进 raw/,然后让 AI 执行一次 ingest 流程。

第五步:提问、验证、迭代 — 问 AI 一个你领域内的问题,看它能否基于 wiki 给出有来源的回答。

六、最后的思考

很多人问我:AI 时代还需要个人知识库吗?

我的回答是:正因为在 AI 时代,才更需要个人知识库。

没有知识库的 AI,就像一个记忆力超群但没有知识储备的天才——它能推理,但没有事实支撑。有了知识库的 AI,则是把你多年的积累、判断、经验结构化地交给它,让它在你的知识地基上做增量思考。

Karpathy 说 raw data → LLM compile → wiki → Q&A。我说,这就是 2026 年最被低估的个人竞争力。
← 返回博客列表

对 AI 转型感兴趣?

我的免费课程「AI Agent 实战营」已开源,欢迎学习

查看课程