AI 记忆架构的三维进化:从管道到网络

三个月前我画了一个「热→温→冷」的线性管道。跑下来发现,纵向晋升是必要条件,但不是充分条件。知识不是沿管道流动的液体,它是根系——向下扎根的同时,横向蔓延、交叉嫁接。管道负责把信息从对话层送到知识层,但知识到达目的地之后的关联、腐化、可发现性,是另一组问题。


起点:一条管道

最初的想法很简单:对话中的信息,提炼后存下来,需要时拿出来。

对话(热)→ 提炼(温)→ 沉淀(冷)

这个模型没有错。context-infrastructure 的 Observer→Reflector→GC Pipeline 证明了纵向晋升是可行的。温记忆压缩到 100 行,任何平台秒加载,这个设计确实好用。

但跑了三个月,三个管道解决不了的问题冒出来了。

问题一:知识孤岛

wiki 里建了 40 个页面。AI 可观测性和 Agent 护栏各自写得很好,但没人发现它们说的是同一件事——LLM 系统的可信度防御。一个管输出质量评估,一个管行为约束,底层逻辑是同构的。

纵向管道不负责这个——它的职责是把信息从热送到冷,不是让冷知识之间互相认识。这就像图书馆买了很多书,每本都分类入库了,但没有目录卡,也没有「相关推荐」。信息到了终点,但终点之间没有路。

解法:横向关联

wikilinks(双向链接)
  页面 A 引用页面 B,B 的反向链接自动显示 A
  → 不需要主动维护,写的时候随手一链就行

标签聚类
  同标签的页面自动归类
  `agent` 标签下:agent-architecture, agent-memory, agent-guardrails, harness-engineering
  → 浏览一个标签就能看到整个领域地图

横向扫描(LINT 检查项之一)
  同周创建 + 共享 2+ 标签 + 未互链 → 自动报告
  → 发现隐性关联,人脑记不住所有页面的创建时间和标签组合

跨域桥接
  科技洞察 → 投资判断(如 AI 推理成本归因 → 算力股估值逻辑)
  哲学思考 → 决策框架(如 Goodhart's Law → TDD 失效 → 管理指标陷阱)
  → 这是 wiki 最核心的价值,靠标签交叉和 wikilinks 实现

知识不是一棵树,是一张网。纵向管道处理深度,横向关联处理广度。两者不矛盾——管道把书买进来,关联让书和书之间产生对话。

需要说明的是,横向关联和活性维护之间有交叉。比如 LINT 的「横向链接缺失」检查项——它既是横向关联的发现工具(找到应该连接但没连接的页面对),也是活性维护的一部分(定期巡检)。这不是设计缺陷,是两个维度在边界处自然重叠,就像城市里「修路」(横向)和「市政巡检」(活性)本来就有交叉。

问题二:知识腐化

40 个页面,如果不维护,三个月后:

  • 有些过时了(工具版本、API 变化)
  • 有些互相矛盾(三月的认知和五月的新信息冲突)
  • 有些变成孤岛(创建后没人再链接过)
  • 标签体系漂移(随手加了不在分类法里的标签)

纵向管道只管往里灌,不管清淤。

解法:活性维护

Wiki LINT(每周自动运行,7 项检查)
  1. 矛盾检测 — frontmatter contradictions 字段 + 内容冲突扫描
  2. 孤立页面 — 入站链接 = 0
  3. 缺失概念页 — 被引用 2+ 次但不存在的 wikilink
  4. 过时内容 — updated 超过 60 天
  5. 标签一致性 — 不在分类法中的标签
  6. 横向链接缺失 — 同周 + 共享标签但未互链
  7. Index 同步 — 实际文件 vs index.md 条目差异

  → 只报告不修改,人确认后才执行

公理反馈回路
  应用记录追踪:每次公理被引用/用于决策,记一行
  → 日期 / 场景 / 触发 / 结果
  → 应用次数 ≥ 5 → 升级候选
  → 周报推送提醒评审
  → 确认升级 → 进入公理正式序列
  → 否决 → 重置计数,记录理由

  → 知识库不是博物馆,是活的系统

纵向管道的 GC 只管”这条记忆过不过期”。活性维护管的是”整个知识库健不健康”。

但不是所有冷知识都需要同等强度的维护。有些知识是稳定态——数学定理、经典文献、思维模型(比如二阶效应),写完基本不用动。有些是快速变化态——工具版本、API 变化、市场数据,一两个月就过时。LINT 检查的「过时内容」项(updated 超过 60 天)是一个粗粒度的过滤,实际操作中我会看内容性质决定是否更新,而不是机械地刷日期。

问题三:找不到

冷知识存在 Obsidian wiki 里,40 个页面,几千行内容。你说”之前讨论过 Agent 文件系统的三代演化”,我需要能找到它。

两个问题:

  1. 精确回忆 — 你提到了具体关键词,FTS5 全文搜索能搞定
  2. 模糊关联 — 你说”那个关于知识怎么长的模型”,关键词匹配失效,需要语义检索

解法:多层检索

MEMORY.md(Prompt Memory)
  每轮注入,~2K 字符,最紧急的信息
  → 不需要搜索,永远在眼前

Session Search(FTS5)
  历史对话全文检索
  → 精确回忆:关键词、人名、项目名
  → 跨 session 回忆:两个月前讨论过什么

ObsidianRAG(向量检索)
  287 notes → 2120 chunks
  all-MiniLM-L6-v2 本地 embedding
  → 语义搜索:描述性查询、模糊关联
  → 不依赖精确关键词

Wiki Index + Wikilinks(导航)
  index.md → 领域地图
  wikilinks → 页面间跳转
  → 浏览式探索:不知道要找什么时用

四层检索各有边界。不是谁替代谁,是不同场景用不同工具。

三维模型

把三个问题的解法合在一起:

graph TD
    subgraph 纵向晋升
        H[热记忆<br/>对话采集] --> W[温记忆<br/>核心画像]
        W --> C[冷知识<br/>Wiki 页面]
    end

    subgraph 横向关联
        WL[wikilinks<br/>双向链接]
        TAG[标签聚类<br/>同标签发现]
        LAT[横向扫描<br/>隐性关联]
    end

    subgraph 活性维护
        LINT[LINT 巡检<br/>7 项检查]
        AX[公理反馈<br/>应用追踪]
        RET[RAG + FTS5<br/>语义+精确检索]
    end

    C --- WL
    C --- TAG
    C --- LAT
    C --- LINT
    C --- AX
    C --- RET
    LAT -.->|边界交叉| LINT
  • 纵向晋升(热→温→冷):信息的密度递减、持久性递增
  • 横向关联(链接/标签/扫描):知识节点之间的语义连接
  • 活性维护(LINT/反馈/检索):保持整个系统的健康和可发现性

原文的「热→温→冷」没有错,但它只描述了一个维度。就像只说”树要扎根”——没错,但根系也会横向蔓延,土壤也需要定期松土施肥。

实际数据

跑了三个月的 Obsidian wiki:

指标数值说明
Wiki 页面总数40entity + concept + comparison + query
实体页6公司/产品实体
概念页27技术/思维模型概念
跨域 wikilinks~120 条出站链接平均每页 3 个出站链接
公理条目25 条三轮审计后从 43 条合并,去重+精简
LINT 检查项7 项每周一自动运行
RAG 索引287 notes → 2120 chunks全库(wiki 40 页 + 日记/剪藏/非wiki笔记 247 篇)
Session Search全量历史对话 FTS5 索引跨 session 精确回忆

说明几个数据点:

287 vs 40:wiki 页面只有 40 个,是经过提炼的结构化知识。RAG 索引覆盖整个 Obsidian vault(287 篇),包括日记、剪藏、非 wiki 笔记——这些是原始素材,还没消化进 wiki。两个数字不矛盾,正好对应了三层模型中的「冷知识(wiki)」和「收集层(全库)」。

公理从 43 到 25:不是简单去重。三轮审计做了三件事:合并语义重叠的条目(比如「做减法」和「简单优先」合并成一条)、淘汰实践中反复不被引用的条目、升级从实践经验中涌现的新条目。审计过程记录在 公理审计报告

效果层面:横向关联最具体的例子是「AI 是品位的放大器」这条公理——它链接到投资领域的复利职业策略,又链接到哲学层的认知框架。三个领域的页面因为 wikilinks 形成了三角连接。这不是规划出来的,是写的时候自然发生的。但坦诚说,目前只有一个这样的跨域三角连接案例,大部分 wikilinks 还是在同领域内(AI 页面链 AI 页面)。横向关联的潜力已经能看到,但密度还不够。

和原文的关系

本文是对 跨平台AI人格与记忆架构设计 中「第二层:记忆」的实战演进。原文定义了纵向晋升模型,本文补上了横向关联和活性维护两个维度。

如果把记忆架构比作图书馆:

  • 纵向晋升是入库流程 — 新书从采购(热)到编目(温)到上架(冷)
  • 横向关联是目录卡和推荐架 — 让读者发现「借了这本的人也借了那本」
  • 活性维护是馆员巡检 — 定期清查过时书籍、修复断裂的目录引用、补充缺失的交叉推荐

只有入库没有目录,书在架子上但找不到。只有入库和目录没有巡检,几年后目录卡和实际书籍对不上了。

至于这套体系值不值得——40 个页面的 wiki,LINT 每周运行一次,确认时间大概 5 分钟。公理反馈回路是自动追踪,只在周报时才需要人看。RAG 索引构建一次,后续增量更新。目前这个规模下,维护成本可以接受。如果 wiki 涨到 400 页,可能需要重新评估 LINT 的噪声水平和人工确认的负担。