深度剖析 / 记忆与上下文

记忆与上下文

上下文窗口、记忆存储、压缩、检索增强记忆——把对的东西留在提示上。

  1. 设计上下文窗口
    把有限窗口当作有预算的资源:分类令牌预算、位置感知排序与利用率度量。
  2. 短期与长期记忆
    提示内工作集与外部存储:什么配占位、何时写、何时回忆,以及提升/降级循环。
  3. 记忆类型:情景、语义、程序性
    三种持久记忆加草稿区,各自写入与检索方式不同;反思把情景提升为语义。
  4. 检索增强记忆
    回忆即检索:状态派生线索,相关性+时近性+显著性评分,先阈值再截断,以及带来源标注的渲染。
  5. 上下文压缩与分层记忆
    压缩阶梯、任务结构化摘要、MemGPT 式分级、压力触发迟滞,以及验证有损压缩。
  6. 记忆存储:向量、键值、图与驱逐
    把后端匹配到记忆类型、统一接口、无界存储为何腐蚀检索,以及衰减/驱逐策略。
  7. 评估记忆质量
    记忆特有指标(recall@k、过期率、约束存活、写入精度)及其捕获的陷阱:毒化、过期、漂移、压缩失忆。