深度剖析 / 记忆与上下文
记忆与上下文
上下文窗口、记忆存储、压缩、检索增强记忆——把对的东西留在提示上。
- 设计上下文窗口把有限窗口当作有预算的资源:分类令牌预算、位置感知排序与利用率度量。
- 短期与长期记忆提示内工作集与外部存储:什么配占位、何时写、何时回忆,以及提升/降级循环。
- 记忆类型:情景、语义、程序性三种持久记忆加草稿区,各自写入与检索方式不同;反思把情景提升为语义。
- 检索增强记忆回忆即检索:状态派生线索,相关性+时近性+显著性评分,先阈值再截断,以及带来源标注的渲染。
- 上下文压缩与分层记忆压缩阶梯、任务结构化摘要、MemGPT 式分级、压力触发迟滞,以及验证有损压缩。
- 记忆存储:向量、键值、图与驱逐把后端匹配到记忆类型、统一接口、无界存储为何腐蚀检索,以及衰减/驱逐策略。
- 评估记忆质量记忆特有指标(recall@k、过期率、约束存活、写入精度)及其捕获的陷阱:毒化、过期、漂移、压缩失忆。