标签

#记忆拼接

2 篇文章

api-开发fastapigcpgithubk8smcpnginxopenairag上下文医学向量对话代码流式爬虫环境配置
Codex 现在该怎么用:从“让 AI 写代码”到“搭一个可验证的开发工作流”
AI 大模型开发
25 分钟

Codex 现在该怎么用:从“让 AI 写代码”到“搭一个可验证的开发工作流”

随着 Codex 从“会写代码的聊天框”演变为可管理的开发代理,高效用法的核心已转向构建“看得见、说得清、验得过、沉淀得下”的四步工作流:先通过 Appshots、浏览器标注或 Computer Use 让 Codex 看见现场上下文,再以包含目标、边界和验收标准的任务契约替代模糊提示,然后强制要求测试、lint、typecheck 和 diff 作为交付证据,最后将反复使用的规则和流程沉淀为 AGENTS.md、config.toml 或 Skill。文章详细区分了 Plan mode、Goal mode 的适用场景,给出了普通任务、前端调整、长任务 `/goal` 三套可直接复用的提示词模板,并强调团队不应只看代码行数,而应关注重复排查流程的减少和规则的可复用性。对于已熟悉 Codex 但期望突破玩具感、进入生产环境的后端、前端或全栈开发者,本文提供了从单次对话框到可控协作工作流的完整升级路径。

记忆拼接
多段AI记忆拼接与上下文压缩(初步)
AI 大模型开发
12 分钟

多段AI记忆拼接与上下文压缩(初步)

这份草稿围绕 AI 对话系统中的长期记忆与上下文压缩展开,目标是在多轮聊天中兼顾相关历史召回、上下文长度限制、响应延迟和存储成本。方案把一次请求链路拆成 MemoryRetriever、ContextManager、PromptBuilder、GPTClient、MemoryUpdater 等模块:先按用户输入检索多段记忆,再用滑动窗口裁剪近期对话,必要时调用 Summarizer 压缩溢出内容,最后拼接 system、memory、window、user 形成模型 messages,并把回复或摘要写回 MemoryStore。实现细节强调在消息记录中预存字符数或 token 数,从最近 5 轮对话取 5 条用户消息和 5 条 AI 回复,按时间排序后累加长度,以较低遍历成本避免单条长消息撑爆上下文。摘要策略部分比较了按回合生成 memory_segment、让主模型同次输出 answer 与 summary、以及后台 Worker 异步调用廉价模型摘要三种做法。草稿也指出工程上的取舍:同步摘要更简单但可能增加延迟,异步摘要能保留流式体验并通过固定条数淘汰控制规模,格式异常时还需要客户端校验和降级。它适合作为聊天产品、AI 应用后端或 Agent 记忆系统的初步设计参考,帮助评估上下文完整性、检索粒度、调用成本和实现复杂度之间的平衡。

上下文记忆拼接