标签 Token 下的文章

一、RAG 的真相:48% 的失败率被藏起来了 二、Context Window 革命:1M 已成标配 三、Wiki 模式:不是复古,是重新对齐 四、六维度拆解:RAG 和 Wiki 到底差在哪 五、决策框架:什么时候选什么 六、收束:误区、行动建议、一句话结论 本文首发地址 https://h89.cn/archives/620.html 2024 年,每个做 AI 知识库的人都在说 RAG。检索增强生成,Retrieval-Augmented Generation,这串字母组合几乎成了企业知识管理的唯一答案。搭一个向量数据库,把文档切成块,灌进 Embedding 模型,再套个重排器——恭喜你,拥有了一个"AI 驱动"的知识库。 但 2026 年 4 月,OpenAI 联合创始人 Andrej Karpathy 发了一条 X 帖子,描述自己怎么用一组

- 阅读剩余部分 -

一、代码全景:1900 文件的目录地图 二、引擎核心:QueryEngine.ts 的流式工具循环 2.1 核心循环:消息 → 工具 → 消息 2.2 思考模式(Thinking) 2.3 重试与错误处理 2.4 Token 计数与费用追踪 三、工具系统:40 个 Tool 的注册与权限沙箱 3.1 Tool 类型定义——所有工具的契约 3.2 ToolUseContext——工具执行的上下文宇宙 3.3 权限沙箱——三层规则 + 四种模式 3.4 工具注册表 四、上下文管理:从 CLAUDE.md 到 Prompt Cache 4.1 系统上下文:5 个 git 命令并行执行 4.2 用户上下文:CLAUDE.md 的自动发现 4.3 三层记忆架构 4.4 Prompt Cache:静态/动态分割 4.5

- 阅读剩余部分 -