一、RAG 的真相:48% 的失败率被藏起来了 二、Context Window 革命:1M 已成标配 三、Wiki 模式:不是复古,是重新对齐 四、六维度拆解:RAG 和 Wiki 到底差在哪 五、决策框架:什么时候选什么 六、收束:误区、行动建议、一句话结论 本文首发地址 https://h89.cn/archives/620.html 2024 年,每个做 AI 知识库的人都在说 RAG。检索增强生成,Retrieval-Augmented Generation,这串字母组合几乎成了企业知识管理的唯一答案。搭一个向量数据库,把文档切成块,灌进 Embedding 模型,再套个重排器——恭喜你,拥有了一个"AI 驱动"的知识库。 但 2026 年 4 月,OpenAI 联合创始人 Andrej Karpathy 发了一条 X 帖子,描述自己怎么用一组

- 阅读剩余部分 -

硬件底子速览 软件架构:Gunyah Hypervisor + PVM + GVM 架构全景 Android 作为 GVM 是怎么跑起来的 PVM 安全域:仪表盘为什么不跑 Android PVM 和 GVM 互不干扰,靠的不是一句"虚拟化" PVM ↔ GVM 怎么通信? 座舱 Android 开发到底跟手机开发差在哪 产业棋局:高通的一盘大棋 结论 本文首发地址 https://h89.cn/archives/615.html 做了几个月 SA8397P(Snapdragon Cockpit Elite)座舱 Android 开发,最大的感受不是高通这次堆了多少算力,而是:GVM 里的 Android App 旁边,PVM(Protected VM)安全域里跑着另一套随时不能挂掉的操作系统。 搞懂了 PVM 和 GVM 怎么共存,

- 阅读剩余部分 -

数据说话 为什么 AI 反而让你更累 谁是真正的受益者 对自己诚实的建议 参考内容 本文首发地址 https://h89.cn/archives/614.html UC Berkeley Haas 的研究团队花 8 个月盯着一家约 200 人规模的科技公司。结论简单到残忍:AI 没有自然减少工作量,它只是让工作变得更密集。 午休时间有人在发 prompt,开会前五分钟在发 prompt,深夜十二点还在发 prompt。有人同时挂着三个 AI 工具来回切换。最初确实很爽——一个任务过去要半小时,现在五分钟搞定,还能顺手多干两个活。但几个月后,这些人普遍感到比以前更累。不是那种「今天活多」的累,是「明明什么活都变快了,为什么我的时间更少了」的累。 这不是感觉,是实测。 数据说话 Berkeley 这个研究不是孤例。2026 年关于 AI 和生产率的调查出了一堆,数字看起来不完

- 阅读剩余部分 -

一、为什么是飞书 CLI 二、安装:第一道坎不在代码里 三、认证:Agent 登录飞书,比人类更麻烦 四、身份边界:机器人替我发言,还是我替机器人背锅? 测试 1:以 Bot 身份收发消息 测试 2:以 User 身份搜索历史消息 身份边界总结 五、四个工作流实测 工作流 1:晨间日程概览 工作流 2:群消息关键词响应 工作流 3:会议纪要整理 工作流 4:技术问题分析(翻车) 六、翻不过去的墙 1. 权限墙:scope 不够时,Agent 只能报错,无法自愈 2. 安全墙:高风险操作必须人类确认 3. 认知墙:Agent 没有上下文,只能执行,不能判断 七、结论:到底替我上了多少班? 本文首发地址 https://h89.cn/archives/612.html 过去一周,我把飞书官方 CLI 接入了我的工作流,试图回答这个问题。结果不是"可以"或"不可以",而是

- 阅读剩余部分 -

Harness Engineering:Agent 写代码不难,难的是让它别乱写 Harness Engineering:Agent 写代码不难,难的是让它别乱写 一、先看一个真实项目 二、Harness 到底解决什么问题 三、第一层:代码库本身就是真相源 四、第二层:规则要能自动拦住错误 五、第三层:反馈必须足够快 六、第四层:Agent 产出越多,越要管理熵 七、外部案例说明了同一件事 八、最小落地方案 九、冷一点看 参考与延伸阅读 本文首发地址 https://h89.cn/archives/610.html 2026 年 2 月,OpenAI Codex 团队发了一篇文章,里面有个数字很扎眼: 3 个工程师,5 个月,约 100 万行生产级代码,没有一行是人手写的。 他们大约合并了 1,500 个 Pull Reque

- 阅读剩余部分 -

一、技术底座:Kuikly 到底怎么工作的 1.1 核心架构:让 native 层尽量薄 1.2 六平台覆盖与动态化 1.3 代码量对比 二、为什么 2026 年值得重新评估 Kuikly 2.1 鸿蒙生态:KMP 系的天然优势 2.2 AI 驱动开发:不只是口号 2.3 Compose DSL 走向正式 Release 三、KMP 与 Kuikly 的分界线:为什么用了 KMP 还要选 Kuikly 3.1 KMP 做到哪一步 3.2 Kuikly 在 KMP 之上加了什么 3.3 和 Flutter、RN 的本质差异 四、QQ 音乐实战:React H5 → Kuikly 智能转码全记录 4.1 背景与痛点 4.2 成果数据 4.3 技术方案拆解:为什么 AI 转码能落地 五、横向对比:Kuikly 放在选型表里是什么位置 5.1 框架定位总览

- 阅读剩余部分 -

一、四强并立 二、BYTEROVER:让 LLM 自己管理记忆 三、MemPalace:verbatim 哲学的极端实践 四、Mastra OM:极简架构反而最高分 五、四系统横向对比 六、benchmark 分数不是选型依据 七、选型建议 八、结语 本文首发地址 https://h89.cn/archives/597.html 2025 年 12 月,Hindsight 发了一篇论文,宣布自己在 LongMemEval 和 LoCoMo 两个 benchmark 上拿下 SOTA(State-of-the-Art)。Virginia Tech 复现了,The Washington Post 也复现了。MIT 开源,SDK 完整,Fortune 500 在用。 五个月后,它的 SOTA 位置已经被三个新系统抢走了。 但这不重要

- 阅读剩余部分 -

一、Agent Memory 的困境:RAG 和 Knowledge Graph 都卡在哪 二、Hindsight 的解法:仿生记忆三层架构 三、LLM 在 Hindsight 里不是只负责"聊天" 四、三个核心操作:Retain、Recall、Reflect Retain:不只是"存",而是"理解后存" Recall:四路检索 + 融合 + 重排 Reflect:从"回忆"到"学习"的关键 五、实战:5 分钟跑起来 纯嵌入模式(不用跑服务) 给 Claude Code 加记忆 六、性能数据:SOTA 是真的,但竞争在加剧 七、适合谁,不适合谁 八、总结 参考文献 本文首发地址 https://h89.cn/archives/598.html 你的 AI 客服记住了用户上周的问题,但再次遇到类似投诉时,它还是会按标准话术回复,

- 阅读剩余部分 -