标签 Embedding 下的文章

一、RAG 的真相:48% 的失败率被藏起来了 二、Context Window 革命:1M 已成标配 三、Wiki 模式:不是复古,是重新对齐 四、六维度拆解:RAG 和 Wiki 到底差在哪 五、决策框架:什么时候选什么 六、收束:误区、行动建议、一句话结论 本文首发地址 https://h89.cn/archives/620.html 2024 年,每个做 AI 知识库的人都在说 RAG。检索增强生成,Retrieval-Augmented Generation,这串字母组合几乎成了企业知识管理的唯一答案。搭一个向量数据库,把文档切成块,灌进 Embedding 模型,再套个重排器——恭喜你,拥有了一个"AI 驱动"的知识库。 但 2026 年 4 月,OpenAI 联合创始人 Andrej Karpathy 发了一条 X 帖子,描述自己怎么用一组

- 阅读剩余部分 -

整体架构 核心模块拆解 1. 多源采集:配置化接入,不硬编码 2. 热点发现:Embedding + DBSCAN 3. LLM 提炼:从 N 篇文章到 1 个结构化事件 4. 热度评分:不只是计数 5. 去重:48 小时滑动窗口 6. 实时推送:SSE 比 WebSocket 简单 踩过的坑 技术启示 参考文献 本文首发地址 https://h89.cn/archives/595.html 这个五一我哪也没去,在家把一个想了很久的项目做完了。 事情是这样的:每天早上刷 Twitter、Hacker News、微博、知乎、36氪……每个平台都有自己的热点,但它们散落各处。更烦的是,算法推荐的"猜你喜欢"往往让真正重要的事件被淹没在信息流里。刷半小时,感觉看了很多东西,但脑子里一团浆糊。 我不是缺新闻,我是缺组织好的信息。 五一假期第一天,我脑子里突然闪过一个念头:

- 阅读剩余部分 -