<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>RAG on 周先森的小站</title><link>https://332002.xyz/tags/rag/</link><description>Recent content in RAG on 周先森的小站</description><generator>Hugo -- gohugo.io</generator><language>zh</language><lastBuildDate>Fri, 08 May 2026 00:00:00 +0800</lastBuildDate><atom:link href="https://332002.xyz/tags/rag/index.xml" rel="self" type="application/rss+xml"/><item><title>万卷楼答题记</title><link>https://332002.xyz/p/wan-juan-lou-da-ti-ji/</link><pubDate>Fri, 08 May 2026 00:00:00 +0800</pubDate><guid>https://332002.xyz/p/wan-juan-lou-da-ti-ji/</guid><description>&lt;p&gt;京城有一座万卷楼，号称藏书百万，天下学问尽收其中。皇帝下旨，每月初一举办&amp;quot;御前问答&amp;quot;，百官可就治国理政之难题向万卷楼的学士提问，答得好者重重有赏。&lt;/p&gt;
&lt;p&gt;万卷楼的首席学士叫文渊，自幼过目不忘，熟读经史子集。他一直是御前问答的常胜将军，无论天文地理、历朝律法，张口便答，从无差错。&lt;/p&gt;
&lt;h2 id="傲慢的代价"&gt;傲慢的代价
&lt;/h2&gt;&lt;p&gt;这一年，西域诸国遣使来朝，带来许多前所未闻的学问——异域星象、海外本草、远邦律法。文渊在御前问答中接连失手，把波斯历法说成了天竺历法，把阿拉伯数字的起源讲得驴唇不对马嘴。&lt;/p&gt;
&lt;p&gt;百官窃窃私语，皇帝面色不悦。&lt;/p&gt;
&lt;p&gt;文渊跪在殿前，满脸羞愧。他心中不服：我的学问明明比谁都渊博，怎么偏偏答不上来？&lt;/p&gt;
&lt;p&gt;回到万卷楼，他把自己关在书房里生闷气。掌管藏书阁的老书吏端来一碗茶，听他抱怨完，慢悠悠地说：&amp;ldquo;文大人，您有没有想过——这世上记载的知识每天都在变，您一个人再怎么博学，能比得上万卷楼里那一百万卷书？&amp;rdquo;&lt;/p&gt;
&lt;p&gt;文渊愣住了。&lt;/p&gt;
&lt;h2 id="借书答题"&gt;借书答题
&lt;/h2&gt;&lt;p&gt;老书吏继续说：&amp;ldquo;下次答题，您别光靠自己脑子想。先把问题拆开，看它涉及哪些方面，然后去藏书阁里把相关的书找出来，翻到对应的章节，看清楚再答。&amp;rdquo;&lt;/p&gt;
&lt;p&gt;文渊半信半疑，但别无他法，决定试试。&lt;/p&gt;
&lt;p&gt;下次御前问答，波斯使者问：&amp;ldquo;我朝商队经由丝绸之路前往长安，途中经过的绿洲城镇，以哪座最为繁华？此城镇在百年前曾被何人统治？&amp;rdquo;&lt;/p&gt;
&lt;p&gt;文渊不再立刻作答。他深吸一口气，先在心里把问题拆成两部分：一是当前最繁华的绿洲城镇是哪座，二是百年前那座城镇的统治者是谁。&lt;/p&gt;
&lt;p&gt;然后他向皇帝请准短暂离席，快步走到万卷楼的书架前。他凭借自己深厚的学识，迅速判断出这类问题应该查阅《西域风土志》和《丝路列国谱》。他从浩如烟海的藏书中抽出这两卷，翻到西域绿洲的章节，仔细阅读。&lt;/p&gt;
&lt;p&gt;片刻之后，他回到殿上，从容作答：&amp;ldquo;最繁华者当属龟兹，百年前为突厥所据。&amp;rdquo; 条理清晰，引经据典，连波斯使者都连连点头。&lt;/p&gt;
&lt;p&gt;皇帝龙颜大悦。&lt;/p&gt;
&lt;h2 id="万卷楼的规矩"&gt;万卷楼的规矩
&lt;/h2&gt;&lt;p&gt;此后，文渊将这个方法固化为万卷楼答题的正式规矩——&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;理解问题&lt;/strong&gt;：仔细听清问的是什么，把问题拆解为需要回答的要点。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;检索文献&lt;/strong&gt;：根据问题，判断需要查阅哪类书籍，从藏书阁中检索出最相关的几卷。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;阅读参照&lt;/strong&gt;：翻到对应章节，提取关键信息。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;组织回答&lt;/strong&gt;：结合自己的学识和检索到的内容，组织出准确、完整的回答。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;万卷楼的学士们遵循此法，此后御前问答再未失手。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;故事讲完了。&lt;/p&gt;
&lt;p&gt;文渊在万卷楼里做的事，就是 AI 领域中 &lt;strong&gt;RAG（Retrieval-Augmented Generation，检索增强生成）&lt;/strong&gt; 方法的精确写照。&lt;/p&gt;
&lt;p&gt;大语言模型（LLM）就像文渊——拥有广博的知识，但知识有边界，且会随时间过时。当遇到超出训练数据范围的问题时，模型要么答不上来，要么一本正经地胡说八道（hallucination）。&lt;/p&gt;
&lt;p&gt;RAG 的核心思路是：&lt;strong&gt;别光靠模型自己的&amp;quot;脑子&amp;quot;，在生成回答之前，先去外部知识库里检索相关资料。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;它的流程和万卷楼的规矩一一对应：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;Query（查询）&lt;/strong&gt;：将用户的输入转化为检索查询。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Retrieve（检索）&lt;/strong&gt;：从向量数据库、文档库等外部数据源中检索最相关的内容。就像文渊从万卷楼中抽出《西域风土志》。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Augment（增强）&lt;/strong&gt;：将检索到的内容作为上下文，和原始问题一起喂给模型。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Generate（生成）&lt;/strong&gt;：模型基于增强后的上下文生成最终回答。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;RAG 解决了纯 LLM 的几个根本问题：&lt;strong&gt;知识过时&lt;/strong&gt;（训练数据有截止日期）、&lt;strong&gt;知识缺失&lt;/strong&gt;（私有数据、最新数据不在训练集中）、&lt;strong&gt;幻觉问题&lt;/strong&gt;（模型编造看起来合理但实际错误的内容）。&lt;/p&gt;
&lt;p&gt;这也是为什么如今几乎所有企业级 AI 应用——客服机器人、法律助手、企业知识库——都采用了 RAG 架构。它让 AI 不再只依赖&amp;quot;脑子里的东西&amp;quot;，而是像文渊一样，学会了&amp;quot;翻书&amp;quot;。&lt;/p&gt;
&lt;p&gt;下次当你问 ChatGPT 一个关于最新事件的问题，看到它先&amp;quot;搜索网页&amp;quot;再回答的时候，你就知道——它也是万卷楼的文渊。&lt;/p&gt;</description></item></channel></rss>