如果一个页面只是把关键词埋得很满,却没有清晰回答用户问题、没有事实支撑、没有可引用的语句,那么它在生成式引擎里往往不会更占优势,反而更容易被忽略。
很多企业做惯了传统 SEO,所以进入 AI 搜索时代后,第一反应仍然是继续做关键词布局、拉高词频、覆盖更多长尾词。
但问题在于,生成式引擎已经不是传统的“结果页排名机器”了。
用户现在越来越常见的行为是直接问:
- “有没有适合中小企业的 CRM 推荐?”
- “哪家做 GEO 服务更靠谱?”
- “这个产品和竞品相比差别在哪里?”
在这种场景下,AI 要做的不是把十个网页列出来,而是理解问题、抽取证据、组织语言、生成答案。这套链路天然决定了:它关注的核心不再只是关键词,而是语义、事实和可信度。
一、先纠正一个常见说法:那篇常被提到的 GEO 论文,不是斯坦福的
很多行业讨论里会把那篇 GEO 论文说成“斯坦福那篇论文”,但更准确地说,当前被大量引用的基础论文是:
《GEO: Generative Engine Optimization》
- arXiv 首次提交时间:2023 年 11 月 16 日
- KDD 2024 会议版本:2024 年 ACM SIGKDD Conference on Knowledge Discovery and Data Mining
- 公开作者信息显示,作者主要来自 Princeton University 与 Indian Institute of Technology Delhi,另有独立研究者参与,并不是 Stanford 论文
这个纠正很重要,因为我们在引用研究时,最好把来源说准。
二、论文真正证明了什么?
这篇论文最重要的价值,不是喊出一个新概念,而是它第一次比较系统地把“生成式引擎优化”变成了一个可测量问题。
论文做了三件关键事情:
- 提出了 GEO 的基本框架
- 构建了一个包含 10000 个查询 的 GEO-bench
- 用一组可执行的内容改写策略,去测试哪些做法更容易提升内容在生成式引擎中的可见度
论文摘要和正文里最值得注意的几个结论是:
- GEO 方法可让内容在生成式引擎回答中的可见度提升 最高 40%
- 在不同查询里,加入引用、加入相关引语、加入统计数据 这类方法,能带来 超过 40% 的提升
- 在真实部署的 Perplexity.ai 实验里,论文再次观察到 GEO 方法有效,而传统 SEO 方法 Keyword Stuffing(关键词堆砌)比基线还差约 10%
这已经非常接近我们今天想论证的核心观点了:生成式引擎不是更喜欢“词更多”的页面,而是更喜欢“更容易被理解和引用”的页面。
三、为什么说生成式引擎不是在按关键词工作?
论文里有一句非常关键的话,意思可以概括为:
传统 SEO 方法并不直接适用于生成式引擎,因为生成式引擎中的生成模型并不局限于关键词匹配,它会对文档文本和用户问题做更细致的理解。
这句话背后,其实就是 AI 搜索与传统搜索的根本分叉。
传统搜索更像“匹配器”
在传统搜索逻辑里,搜索引擎的任务首先是:
- 识别 query 里有哪些词
- 找到哪些页面和这些词高度相关
- 再结合链接、权威度、页面质量等因素进行排序
关键词当然从来都不是唯一因素,但它长期是一个很强的入口信号。
生成式引擎更像“答案组织者”
而在生成式引擎里,流程通常更接近:
- 理解用户到底在问什么
- 把问题改写成更适合检索的子问题
- 找到一批候选来源
- 总结每个来源的有效信息
- 生成一个带引用的最终答案
也就是说,它不是只看“这个网页有没有这个词”,而是看:
- 这个页面是不是在回答这个问题
- 这段内容是否有足够清晰的事实表达
- 这条信息能不能被提炼、转述、拼接进答案
- 这个来源是否足够可信、可验证、可引用
所以,从机制上说,生成式引擎天然比传统搜索更偏向语义理解,而不是简单词频。
四、为什么“关键词埋得很满”反而可能没效果?
如果只从传统 SEO 的旧经验出发,很多人会自然推导出一个错误动作:
“既然 AI 也要读网页,那我就把目标词写得更多一点。”
但论文在 Perplexity 的真实实验里,直接给了这个思路一个反证:Keyword Stuffing 表现不佳,甚至比不优化还差约 10%。
这意味着什么?
意味着在生成式引擎里,过度重复关键词至少会带来三个问题:
1. 它不等于更强的语义回答力
关键词出现很多次,不代表页面更能回答问题。
比如一个页面反复出现“GEO 服务商”“GEO 优化公司”“GEO 排名提升”这些词,但没有解释:
- GEO 到底解决什么问题
- 适合什么企业
- 为什么有效
- 和传统 SEO 有什么不同
- 有什么案例、数据、边界条件
那么 AI 在做总结时,可提取的信息其实很少。
2. 它不利于生成式引擎抽取“可引用句子”
生成式引擎喜欢的是能直接拿来组织答案的内容单元,比如:
- 明确结论
- 可验证数据
- 有来源的表述
- 带上下文的解释
- 可以独立成立的问答句
关键词堆砌型页面往往句子空泛、重复、缺少信息密度。这样的内容即使被抓到,也不容易进入最终回答。
3. 它可能释放低质量信号
论文并没有把“关键词堆砌为什么差”拆成搜索引擎内部的全部因果链路,但它的实验结果已经足够说明一个方向:
当内容的优化方式更像“操控匹配”,而不是“增强理解与证据”时,生成式引擎并不会给出正反馈。
这也是为什么很多老 SEO 页面在 AI 搜索中表现一般:不是因为它们没词,而是因为它们缺少可供 AI 安全复述的高质量语义内容。
五、论文里哪些方法有效?为什么它们都更接近“语义增强”?
这篇论文最有意思的一点是:它不是只说“关键词没用”,而是给出了更有效的替代方向。
论文表现较好的几类方法包括:
- Cite Sources:补充来源与引用
- Quotation Addition:补充相关引语
- Statistics Addition:补充统计数据
- Fluency Optimization:提升表达清晰度与流畅度
这些方法表面上看很不同,但底层是一致的。它们都不是在机械重复词,而是在强化四类能力:
- 语义明确:让页面更准确表达“它到底在说什么”
- 事实支撑:让结论有证据,而不是只有立场
- 可引用性:让 AI 更容易抽取句子进入答案
- 可信度:让模型更敢把这段内容拿去回答用户
换句话说,论文真正支持的不是“从关键词转向另一个小技巧”,而是从词频思维转向语义与证据思维。
六、这能不能直接理解成“AI 只看语义,不看关键词”?
不能这么说得过头。
更严谨的说法应该是:
在生成式引擎里,关键词不再是核心杠杆;相比词频本身,语义相关性、事实密度、结构清晰度和可引用性更重要。
这里要区分两层:
- 论文直接证明的内容:关键词堆砌在 Perplexity 实验里效果较差;引用、统计、引语、流畅度优化更有效
- 基于论文可合理推导的内容:生成式引擎的主导机制更偏向语义理解与证据整合,而不是传统意义上的关键词匹配
所以,如果企业今天还在用“多埋几个词,也许 AI 更容易抓到我”的方式做内容,大概率方向已经偏了。
七、对企业最实际的启发:页面该怎么改?
如果你的目标是让页面更容易进入 AI 的答案系统,那么优化重点应该从“词”切换到“信息单元”。
1. 把页面写成能回答问题,而不是只覆盖词
不要只围绕关键词写标题,而要围绕真实问题写内容,例如:
- 什么企业适合做 GEO?
- GEO 和 SEO 到底有什么区别?
- 为什么 AI 搜索里品牌会被误读?
- 做 GEO 需要哪些基础数字资产?
2. 提高事实密度
把这些内容补全:
- 定义
- 原理
- 数据
- 案例
- 条件
- 边界
AI 越容易抽取到完整事实,越容易引用你。
3. 让关键段落具备“可引用性”
页面里应该有更多能被独立摘出的段落,比如:
- 一句话定义
- 三点式判断
- 对比表格
- FAQ 问答
- 带数据的总结句
这些结构都比简单重复关键词更适合被生成式引擎使用。
4. 引入第三方证据与来源
论文的实验已经很明确:来源、引语、统计数据 是有效信号。
这意味着企业页面不能总停留在“我们很好”的自述层面,而要逐步补足:
- 行业研究
- 客户案例
- 可核查数据
- 第三方报道
- 公开标准或权威材料
5. 保持品牌语义一致
不同页面、不同渠道对同一个产品的定义、适用场景、核心能力,最好保持一致。因为生成式引擎在做整合时,非常依赖这种跨页面、跨来源的一致性。
八、一个更适合 AI 时代的判断标准
以后判断一篇页面写得好不好,不能只问:
- 这个词出现了多少次?
- 标题里埋了几个目标词?
- 这个页面覆盖了多少长尾词?
还要多问四个问题:
- 这篇内容有没有真正回答用户问题?
- 有没有足够的事实和证据?
- 有没有清晰到可以被 AI 直接引用的表达?
- 这篇内容读完之后,AI 会不会更容易“正确理解”这个品牌?
如果这四个问题答不出来,那么即使关键词做得很满,这篇页面在生成式引擎里也未必有好结果。
结语:AI 搜索时代,赢的不是“词最多”的页面,而是“最容易被理解和引用”的页面
从这篇 KDD 2024 论文看,生成式引擎优化已经给出一个非常清晰的方向:
- 传统 SEO 的部分方法不再直接适用
- 关键词堆砌在真实生成式引擎实验里表现不佳
- 更有效的方法是增强语义表达、补充证据、提高可引用性和内容可信度
所以,企业今天真正该优化的,不是“怎么把关键词埋得更深”,而是:
怎么把官网、文章、案例、FAQ 和品牌资料,写成一套 AI 更容易理解、更愿意引用、也更敢推荐的语义资产。
参考资料
- Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. GEO: Generative Engine Optimization. arXiv:2311.09735, first submitted on November 16, 2023. https://arxiv.org/abs/2311.09735
- Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '24), August 25-29, 2024, Barcelona, Spain. DOI: https://doi.org/10.1145/3637528.3671900
