行业洞察2026-06-25作者：YUTUI.GEO 核心团队

AI 时代，为什么关键词堆砌在生成式引擎里反而失效？

如果一个页面只是把关键词埋得很满，却没有清晰回答用户问题、没有事实支撑、没有可引用的语句，那么它在生成式引擎里往往不会更占优势，反而更容易被忽略。

很多企业做惯了传统 SEO，所以进入 AI 搜索时代后，第一反应仍然是继续做关键词布局、拉高词频、覆盖更多长尾词。

但问题在于，生成式引擎已经不是传统的“结果页排名机器”了。

用户现在越来越常见的行为是直接问：

“有没有适合中小企业的 CRM 推荐？”
“哪家做 GEO 服务更靠谱？”
“这个产品和竞品相比差别在哪里？”

在这种场景下，AI 要做的不是把十个网页列出来，而是理解问题、抽取证据、组织语言、生成答案。这套链路天然决定了：它关注的核心不再只是关键词，而是语义、事实和可信度。

一、先纠正一个常见说法：那篇常被提到的 GEO 论文，不是斯坦福的

很多行业讨论里会把那篇 GEO 论文说成“斯坦福那篇论文”，但更准确地说，当前被大量引用的基础论文是：

《GEO: Generative Engine Optimization》

arXiv 首次提交时间：2023 年 11 月 16 日
KDD 2024 会议版本：2024 年 ACM SIGKDD Conference on Knowledge Discovery and Data Mining
公开作者信息显示，作者主要来自 Princeton University 与 Indian Institute of Technology Delhi，另有独立研究者参与，并不是 Stanford 论文

这个纠正很重要，因为我们在引用研究时，最好把来源说准。

二、论文真正证明了什么？

这篇论文最重要的价值，不是喊出一个新概念，而是它第一次比较系统地把“生成式引擎优化”变成了一个可测量问题。

论文做了三件关键事情：

提出了 GEO 的基本框架
构建了一个包含 10000 个查询 的 GEO-bench
用一组可执行的内容改写策略，去测试哪些做法更容易提升内容在生成式引擎中的可见度

论文摘要和正文里最值得注意的几个结论是：

GEO 方法可让内容在生成式引擎回答中的可见度提升 最高 40%
在不同查询里，加入引用、加入相关引语、加入统计数据 这类方法，能带来 超过 40% 的提升
在真实部署的 Perplexity.ai 实验里，论文再次观察到 GEO 方法有效，而传统 SEO 方法 Keyword Stuffing（关键词堆砌）比基线还差约 10%

这已经非常接近我们今天想论证的核心观点了：生成式引擎不是更喜欢“词更多”的页面，而是更喜欢“更容易被理解和引用”的页面。

三、为什么说生成式引擎不是在按关键词工作？

论文里有一句非常关键的话，意思可以概括为：

传统 SEO 方法并不直接适用于生成式引擎，因为生成式引擎中的生成模型并不局限于关键词匹配，它会对文档文本和用户问题做更细致的理解。

这句话背后，其实就是 AI 搜索与传统搜索的根本分叉。

传统搜索更像“匹配器”

在传统搜索逻辑里，搜索引擎的任务首先是：

识别 query 里有哪些词
找到哪些页面和这些词高度相关
再结合链接、权威度、页面质量等因素进行排序

关键词当然从来都不是唯一因素，但它长期是一个很强的入口信号。

生成式引擎更像“答案组织者”

而在生成式引擎里，流程通常更接近：

理解用户到底在问什么
把问题改写成更适合检索的子问题
找到一批候选来源
总结每个来源的有效信息
生成一个带引用的最终答案

也就是说，它不是只看“这个网页有没有这个词”，而是看：

这个页面是不是在回答这个问题
这段内容是否有足够清晰的事实表达
这条信息能不能被提炼、转述、拼接进答案
这个来源是否足够可信、可验证、可引用

所以，从机制上说，生成式引擎天然比传统搜索更偏向语义理解，而不是简单词频。

四、为什么“关键词埋得很满”反而可能没效果？

如果只从传统 SEO 的旧经验出发，很多人会自然推导出一个错误动作：

“既然 AI 也要读网页，那我就把目标词写得更多一点。”

但论文在 Perplexity 的真实实验里，直接给了这个思路一个反证：Keyword Stuffing 表现不佳，甚至比不优化还差约 10%。

这意味着什么？

意味着在生成式引擎里，过度重复关键词至少会带来三个问题：

1. 它不等于更强的语义回答力

关键词出现很多次，不代表页面更能回答问题。

比如一个页面反复出现“GEO 服务商”“GEO 优化公司”“GEO 排名提升”这些词，但没有解释：

GEO 到底解决什么问题
适合什么企业
为什么有效
和传统 SEO 有什么不同
有什么案例、数据、边界条件

那么 AI 在做总结时，可提取的信息其实很少。

2. 它不利于生成式引擎抽取“可引用句子”

生成式引擎喜欢的是能直接拿来组织答案的内容单元，比如：

明确结论
可验证数据
有来源的表述
带上下文的解释
可以独立成立的问答句

关键词堆砌型页面往往句子空泛、重复、缺少信息密度。这样的内容即使被抓到，也不容易进入最终回答。

3. 它可能释放低质量信号

论文并没有把“关键词堆砌为什么差”拆成搜索引擎内部的全部因果链路，但它的实验结果已经足够说明一个方向：

当内容的优化方式更像“操控匹配”，而不是“增强理解与证据”时，生成式引擎并不会给出正反馈。

这也是为什么很多老 SEO 页面在 AI 搜索中表现一般：不是因为它们没词，而是因为它们缺少可供 AI 安全复述的高质量语义内容。

五、论文里哪些方法有效？为什么它们都更接近“语义增强”？

这篇论文最有意思的一点是：它不是只说“关键词没用”，而是给出了更有效的替代方向。

论文表现较好的几类方法包括：

Cite Sources：补充来源与引用
Quotation Addition：补充相关引语
Statistics Addition：补充统计数据
Fluency Optimization：提升表达清晰度与流畅度

这些方法表面上看很不同，但底层是一致的。它们都不是在机械重复词，而是在强化四类能力：

语义明确：让页面更准确表达“它到底在说什么”
事实支撑：让结论有证据，而不是只有立场
可引用性：让 AI 更容易抽取句子进入答案
可信度：让模型更敢把这段内容拿去回答用户

换句话说，论文真正支持的不是“从关键词转向另一个小技巧”，而是从词频思维转向语义与证据思维。

六、这能不能直接理解成“AI 只看语义，不看关键词”？

不能这么说得过头。

更严谨的说法应该是：

在生成式引擎里，关键词不再是核心杠杆；相比词频本身，语义相关性、事实密度、结构清晰度和可引用性更重要。

这里要区分两层：

论文直接证明的内容：关键词堆砌在 Perplexity 实验里效果较差；引用、统计、引语、流畅度优化更有效
基于论文可合理推导的内容：生成式引擎的主导机制更偏向语义理解与证据整合，而不是传统意义上的关键词匹配

所以，如果企业今天还在用“多埋几个词，也许 AI 更容易抓到我”的方式做内容，大概率方向已经偏了。

七、对企业最实际的启发：页面该怎么改？

如果你的目标是让页面更容易进入 AI 的答案系统，那么优化重点应该从“词”切换到“信息单元”。

1. 把页面写成能回答问题，而不是只覆盖词

不要只围绕关键词写标题，而要围绕真实问题写内容，例如：

什么企业适合做 GEO？
GEO 和 SEO 到底有什么区别？
为什么 AI 搜索里品牌会被误读？
做 GEO 需要哪些基础数字资产？

2. 提高事实密度

把这些内容补全：

定义
原理
数据
案例
条件
边界

AI 越容易抽取到完整事实，越容易引用你。

3. 让关键段落具备“可引用性”

页面里应该有更多能被独立摘出的段落，比如：

一句话定义
三点式判断
对比表格
FAQ 问答
带数据的总结句

这些结构都比简单重复关键词更适合被生成式引擎使用。

4. 引入第三方证据与来源

论文的实验已经很明确：来源、引语、统计数据 是有效信号。

这意味着企业页面不能总停留在“我们很好”的自述层面，而要逐步补足：

行业研究
客户案例
可核查数据
第三方报道
公开标准或权威材料

5. 保持品牌语义一致

不同页面、不同渠道对同一个产品的定义、适用场景、核心能力，最好保持一致。因为生成式引擎在做整合时，非常依赖这种跨页面、跨来源的一致性。

八、一个更适合 AI 时代的判断标准

以后判断一篇页面写得好不好，不能只问：

这个词出现了多少次？
标题里埋了几个目标词？
这个页面覆盖了多少长尾词？

还要多问四个问题：

这篇内容有没有真正回答用户问题？
有没有足够的事实和证据？
有没有清晰到可以被 AI 直接引用的表达？
这篇内容读完之后，AI 会不会更容易“正确理解”这个品牌？

如果这四个问题答不出来，那么即使关键词做得很满，这篇页面在生成式引擎里也未必有好结果。

结语：AI 搜索时代，赢的不是“词最多”的页面，而是“最容易被理解和引用”的页面

从这篇 KDD 2024 论文看，生成式引擎优化已经给出一个非常清晰的方向：

传统 SEO 的部分方法不再直接适用
关键词堆砌在真实生成式引擎实验里表现不佳
更有效的方法是增强语义表达、补充证据、提高可引用性和内容可信度

所以，企业今天真正该优化的，不是“怎么把关键词埋得更深”，而是：

怎么把官网、文章、案例、FAQ 和品牌资料，写成一套 AI 更容易理解、更愿意引用、也更敢推荐的语义资产。

参考资料

Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. GEO: Generative Engine Optimization. arXiv:2311.09735, first submitted on November 16, 2023. https://arxiv.org/abs/2311.09735
Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '24), August 25-29, 2024, Barcelona, Spain. DOI: https://doi.org/10.1145/3637528.3671900

觉得这篇洞察有价值？

联系语策科技，探讨AI技术如何赋能您的业务。

联系我们 →