← 返回 Insights

2026年5月22日 · 3 分钟阅读

新论文:GEO-SFE —— 内容结构如何塑造 AI 的引用行为

我们最新的研究 GEO-SFE 提出了面向生成引擎优化的「结构特征工程」框架。在主流的 6 个生成引擎上,结构化改写带来 +17.3% 的引用率提升与 +18.5% 的主观质量提升。

研究 GEO 论文
Junwei Yu Junwei Yu CEO

我们很高兴地分享团队最新的论文 《Structural Feature Engineering for Generative Engine Optimization: How Content Structure Shapes Citation Behavior》,现已在 arXiv 上发布。这篇论文正面回答了我们在客户项目中 反复遇到的一个问题:当 AI 回答引擎决定引用哪些页面时,这个决策究竟在 多大程度上由「结构」而非「语义」驱动?

阅读论文全文(PDF)  ·  arXiv 摘要页

我们想填补的空白

现有的 GEO 研究大多聚焦在 语义层的改写 —— 关注内容「说了什么」。 但我们在生产环境中反复看到同一种现象:两个页面表达几乎相同的观点, ChatGPT / Perplexity / Gemini 却稳定地引用其中一个,无视另一个。 差异不在信息本身,而在围绕它的「脚手架」。GEO-SFE 正是为了让这套 脚手架变得可测量、可调控。

GEO-SFE 的核心思路

我们将页面结构分解为三个层级,并对每一层如何影响不同生成引擎架构的 引用概率进行建模:

  • 宏观结构(Macro) —— 文档级架构:分节方式、标题层级、叙述顺序。
  • 中观结构(Meso) —— 信息切块:段落密度、列表用法、事实摆放 位置、强调框。
  • 微观结构(Micro) —— 视觉强调:加粗、行内高亮、渲染后仍能 保留的排版线索。

在这三个层级之上,我们构建了架构感知的优化策略与预测模型, 确保在保留语义完整性的前提下,让结构改写真正被引擎「看到」。

实验结果

我们在 6 个主流生成引擎上进行了评估,得到了一致的提升:

  • +17.3% 引用率
  • +18.5% 主观回答质量

跨引擎家族都保持一致的提升,是我们最在意的结果 —— 这说明结构层面 的效应是可泛化的规律,而不是对某一个模型怪癖的过拟合。

作者

  • Junwei Yu
  • Mufeng Yang
  • Yepeng Ding
  • Hiroyuki Sato

本工作以 VeReach GEO 计划下的研究合作形式开展。如果你希望讨论 GEO-SFE 在自身内容上的应用,欢迎与我们联系

这对产品意味着什么

GEO-SFE 不是一个独立工具,而是直接接入 VeReach GEO 已有的「改写 — 重测」闭环。接下来,结构层面的诊断与改写建议会和语义信号一样成为 一级公民,与 PIRR / PRP / CCD 指标共同驱动同一个循环。

完整方法论、架构感知的优化策略以及各引擎的细节,欢迎阅读论文 —— arxiv.org/abs/2603.29979.