2026年5月22日 · 3 分钟阅读
新论文:GEO-SFE —— 内容结构如何塑造 AI 的引用行为
我们最新的研究 GEO-SFE 提出了面向生成引擎优化的「结构特征工程」框架。在主流的 6 个生成引擎上,结构化改写带来 +17.3% 的引用率提升与 +18.5% 的主观质量提升。
我们很高兴地分享团队最新的论文 《Structural Feature Engineering for Generative Engine Optimization: How Content Structure Shapes Citation Behavior》,现已在 arXiv 上发布。这篇论文正面回答了我们在客户项目中 反复遇到的一个问题:当 AI 回答引擎决定引用哪些页面时,这个决策究竟在 多大程度上由「结构」而非「语义」驱动?
→ 阅读论文全文(PDF) · arXiv 摘要页
我们想填补的空白
现有的 GEO 研究大多聚焦在 语义层的改写 —— 关注内容「说了什么」。 但我们在生产环境中反复看到同一种现象:两个页面表达几乎相同的观点, ChatGPT / Perplexity / Gemini 却稳定地引用其中一个,无视另一个。 差异不在信息本身,而在围绕它的「脚手架」。GEO-SFE 正是为了让这套 脚手架变得可测量、可调控。
GEO-SFE 的核心思路
我们将页面结构分解为三个层级,并对每一层如何影响不同生成引擎架构的 引用概率进行建模:
- 宏观结构(Macro) —— 文档级架构:分节方式、标题层级、叙述顺序。
- 中观结构(Meso) —— 信息切块:段落密度、列表用法、事实摆放 位置、强调框。
- 微观结构(Micro) —— 视觉强调:加粗、行内高亮、渲染后仍能 保留的排版线索。
在这三个层级之上,我们构建了架构感知的优化策略与预测模型, 确保在保留语义完整性的前提下,让结构改写真正被引擎「看到」。
实验结果
我们在 6 个主流生成引擎上进行了评估,得到了一致的提升:
- +17.3% 引用率
- +18.5% 主观回答质量
跨引擎家族都保持一致的提升,是我们最在意的结果 —— 这说明结构层面 的效应是可泛化的规律,而不是对某一个模型怪癖的过拟合。
作者
- Junwei Yu
- Mufeng Yang
- Yepeng Ding
- Hiroyuki Sato
本工作以 VeReach GEO 计划下的研究合作形式开展。如果你希望讨论 GEO-SFE 在自身内容上的应用,欢迎与我们联系。
这对产品意味着什么
GEO-SFE 不是一个独立工具,而是直接接入 VeReach GEO 已有的「改写 — 重测」闭环。接下来,结构层面的诊断与改写建议会和语义信号一样成为 一级公民,与 PIRR / PRP / CCD 指标共同驱动同一个循环。
完整方法论、架构感知的优化策略以及各引擎的细节,欢迎阅读论文 —— arxiv.org/abs/2603.29979.