2026年5月22日 · 3 分钟阅读

新论文：GEO-SFE —— 内容结构如何塑造 AI 的引用行为

我们最新的研究 GEO-SFE 提出了面向生成引擎优化的「结构特征工程」框架。在主流的 6 个生成引擎上，结构化改写带来 +17.3% 的引用率提升与 +18.5% 的主观质量提升。

研究 GEO 论文

Junwei Yu CEO

我们很高兴地分享团队最新的论文 《Structural Feature Engineering for Generative Engine Optimization: How Content Structure Shapes Citation Behavior》，现已在 arXiv 上发布。这篇论文正面回答了我们在客户项目中反复遇到的一个问题：当 AI 回答引擎决定引用哪些页面时，这个决策究竟在多大程度上由「结构」而非「语义」驱动？

→ 阅读论文全文（PDF） · arXiv 摘要页

我们想填补的空白

现有的 GEO 研究大多聚焦在 语义层的改写 —— 关注内容「说了什么」。但我们在生产环境中反复看到同一种现象：两个页面表达几乎相同的观点， ChatGPT / Perplexity / Gemini 却稳定地引用其中一个，无视另一个。差异不在信息本身，而在围绕它的「脚手架」。GEO-SFE 正是为了让这套脚手架变得可测量、可调控。

GEO-SFE 的核心思路

我们将页面结构分解为三个层级，并对每一层如何影响不同生成引擎架构的引用概率进行建模：

宏观结构（Macro） —— 文档级架构：分节方式、标题层级、叙述顺序。
中观结构（Meso） —— 信息切块：段落密度、列表用法、事实摆放位置、强调框。
微观结构（Micro） —— 视觉强调：加粗、行内高亮、渲染后仍能保留的排版线索。

在这三个层级之上，我们构建了架构感知的优化策略与预测模型，确保在保留语义完整性的前提下，让结构改写真正被引擎「看到」。

实验结果

我们在 6 个主流生成引擎上进行了评估，得到了一致的提升：

+17.3% 引用率
+18.5% 主观回答质量

跨引擎家族都保持一致的提升，是我们最在意的结果 —— 这说明结构层面的效应是可泛化的规律，而不是对某一个模型怪癖的过拟合。

作者

Junwei Yu
Mufeng Yang
Yepeng Ding
Hiroyuki Sato

本工作以 VeReach GEO 计划下的研究合作形式开展。如果你希望讨论 GEO-SFE 在自身内容上的应用，欢迎与我们联系。

这对产品意味着什么

GEO-SFE 不是一个独立工具，而是直接接入 VeReach GEO 已有的「改写 — 重测」闭环。接下来，结构层面的诊断与改写建议会和语义信号一样成为一级公民，与 PIRR / PRP / CCD 指标共同驱动同一个循环。

完整方法论、架构感知的优化策略以及各引擎的细节，欢迎阅读论文 —— arxiv.org/abs/2603.29979.