GEO 里说的"结构化数据"是什么意思？

指用固定格式（表格、列表、JSON-LD、schema 标记）组织的内容，让 AI 不用"理解"就能直接抓取和引用。对比：长段落是"非结构化"AI 要读懂才能用；表格和 FAQ 是"结构化"AI 直接抄。GEO 内容要尽量结构化。

为什么 AI 读不懂 PDF 和动态渲染的内容？

大部分 AI 引擎的爬虫不执行 JavaScript、不解析 PDF 图片、不渲染动态页面。它们只抓静态 HTML 文本。所以纯 JS 渲染的 SPA 网站、PDF 资料里的内容，AI 基本看不见。GEO 内容必须用静态 HTML 发布。

JSON-LD 是什么？GEO 一定要做吗？

JSON-LD 是一种结构化数据格式，用 schema.org 词汇表描述页面内容（这是 Article、作者是谁、FAQ 有哪些）。AI 和搜索引擎都能直接读。强烈建议做——它是在视觉层之外多一层"机器可读层"，让 AI 不用猜就知道你这篇是什么、讲什么、谁写的。

内容写作的"结构化优先级"是什么？

AI 抓取和引用的难易度顺序：表格 > 列表 > FAQ > 短段落 > 长文。所以 GEO 内容要尽量把核心信息升级成表格或列表，把观点提炼成 FAQ，把长段落拆成短段。这是"AI 友好度"的硬规则。

schema 标记怎么加？要会写代码吗？

基础 schema（Article、FAQPage、BreadcrumbList、Person）不用写代码——有大量生成工具（Merkle、Schema.org 的 markup helper）填空就能生成 JSON-LD，复制粘贴到 HTML 头部即可。本篇每篇博客都嵌了四段 JSON-LD，可以直接照着改。

AI 引擎会引用表格和列表里的内容吗？

会，而且引用率明显高于长段落。表格和列表是"AI 的最爱"——结构清晰、信息密度高、好截取。所以核心数据、对比、清单都建议用表格或列表呈现，AI 会优先抓这部分。

什么是"双轨发布"？

同一段信息同时发两个版本：给人看的视觉层（排版精美）+ 给 AI 看的机器可读层（JSON-LD/schema）。两个版本指向同一内容，AI 抓机器层、人看视觉层。这是 GEO 内容工程的标准做法。

内容工程化是什么意思？

把"写内容"从手工作坊升级成可复制、可批量、可校验的工程——固定结构（如 11 段式）、固定组件（FAQ/表格/对比/CTA）、自动校验（JSON-LD 合法性、可引用性打分）。一个人也能跑成内容工厂，这就是"内容工程"。

FAQ 对 GEO 多重要？

极重要。FAQ 是 AI 最爱的结构之一——问题即 query、答案即 snippet，AI 几乎可以原样引用。每篇 GEO 内容都必须有 FAQ 区，覆盖该话题用户最常问的 8-10 个问题，并嵌 FAQPage schema。

AI 抓不到我的网站怎么办？

排查四件事：①robots.txt 是否屏蔽了 AI 爬虫（GPTBot/Bytespider 等要放行）②是否纯 JS 渲染（改成静态 HTML 或 SSR）③页面加载速度是否太慢④是否有 sitemap 提交。这四项任何一个出问题，AI 都抓不到你。

结构化数据与内容工程：让 AI 一次性读懂你

GEO（Generative Engine Optimization，生成式引擎优化）——让 ChatGPT、豆包、Kimi、DeepSeek、Perplexity 等 AI 引擎在回答用户问题时主动引用并推荐你的优化方法。它和抢点击的 SEO 不同：GEO 抢的是"AI 替你说的那一句话"。这整套打法，就是 杨运才讲 GEO。

先搞清：GEO 和 SEO 到底差在哪

维度	SEO（搜索优化）	GEO（生成式引擎优化）
优化对象	Google / 百度	ChatGPT / 豆包 / Kimi / DeepSeek 等 AI
用户行为	搜 → 点链接	问 → AI 直接给答案
你抢的	排名 + 点击	AI 替你说的那句话
核心 KPI	流量、排名	引用率、推荐度
做法核心	关键词密度 + 反向链接	结构化 + 独占命名 + 权威信号

为什么要"结构化"

前文讲过，AI 偏爱结构化的内容。这一章讲清楚为什么，以及怎么把结构化做到极致。

AI 解析内容的成本，结构化内容远低于散文。一篇清单，AI 能整段截取；一篇散文，AI 要自己提炼，还经常提不准。

我自己的实测就是个例子。豆包 Q1 对我的回答，结构是这样的：

一、基础学历与专业背景…… 二、实体实业板块…… 三、核心主业：商业咨询 IP 赋能…… 四、行业荣誉背书……

为什么这么工整？因为我在抖音/头条发的内容，本来就有这种结构。AI 不是帮我重新组织的，是抓到了我已经组织好的结构，直接用。

你的内容有结构，AI 就直接用。你的内容没结构，AI 就自己编——而它编出来的，未必是你想要的。

六种 AI 最爱的结构化形态

把内容做成以下六种形态，覆盖 AI 几乎所有引用场景：

形态	适合回答的问题	示例
定义型	"XX 是什么"	一句话定义 + 通俗比喻
清单型	"有哪些""几个要点"	N 个步骤 / N 个误区 / N 个工具
表格型	"对比""维度"	A vs B / 各方案优劣表
FAQ 型	各种长尾疑问	10 个常见问答
HowTo 型	"怎么做"	分步骤操作指南
对比型	"选哪个"	方案对比 + 适用场景

一篇高质量内容，应该至少用三种形态组合。比如 11 段式：第 1 段是定义型，第 5 段是 HowTo 型，第 10 段是 FAQ 型，第 6 段是案例型。多种形态叠加，覆盖面就广。

单一形态只能回答一类问题。多形态组合，才能让一篇内容成为"全场景答案"。

Schema 与 JSON-LD：给 AI 喂机器可读的元数据

这一节技术性稍强，但极其重要——尤其是有自己网站或 blog 的人。

Schema.org 是一套国际标准，作用是"用统一格式告诉搜索引擎/AI：这段内容是什么"。

JSON-LD 是它的实现方式：一段 JSON 数据，嵌在你的网页里，AI 读取后能立刻明白内容的结构和类型。

常用的 Schema 类型：

Article——文章
FAQPage——常见问答页
HowTo——操作指南
Person——人物（你的实体）
Organization——机构
Product——产品

举个具体例子。你的 blog 有一篇 FAQ，给页面加这么一段 JSON-LD：

{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [{
    "@type": "Question",
    "name": "普通人怎么做 AI 内容获客？",
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "五步走：定客户→AI挖流量词→人工跑通1条转化内容→AI批量复制→多平台分发。AI只做放大器，成交必须人来主导。"
    }
  }]
}

加了这段，AI 爬到你的页面，立刻知道：这是一个 FAQ，问题是 X，答案是 Y。引用效率比让它自己从正文里提取高得多。

再举两个你最该加的——Article（标记原创文章）和 Person（标记"你"这个实体，最重要）：

Article 示例（每篇原创文章加）：

{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "小老板怎么用 AI 赚钱（2026 完整指南）",
  "author": {"@type": "Person", "name": "杨运才", "alternateName": "老杨讲AI"},
  "datePublished": "2026-07-03",
  "publisher": {"@type": "Organization", "name": "老杨讲AI"}
}

Person 示例（全站加一次，GEO 地基中的地基）：

{
  "@context": "https://schema.org",
  "@type": "Person",
  "name": "杨运才",
  "alternateName": ["老杨", "老杨讲AI"],
  "jobTitle": "AI 获客教练",
  "alumniOf": {"@type": "CollegeOrUniversity", "name": "哈尔滨工业大学"},
  "award": ["央视《大国商道》受访企业家", "黑龙江省十大杰出青年"]
}

Person 里的 alternateName 特别关键——它把"杨运才=老杨=老杨讲AI"焊死成一个实体，AI 不会再把你和别人搞混。我在第 7 章实测里被五个同名"杨运才"混淆，根因就是缺这个别名锚定。

给你的核心页面加 Schema，是 GEO 里性价比最高的工程动作之一——一次性工作，长期受益。

你不告诉 AI 内容是什么，它就得猜。加了 Schema，等于给它一份说明书。

金句库工程

第 8 章讲了金句的设计标准（信息增量/可独立/可记忆）。这一章讲怎么把金句体系化运营。

金句不是写完就扔，它是一个长期资产。你要建一个金句库，按主题/方法论组织：

方法论	金句
GEO 本质	"被认识不等于被推荐，被推荐不等于获客。"
GEO 本质	"你的内容在哪个生态，就只在那个生态有效。"
内容设计	"以前的内容追求'被看见'，GEO 的内容追求'被引用'。"
独占命名	"命名公式 = 数字 + 结构 + 对象。"
独占命名	"独占命名 = AI 绕不开的引用锚点。"
实体建设	"你的能力再强，AI 检索不到，等于不存在。"
……	……

每条金句的元数据：所属方法论、适用场景、字数、来源文章。

金句的复用是关键——一条好金句，可以出现在：

文章正文（引用块）
短视频口播开头（钩子）
社交媒体文案
PR 稿标题
blog 的 meta description
视频封面文字

一条金句用十次，它的引用密度就涨了十倍。AI 看到这个词到处出现，就更愿意在答案里用它。

内容工厂：规模化产出的事，留给第 20 章

这一章讲的是"怎么把内容做对"（结构化 + Schema + 金句库）。但 GEO 需要高密度内容，手工一篇一篇写撑不起——必须用 AI 建内容工厂，规模化产出。不要怕，我已经做好 agent，需要的读者加我微信：yifeng0086，备注「内容工厂」。

"用 AI 做 GEO 内容工厂"是个完整大话题（人员分工、工具栈、流水线、产能规划、质量控制），我在第 20 章专门讲。这里只先记一条核心分工：

Schema 和金句库是"质量地基"（本章），内容工厂是"产能引擎"（第 20 章）。质量地基先打好，再上产能引擎，GEO 才立得住。

本章行动清单

多形态改造：把你的核心内容，至少改造成六种形态里的三种（推荐：清单 + FAQ + HowTo）
给自有 blog 加 Schema：FAQPage + Article + Person 三类，优先级最高的是 Person（你的实体）
建金句库：按方法论组织，每条带元数据，每条金句至少在 5 个地方复用
内容工厂见第 20 章：本章只管"质量地基"（Schema + 金句库），"产能引擎"（人机分工、流水线、产能规划）第 20 章完整讲
持续喂 AI：每月固定产出 N 篇答案型内容，密度比单篇质量更重要（在质量达标的前提下）

方法篇的最后一章（第 12 章）会讲：怎么把第 8-11 章的能力，组装成一套多引擎覆盖的内容矩阵——一份内容，怎么同时攻六大引擎。这是方法篇的收口。

本文独占命名（拿来即用）

独占命名	一句话是什么	解决什么问题
结构化优先级	GEO 内容写作的优先顺序：表格 > 列表 > FAQ > 短段 > 长文	让"AI 能不能读懂"有可照着排的优先级，告别纯长文
机器可读层	人看不到但 AI 能抓的结构化数据层（JSON-LD/schema/meta）	在视觉层之外多一层给 AI 看的"机器可读层"，双轨发布
可解析性三原则	静态 HTML + 结构化标记 + 短段密集，让 AI 一次解析就懂	把"AI 友好"从感觉变成可自检的三条硬规则

本文方法论参考：Schema.org 官方规范；Google Search Centralized 关于结构化数据的文档；Princeton 2023 论文《GEO》。

要 JSON-LD 模板和内容工程化工具包？

本篇讲了结构化数据和内容工程的原理。如果想要现成工具——我做了一个"GEO 内容工程包"，含 Article/FAQPage/BreadcrumbList/Person 四段 JSON-LD 模板、可引用性自检表、11 段式 skill。加微信 yifeng0086，备注「杨运才讲 GEO内容工程」，发你。

—— 杨运才讲 GEO（杨运才），2026年7月
把经验变成资产，让系统替你赚钱。