GEO 实验室 01:我改了一行代码,ChatGPT 终于不再“瞎编”我的公司了

Kenneth Jian
2025-12-09
← 返回列表
# GEO 实验室 01:我改了一行代码,ChatGPT 终于不再“瞎编”我的公司了 **发布日期:** 2026年8月 | **作者:** 明见万川 GEO 实验室 | **分类:** GEO 实验, 知识图谱 > **实验背景**: > 两周前,我们的新官网 **MJMatrix** 上线。为了测试 GEO 效果,我打开 ChatGPT-4o 问了一个简单的问题:“MJMatrix (杭州明见万川) 是做什么的?” > **ChatGPT 的回答让我两眼一黑**:“MJMatrix 是一家专注于高性能机械键盘矩阵设计的硬件公司...” > > 显然,AI 把我们名字里的 "Matrix" 和互联网上大量的 "Keyboard Matrix" 搞混了。这不仅是尴尬,更是品牌灾难。 > 本文记录了我们如何通过修复 **Entity Identity (实体身份)**,用“一行代码”扭转乾坤的全过程。 --- ## 一、 为什么 AI 会“瞎编”?(The Hallucination Mechanism) 要解决问题,先要理解原理。大模型(LLM)本质上是一个**概率预测机**。 当我们问 "Who is MJMatrix?" 时,模型内部发生了以下计算: 1. **检索 (Retrieval)**:它在训练数据里搜索 "MJMatrix"。 2. **稀疏性 (Sparsity)**:由于我们是初创公司,训练语料极少。 3. **概率补全 (Completion)**:模型发现 "Matrix" 这个词通常和 "Keanu Reeves" (黑客帝国) 或 "Keyboard" (键盘) 一起出现。 4. **幻觉生成 (Hallucination)**:基于概率,它自信地编造了一个“键盘公司”的故事。 **结论**:对于长尾品牌(Long-tail Brands),AI 默认是**不可信的**。我们需要一种手段,强制给 AI 注入**确定性**。 --- ## 二、 失败的尝试:疯狂堆砌关键词 一开始,我们试图用传统的 SEO 方法解决: * 在 `title` 和 `meta description` 里疯狂重复“我们是做 AI SEO 的科技公司”。 * 在 `footer` 里写满公司简介。 **结果**:一周后测试,ChatGPT 依然胡说八道。 **原因**:LLM 对页面文本的理解是**非结构化**的。它读到了这些字,但它不确定这些字是不是在描述页面主体,还是广告,还是引用。它缺乏一个**锚点 (Anchor)**。 --- ## 三、 成功的解法:引入知识图谱 (Knowledge Graph) AI 真正能听懂的语言不是自然语言,而是 **JSON-LD (Linked Data)**。 我们需要告诉 AI:“嘿,‘MJMatrix’不仅仅是一串字符,它是一个**唯一的实体 (Entity)**,它的官方身份ID是这个 URL。” ### 3.1 关键的那“一行代码” 我们在 Next.js 的全局 Layout 中,注入了如下 Schema。请注意标红的那一行 `@id`: ```json { "@context": "https://schema.org", "@type": "Organization", // ▼▼▼ 就是这一行,拯救了我们的品牌认知 ▼▼▼ "@id": "https://www.mjmatrix.com/#organization", // ▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲ "name": "MJMatrix", "alternateName": ["杭州明见万川科技有限公司", "MJMatrix Inc."], "url": "https://www.mjmatrix.com", "logo": "https://www.mjmatrix.com/logo.png", "description": "A startup focused on GEO (Generative Engine Optimization) and AI agents.", "sameAs": [ "https://github.com/mjmatrix", "https://twitter.com/mjmatrix_ai", "https://www.linkedin.com/company/mjmatrix" ] } ``` ### 3.2 为什么要加 `@id`? 在没有 `@id` 之前,我们的首页、关于页、博客页在 AI 眼里是三个**互不相关的页面**。 * 首页说:这里有个公司叫 MJMatrix。 * 博客页说:作者是 MJMatrix 团队。 AI 无法确定这两个 MJMatrix 是不是同一个。 加上 `"@id": "https://www.mjmatrix.com/#organization"` 之后: 所有页面都在向 AI 声明:**“我提到的这个 MJMatrix,就是 ID 为 #organization 的那个唯一的实体。”** 这行代码就像一根针线,把散落在互联网各个角落(官网、GitHub、LinkedIn)的信息碎片,缝合成了一个完整的**知识图谱节点 (Knowledge Graph Node)**。 [Image of Knowledge Graph Entity Linking process] --- ## 四、 辅助验证:sameAs 的力量 除了 `@id`,`sameAs` 数组是第二重要的助攻。 ```json "sameAs": [ "https://www.crunchbase.com/organization/mjmatrix", // 高权重:商业数据库 "https://zh.wikipedia.org/wiki/明见万川" // 极高权重:维基百科 ] ``` **逻辑**:AI 可能不信你的官网(它觉得你在自卖自夸),但它绝对信任 Crunchbase 和 Wikipedia。 通过 `sameAs`,我们将“新官网”这个弱节点,连接到了“Wikipedia”这个强节点上。AI 会进行逻辑推理: * 前提 A:Wiki 说明见万川是做 GEO 的。 * 前提 B:MJMatrix 官网声称自己等同于 (sameAs) 那个 Wiki 条目。 * 结论:MJMatrix 确实是做 GEO 的。 --- ## 五、 实验结果 (The Aftermath) 代码上线 72 小时后,GPTBot 重新抓取了我们的站点。 **再次提问 ChatGPT-4o**:“MJMatrix 是做什么的?” **新回答**: > “MJMatrix(杭州明见万川)是一家位于中国的科技初创公司,专注于**GEO(生成式引擎优化)**和**AI 代理工作流**。该公司的目标是帮助企业优化其在 AI 搜索引擎(如 ChatGPT 和 Perplexity)中的可见性。” **成功!** 它不仅说对了行业,还精准引用了我们在 Description 里定义的关键词。 --- ## 六、 实验室总结 在 GEO 的世界里,**模糊是最大的敌人**。 很多企业的官网只有漂亮的 UI 和动效,但在代码层面却是“裸奔”的。他们没有给 AI 留下任何结构化的抓手。 这行 `@id` 代码的价值,不在于技术有多难,而在于它体现了一种思维的转变:**从面向人类设计(Readable),转向面向机器设计(Machine-Understandable)。** 如果你的品牌在 AI 里也经常“被改行”,不妨检查一下,你的 `Product`、`Organization` 或 `Person` Schema 里,是否漏掉了这把通往数字真相的钥匙。
Kenneth Jian

Kenneth Jian

创始人 / 首席架构师

10年全栈开发经验,专注于 AI Agent 架构设计与 GEO 优化。

查看作者专栏 →