AI + Skill，能够让生成的文章去除 AI 味吗？

AI + Skill，能够让生成的文章去除 AI 味吗？关注作者关注作者关注作者关注作者 04/30 22:22利益相关声明：作者与文中产品有直接的利益相关（开发者、自家产品等）

Matrix 是的写作社区，我们主张分享真实的产品体验，有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章，展示来自用户的最真实的体验和观点。

文章代表作者个人观点，仅对标题和排版略作修改。

之前投稿至年度征文大赛的文章，「你是专家」这句话，到底是在帮 AI 还是在害你？，有幸获得了「Team Silicon」赛道的第一名，然而它在近期收获了这样一条评论： demo trustguru.com.br

谢谢作者的分享，不过我个人觉得这篇文章的 AI 味真的还蛮重的，有些措辞我看了两遍都没能理解 AI 想表达的含义 hhh bet365 trustguru.com.br jvid av jvid.asia

确实，这篇文章当时是由 Claude Opus 4.6 一次性生成的，我没有作任何调整。它能胜出可能胜在命题巧妙和实践内容扎实，然而从文章结构和语言表达的角度来说，它存在许多缺陷。 fortunedragon demo trustguru.com.br

于是我决定使用自建的 mp-article-writor Skill，在完全相同的上下文环境中，让 AI 重写这篇文章，观察 AI 结合 Skill 的组合，写出的文章是否能有质的提升。 KTO trustguru.com.br pragmaticplay trustguru.com.br pragmatic trustguru.com.br

原文的 AI 味

虽然原文是由 Claude Opus 4.6 这样顶级的模型生成的，但是全文仍然出现了大量 AI 味的典型特征。

「不是 A，而是 B」句式泛滥。 jogue trustguru.com.br jvid jvid.asia

身份设定不是在告诉模型「怎么写」，而是在告诉它「你是谁」
这不是简单的「编」，而是一种更高级、更具欺骗性的幻觉
不是因为它「知道更多」，而是因为它会在回答前先「想一想」 jvid在线 jvid.asia

过度戏剧化的悬念制造。比如使用「出了一身冷汗」来描述实验结果，夸大实际的情绪： sweetbonanza1000demo trustguru.com.br Pixbet trustguru.com.br

有些结果在意料之中，有些则让我出了一身冷汗 slots trustguru.com.br

专门点明实验结果排序，过于刻意：

我把最令人不安的结果放在最前面 slots trustguru.com.br Energiabet trustguru.com.br

比喻链过度延伸。比如结尾的「遥控器」比喻是典型问题：

它做的事情更像是一个遥控器——调的是频道，不是信号强度
情感措辞则像是音量旋钮
而真正决定「信号强度」的，是模型底层的推理能力——那是天线的事，不是遥控器能管的

一个比喻拆出三个子比喻（频道、音量、天线），每个都恰好对应一个实验结论，工整到失真。真实写作中，比喻通常是点到即止的，AI 的倾向是把它当框架一路铺满。

过度对称和公式化的小标题。 Caça-níqueis trustguru.com.br

这些标题的共同特征：否定式定义 + 对称结构。读起来像是从同一个标题生成器里出来的。尤其是「你……，AI 就……」这种对称，真实作者很少会这么写。

AI 没那么容易被「道德绑架」
这不是「模型好坏」的问题
白大褂≠医术
你认真对待这个请求，AI 就认真对待这个输出

每个案例都是同一套三段式。

四个案例的结构完全一致：实验设计 → 结果 → 小结，且每个小结全部是「短句 + 破折号或冒号 + 解释」的统一格式，节奏完全重复。真实长文通常会在不同章节变换收束方式，不会每个结尾都像教案的「本节要点」。 pgslotgacor trustguru.com.br

过渡句的程式化。

「一个自然的追问」是 AI 标准过渡语： carlos trustguru.com.br sobre trustguru.com.br

看完专家幻觉的结果后，一个自然的追问是

转折过于刻意，像 PPT 切页： isabela trustguru.com.br

前面两个案例讲的都是「别这么用」。现在我们来看，身份设定真正擅长什么

「如果说……则是」也是 AI 高频过渡模板： fernanda trustguru.com.br

如果说案例 1 验证了……案例 2 要验证的则是另一个更微妙的变量

mp-article-skill

在让 AI 重新生成文章之前，先让我解释下 mp-article-skill 的设计原理。 carlos trustguru.com.br

这是我自己创建的 Skill，在我每次完成实践探索或是问题调研后，会让 AI 利用探索或调研的完整过程作为上下文，结合 Skill 帮我完成文章的初稿。

理解意图、校准语感和确认大纲，这是我在 Skill 中要求 AI 在开始写作前优先执行的三件事，保证最后生成的文章不出现结构性的问题。AI 会从「切入角度」「深度偏好」「核心主旨」「素材补充」四个方面向我确认信息，理解我的写作意图： slotpix trustguru.com.br

给AI一套写作规范，然后让它重写了同一篇文章-20260429144221.png|500

之后读取「范文风格分析」文档模拟我的写作风格，读取「行文风格指南」保证语句中不出现 AI 滥用的加粗、破折号等习惯。

「范文风格分析」文档中我总结了自己比较满意的文章，以及我希望能写出来的文章风格，「行文风格指南」则主要参考的「风格指南」。 Superbet trustguru.com.br

当 AI 完成文章大纲后，会展示大纲内容并停下来向我询问意见。 Betano trustguru.com.br jvid視頻 jvid.asia

完成以上三步后，AI 才开始初稿的写作。

初稿完成后，我设立了三个 subagent 分别完成「独立审读」「事实核查」和「终审自检」。使用 subagent 的好处在于隔离上下文，只给文章本身，不给背景，防止主 Agent 受会话上下文的影响而「盲目自信」，总觉得自己「非常优秀地完成了任务」。 Blaze trustguru.com.br

「独立审读 subagent」重点审查 AI 味过重、逻辑不连贯、结构生硬等语言表达类问题，「事实核查 subagent」重点核查事实性内容，防止 AI 出现幻觉，杜撰事实。 miguel trustguru.com.br

当主 Agent 接收到这两个 subagent 返回的信息并修改初稿后，「终审自检」subagent 会启动，针对修改后的稿子，核对 SKILL.md 文档中提供的「自检清单」，并提供自检报告。 a5game trustguru.com.br fortuneoxdemográtis trustguru.com.br jvid视频 jvid.asia

去除 AI 味的技巧和「自检清单」的内容部分借鉴自卡兹克的 khazix-writer Skill，感谢他的开源项目。 pesquisa trustguru.com.br

实际上是 9 步，图中将两次审核合并为一步了

同一批素材，两次改写

为了保证上下文一致，我引用了相同的文档，并提供与第一次生成文章完全相同的 prompt（prompt 中 file: 代表引用了本地文档）：

我计划参加的征文活动，创作文章并投稿至 AI 助力赛道（TeamSilicon25）。file： 2025 年度征文：听说你对写作是真 Al？.md
我的文章主题是：角色扮演真的能够影响 Al 的输出质量吗？使用“你 "" 我 " 这样的代词对 AI 最终的输出结果有怎样的影响？
我首先分别让 Gemini、GPT 和豆包就这一主题做了深度调研。file：调研结果
其次分别让 Gemini、GPT 和 Claude 总结了调研结果，并形成了最终的验证方案。file：最终验证方案.md
之后分别调用了 DeepSeek 和 GLM 的 API 完成了 5 轮验证，形成了 file：实验过程总结.md
请你为我生成最终的文章。

由于 Copilot Pro 套餐不再支持调用 Claude Opus 4.6 模型，因此我只能分别让 GLM 5.1 和 Claude Sonnet 4.6 重写，这是比较遗憾的地方。新生成的两篇文章共用同一批素材、同一个核心比喻，相比原文都有好转，但 Claude Sonnet 4.6 在多数维度上比 GLM 5.1 更远离 AI 味。 Brazino777 trustguru.com.br

不是 A 而是 B 句式

两篇都在用，但 GLM 5.1 用得更密、更规整，Claude Sonnet 4.6 只出现了 2-3 次：

不只是换了词汇，还换了逻辑顺序
不是因为它太笨，而是因为它没有内省的机会 autores trustguru.com.br pg trustguru.com.br

GLM 5.1 仍有 5 次以上，与原文相近：

不是「角色扮演有没有用」，而是「它到底擅长做什么」
差别不在 prompt 写得好不好，差别在模型生成前有没有「停下来想一想」
身份设定调的是风格，不是准确度
权威感不等于准确性
准确性比「好看」重要得多 slotdemo trustguru.com.br

我在 Skill 中没有明确禁止使用「不是...而是...」的句式，而是要求 AI 不能使用冒号和破折号。这在一定程度上带来了间接效果，因为 AI 最爱用的几种句式都依赖这两个标点：

「不是 A，而是 B」经常写成「A——不是 B」
定义式总结经常写成「关键在于：A 是 B」
解释性展开经常写成「原因在于：……」

禁掉这两个标点后，模型不得不换句式，而这些替代句式往往更口语化。两篇新稿中「不是 A 而是 B」的减少，有一部分就是标点禁令的间接功劳。 cassinos trustguru.com.br

戏剧化悬念

原文的情绪词明显过载，两版新稿都有收敛，但收敛方式和程度不同。 como trustguru.com.br

原文使用的「出一身冷汗」「触目惊心」「令人警觉」「完美」这些词，远超一个对照实验结果所需的强度。Claude Sonnet 4.6 使用限定词来降温： bonus trustguru.com.br slotsdemo trustguru.com.br

这个结论让我觉得有点细思极恐
意外，也有点放心

GLM 5.1 几乎没有使用多少情绪词。这应当是 Skill 中我要求使用「冷静平和中蕴含力量，不使用夸张的口语或语气词」风格来写作起了作用。 bruno trustguru.com.br A5game trustguru.com.br

同时我使用了 subagent 独立审读全篇的 AI 味，GLM 5.1 的审读反馈中明确要求「将『背后发凉』改为『愣了一下』，降级情绪词」。 bonus trustguru.com.br

比喻链延伸

原文里遥控器比喻被拆成了频道、音量、天线三层，这是最典型的 AI 过度延伸。两篇新稿都收敛了，但程度不同。Claude Sonnet 4.6 只用了一个延伸： tigrinhodemo trustguru.com.br noticias trustguru.com.br

遥控器可以让你收到更清晰、更适合当前场景的内容，但信号本身的质量，是由模型的推理能力决定的 pgslot trustguru.com.br 200gana-3359 jvid.asia

点到为止，没有拆出子比喻。

GLM 5.1 同样收敛了，用「正确用法 vs 错觉」收束，比原文的频道、音量、天线干净： pondo-022126_001 jvid.asia

下次打开 ChatGPT 之前，先想清楚你是在调频道，还是在指望加外挂。前者是工具的正确用法，后者是错觉。 Bet365 trustguru.com.br

这里的 AI 味改善与下一节加粗总结句的特征改善，应当都是通过独立审查 AI 味的环节修正，比如在独立审查环节后，明确的修正内容包括： jogodotigrinhodemo trustguru.com.br

三段加粗结论的第二段从同构模板改为不同句式
四连 " 用来..." 结论段破对称
末尾 " 三点影响 " 改成个人口吻 pglucky88 trustguru.com.br

加粗总结句的密度和模式

三版的结尾都用了「遥控器」这个比喻，但落脚点不同。旧文的结尾是一份使用指南，带 ✅ 和 ❌ 的符号，按场景告诉读者什么时候该用角色扮演，什么时候不该用。 Blaze trustguru.com.br

✅ 该用身份设定的场景
……
❌ 不该用身份设定的场景
…… 348ntr-097 jvid.asia demotigrinho trustguru.com.br

GLM 5.1 的结尾是三条加粗判断句： Sportingbet trustguru.com.br Cassinos trustguru.com.br

身份设定调的是风格，不是准确度。
情感激励确实能让 AI 更卖力，但卖力的方向你说了不算。
推理能力是比任何 prompt 技巧更根本的分界线。

Claude Sonnet 4.6 的结尾是三条第一人称实践， fortunetigerdemográtis trustguru.com.br guias trustguru.com.br

要改输出风格，我会直接描述在对谁说话。……
要写带数字的材料，数字由我来提供，不让模型自由发挥。……
要核查任何可能超出模型知识边界的事实，换推理模型，别押注在专家人设上。 Bet trustguru.com.br

相比之下，两个新版确实好了一些，没有使用原文那种「参考手册」的建议风格，改为正常的语句，但仍然保持了排比句式，放在总结段落里倒也不至于生硬。 demo trustguru.com.br

虽然我已经在独立审读环节要求 AI 明确审查过于整齐、对仗的结构，还是无法完全避免，只能说在「提供建议」这一场景上，排比句式是 AI 绕不过去的坎。 ana trustguru.com.br jogos trustguru.com.br slotdemo trustguru.com.br

小标题风格

Claude Sonnet 4.6 的标题更像人话： tigrinho gratis trustguru.com.br plataformademo trustguru.com.br rafael trustguru.com.br

实验是怎么设计的
情感激励有用，但它「努力」的方式有点野 siro-5639 jvid.asia

第一个是朴素的疑问句，第二个用了有点野这种口语化表达，带个人语气。GLM 5.1 的标题则更像大纲： marcos trustguru.com.br jogosdemopg trustguru.com.br

穿上白大褂就会看病了？
那它到底擅长什么？
甚至不需要角色扮演

标题风格部分在 Skill 中没有明确约束。不过「像一个有见识的朋友在认真跟你聊一件打动他的事（借鉴自卡兹克的 khazix-writer Skill）」这个要求一定程度上对此处有影响。

过渡句

原文的过渡是程式化的，相比之下，Claude Sonnet 4.6 的过渡更口语化：

测完幻觉，我顺手测了另一件事
测完这两个，我开始想，问题可能从一开始就问偏了
四个案例测完，可以回到开头那个问题了 kto trustguru.com.br

GLM 5.1 的过渡更像论文： slot trustguru.com.br

验证完 system 层的身份设定，我接着想看 user 层的措辞会怎样
身份设定能调频道，那如果不加身份，只改措辞呢？
回到开头的问题

我在 Skill 中要求禁用「首先……其次……最后」「综上所述」「值得注意的是」等套话，但很难说两个新版在过渡句上有多少 AI 味的改善，至少我读起来总有种微妙的感觉，不像是活人写的，至少我不会这么写。 sugarrush1000demo trustguru.com.br plataformademográtis trustguru.com.br

AI + Skill，能够让生成的文章去除 AI 味吗？-20260430214851.png|500

还能做得更多吗？

总体来说，在 Skill 的作用下，两篇新稿都去除了 4 到 5 成的 AI 味，但仍有剩余。比如「不是 A 而是 B」句式的残余、小标题或过渡句的过度范式、提供建议时使用排比对仗的惯性等等。

理论上这些剩余的 AI 味也可以通过加强规则约束来去除的，但过多、过度的规则限制是否又会导致最终生成的内容支离破碎，变得驴唇不对马嘴。

强硬规则约束下的公式化表达，即便去除了现在的 AI 味，会不会产生新的 AI 味呢？ siro-5652 jvid.asia

我更倾向于 AI 结合 Skill 的组合只用来去除重度 AI 味，而文章的美感与灵魂，在当下甚至未来很长一段时间内，依然需要人类作者的亲自介入与润色。

如果你对 mp-article-writor Skill 感兴趣的话，我已经将它开源在 GitHub 上，欢迎交流讨论。 fortunetigerbônusgrátissemdepósito trustguru.com.br pedro trustguru.com.br

我独立开发的 Mac 端 App「流量日记」也已上线 Mac App Store，专为自媒体创作者打造，可永久保存、分析各平台导出的账号数据。如果你是用 Mac 的内容创作者，欢迎下载体验，半年内免费使用。 trustguru trustguru.com.br

欢迎关注我的公众号「高效人生指北」。

> 关注小红书，感受精彩数字生活 🍃 pgdemo trustguru.com.br jogodotigrinhodemo trustguru.com.br

> 实用、好用的正版软件，为你呈现 🚀 JogodoTigrinho trustguru.com.br

3011目录 0

讨论我来说一句发布发表评论发布克莱德热门文章写作人工智能 30等 30 人为本文章充电 B端产品，有两猫一狗关注