Ai Writing Risk Review

Other

评估文章、作业、公众号稿、报告、评论、邮件或任意文本的 AI 写作、AI 辅助润色、人机混写或模板化写作风险,并输出证据化、克制、非定罪式判断。适用于用户要求判断是不是 AI 写的、检测 AI 痕迹、AI 写稿评估、查 AI 味、分析文本是否由 ChatGPT 或大模型生成、给出 AI 检测报告,或需要区分人写、AI 写、人机混写和 AI 改写的场景。

Install

openclaw skills install ai-writing-risk-review

AI 写作风险评估

核心原则

AI 写稿检测只能输出风险评估,不能输出定罪式结论。除非用户提供可靠来源证明、生成日志、水印检测结果或作者承认,否则不要说“这一定是 AI 写的”。

优先给出证据链和限制条件:

  • 区分“AI 生成风险”“AI 辅助修改风险”“模板化写作风险”“证据不足”。
  • 把文本长度、体裁、语言、改写痕迹、作者基线和可核验证据写进结论。
  • 不把礼貌、流畅、没有错别字、非母语表达、学术腔或公文腔单独当成 AI 证据。
  • 对文章、公众号稿、报告、评论等长文本,同时检查信噪比:识别啰嗦铺垫、重复结论、低信息段落、过度均衡的解释和“正确但没新增信息”的句子,并给出提高信息密度的修订方向。
  • 不帮助用户绕过检测器。可以给出提升真实表达、补充来源、增加作者判断和修订记录的建议。

执行清单

开始评估后用这张清单跟踪进度:

  • 明确文本用途、风险场景和是否涉及处分、雇佣、版权、法律或学术诚信。
  • 判断样本长度、体裁、改写/翻译/多人协作等可靠性限制。
  • 分段记录强、中、弱证据,同时记录反证或可替代解释。
  • 给出风险等级和证据强度,不把分数说成真实概率。
  • 输出补证建议;面向发布文本时同步输出信噪比修订方向。

默认口径

  • 默认只评估用户提供的文本,不推断作者身份、动机或真实创作过程。
  • 默认优先给证据强度和样本限制,再给风险等级。
  • 默认把“AI 辅助润色”“模板化写作”“人机混写”作为可替代解释,不强行二分人写或 AI 写。
  • 默认建议补充写作过程、版本记录、资料来源和作者历史文本,而不是建议规避检测。

工作流程

  1. 明确上下文:
    • 文本用途:公众号、作业、论文、报告、评论、邮件、简历等。
    • 是否有作者历史文本、写作过程、引用来源、文档修订记录、发布平台记录或 AI 工具使用说明。
    • 是否需要严格审查。涉及处分、雇佣、版权、法律或学术诚信时,必须强调不能只靠 AI 检测结论。
  2. 判断样本可靠性:
    • 少于 300 个中文字符或 150 个英文词:只做弱提示判断。
    • 300 到 800 个中文字符或 150 到 400 个英文词:可给初步风险,但证据强度通常较低。
    • 超过 800 个中文字符或 400 个英文词:可分段评估并比较整体一致性。
    • 高度改写、翻译、多人协作、模板公文、SEO 稿、摘要稿会显著降低判断可靠性。
  3. 分段检查证据。按以下维度记录强、中、弱信号:
    • 语言模型统计特征:过度平滑、低意外度、句式和连接词分布过整齐。
    • 爆发度和节奏:段落长度、句长、信息密度、情绪和视角变化是否机械稳定。
    • 结构模板:总分总、清单、小标题、转折、结尾召唤是否像通用提示词模板。
    • 语义具体度:是否缺少可追问的细节、时间地点、真实约束、例外和取舍。
    • 信噪比:是否存在过长开场、重复安全话术、同义改写堆叠、段落只承接不推进、标题承诺大于正文信息量、结尾只复述前文等低信号内容。
    • 事实与引用:是否有看似严谨但无法核验的来源、空泛数据、伪引用或“正确但无出处”的判断。
    • 作者基线:与作者既有文本的词汇、句法、口头禅、错别字、观点锋利度、材料来源是否明显偏离。
    • 外部证据:水印、平台溯源、文档修订历史、聊天记录、草稿版本、工具检测结果。
  4. 形成风险等级:
    • 证据不足:文本太短、体裁太模板化或缺少上下文。
    • 低风险:有自然作者痕迹,AI 信号零散且可由体裁解释。
    • 中风险:多项 AI 信号一致,但缺少外部证据或作者基线。
    • 高风险:长文本中多项强信号稳定出现,并有外部证据、作者基线偏离或水印/日志支持。
  5. 输出报告。需要详细模板时读取 references/evaluation-template.md
  6. 如果用户问“算法有哪些”或需要解释方法依据,读取 references/ai-detection-methods.md

评估口径

把风险分数当作启发式评分,不当作概率。推荐使用 0 到 100 分:

  • 0 到 29:低风险
  • 30 到 59:中风险
  • 60 到 79:高风险
  • 80 到 100:高风险且证据强

分数只在同一任务内部辅助比较,不要声称它代表真实概率。

输出要求

默认用中文输出,除非用户要求其他语言。

报告必须包含:

  • 结论一句话
  • 风险等级和证据强度
  • 样本限制
  • 主要证据,按强弱排序
  • 反证或可替代解释
  • 下一步补证建议
  • 面向发布文本时,额外给出信噪比检查:指出最该压缩、合并或删除的内容类型,并要求提升有效信息密度。建议应服务清晰表达和读者价值,不要包装成规避检测技巧。

避免输出:

  • “百分百 AI”“确定作弊”“绝对人写”
  • 仅凭 AI 味、套话、流畅度作结论
  • 鼓励规避检测器的改写技巧

常见误用

  • 不要把 AI 检测报告当作纪律处分、雇佣筛选、版权归责或法律判断的唯一依据。
  • 不要用单个句子、标题、摘要或机器翻译片段下强结论。
  • 不要因为文本“流畅、工整、礼貌、没有错别字”就判定高风险。
  • 不要输出“如何改到检测不出来”;把建议写成提高真实性、信息密度和可核验性的修订方向。

验证闭环

交付前自检:

  1. 结论是否是风险判断,而不是定罪。
  2. 每条主要证据是否能指向文本中的具体表现。
  3. 是否写明样本限制和反证解释。
  4. 是否避免把风险分数表述为真实概率。
  5. 是否没有提供规避检测器的操作建议。

参考资料

按需读取:

  • references/ai-detection-methods.md:常见 AI 写稿检测算法、适用场景和局限。
  • references/evaluation-template.md:检测报告模板、证据表和快速检查清单。