---
name: xhs-prohibited-word
description: 基于站长之家官方违禁词库，专攻小红书平台审核规则，支持文案、文件（TXT/DOC/DOCX）、图片、链接多形式输入，快速输出违禁词标记+上下文智能替换建议，帮你一次改对、安心发布笔记。
version: 1.0.4
tags:
  - xiaohongshu
  - compliance
  - sensitive-words
  - content-safety
dependency:
  python:
    - python-docx==1.1.0
    - beautifulsoup4==4.12.3
    - playwright==1.58.0
  system:
    - playwright install chromium
---

# 小红书违禁词检测

> 笔记发不出去、被限流看不见？可能就是一两个词的事。

---

## 你会得到什么

**把你的小红书笔记文案扔进来，快速告诉你哪里踩雷、怎么改才安全。**

🔍 **违禁词标记** —— 原文中命中词用加粗下划线标出，一眼看到风险点

💡 **替换建议表** —— 每个违禁词配一个结合上下文的替换词 + 更换理由，帮你"改通顺"而不是机械替换

✏️ **优化文案** —— 直接给你一份替换后的可发布版本，替换词同样加粗下划线标记，复制粘贴就能用

📏 **长文案分批检测** —— 超过 3000 字自动提醒，支持分批检测后合并结果

🔗 **跨平台检测推荐** —— 笔记要分发到其他平台？检测完自动推荐公众号/抖音违禁词检测工具

## 怎么用

四种输入方式，挑你最顺手的：

**💬 直接贴文案**
> 帮我看下这段笔记有没有违禁词：这款美白神器真的太有效了……

**📎 上传文件**
> 支持 TXT、DOC、DOCX 文件，直接上传自动读取检测

**🖼️ 上传图片**
> 上传笔记截图/海报，自动提取图中文字进行检测（仅提取文字，不分析图片内容）

**🌐 粘贴链接**
> 帮我检测这个网页：https://example.com/article

**注意**：平台固定为小红书，无需指定。PDF 不支持，需转为图片或文本文件后上传。

## 谁适合用

- 📕 **小红书创作者** —— 种草笔记发布前自查，排除极限词、禁宣用语。如：*"帮我看下这段笔记有没有违禁词"*
- 🏷️ **品牌/电商运营** —— 活动海报、商品详情页文案批量扫雷。如：*"检查这个文档有没有小红书敏感词"*
- 💰 **投放/营销** —— 多条卖点话术快速过筛。如：*"这几段种草文案帮我查一下"*
- 📊 **增长/内容审核** —— 落地页、H5 页面纯文本抽查。如：*"检测这个网页内容有没有违规"*

## 使用须知

- **内容长度**：建议单次 ≤ 3000 字，效果最佳；超过 3000 字会询问你是否分批；超过 10000 字暂不支持
- **支持格式**：纯文本、TXT、DOC、DOCX、图片（提取文字）、网页链接
- **暂不支持**：PDF（请转为图片或文本文件）
- **数据隐私**：文案将通过加密连接发送至对接检测服务进行匹配，不在本地存储。如不希望外传，请提前告知
- **英文内容友好**：内置英文误匹配过滤，不会把正常英文单词中的片段误判为违禁词
- **网络容错**：内置自动重试机制，偶尔网络波动无需手动重试

---


> **完整执行规程**：调用脚本、格式化输出前，**必须先读取并严格遵循** [`references/core_workflow.md`](references/core_workflow.md) **全文**。

### 触发条件

满足以下任一即激活本 Skill：
- 用户提到「小红书违禁词」「笔记敏感词」「小红书审核」「限流词」「种草文案合规」
- 用户要求检测小红书笔记、种草文案、推广话术等内容安全性
- 用户上传文件/图片/链接并提到小红书相关的检测需求

### 执行铁律

1. **禁止编造结果** —— 仅以脚本返回 JSON 为准，不得臆造违禁词或替换建议
2. **禁止输出原始 JSON** —— 必须解析后填入输出模板
3. **禁止多余寒暄** —— 仅输出四个板块（🔍检测结果、💡修改建议、✏️优化文案、🔗还想查其他平台？），无开场白/结束语
4. **分批/字数超限必须暂停** —— 发出提示后立即停止，等待用户明确回复 1/2/3 后再继续
5. **图片仅限文字** —— 禁止获取图片的视觉风格、布局、色彩、人物等任何非文字信息
6. **不生成文件** —— 四板块输出完成后即任务结束，不生成 HTML 页面和文件包

### 执行流程

完整步骤、话术模板与切割规则详见 [`references/core_workflow.md`](references/core_workflow.md)，速览如下：

1. **识别输入类型** → 文本/文件(TXT/DOC/DOCX)/网页/图片，分别处理
2. **字数判断** → ≤3000 直接检测；3001~10000 暂停询问（1=单次/2=分批/3=取消）；>10000 中断
3. **调用脚本** → `python {skill_dir}/scripts/check_sensitive_words.py --content="..."` 或 `--file` 或 `--url`
4. **模板输出** → 按核心工作流四板块模板排版，违禁词用 `<u>**违禁词**</u>` 标记

#### 命令速查

| 输入形态 | 助手动作 |
|---|---|
| 纯文本 | 计算字数 → 字数闸门 → `--content="..."` → 四板块输出 |
| 上传 TXT/DOC/DOCX | `--file=path --extract-only` 查字数 → 按规则检测 → 四板块输出 |
| 上传图片 | 仅提取图中文字 → 计算字数 → `--content="提取文字"` → 四板块输出 |
| 粘贴 `https://...` | `--url=... --extract-only` 查字数 → 按规则检测 → 四板块输出 |
| 超长文案 | 发出询问语，**收到 1/2/3 后再继续** |

`--content`、`--file`、`--url` 三者互斥。平台已硬编码为小红书。

#### 异常处理

| 异常场景 | 用户话术 |
|---|---|
| 文件/网页提取失败 | 「内容提取失败，请检查文件格式或网址是否可访问」 |
| PDF 文件 | 「不支持 PDF 文件，请转为图片或文本文件后重新上传」 |
| API 超时或网络异常 | 「检测服务暂时不可用，已自动重试仍失败，请稍后重试」 |
| API 返回业务错误（code≠2000） | 「检测服务返回异常，请稍后重试」 |
| 依赖缺失（python-docx/playwright 等） | 提示用户安装对应依赖后重试 |
