---
name: dy-prohibited-word
description: 基于站长之家官方违禁词库，专攻抖音平台审核规则，支持文案、文件（TXT/DOC/DOCX）、图片、链接多形式输入，快速输出违禁词标记、上下文智能替换建议，帮你一次改对、安心发布内容。
version: 1.0.1
tags:
  - douyin
  - compliance
  - sensitive-words
  - content-check
dependency:
  python:
    - python-docx==1.1.0
    - beautifulsoup4==4.12.3
    - playwright==1.58.0
  system:
    - playwright install chromium
---

# 抖音违禁词检测

> 视频被限流、文案被下架？可能就是一两个词惹的祸。

---

## 你会得到什么

**把你的抖音文案扔进来，快速告诉你哪里踩雷、怎么改才安全。**

🔍 **违禁词标记** —— 原文中命中词直接标红，一眼看到风险点

💡 **替换建议表** —— 每个违禁词配一个结合上下文的替换词 + 更换理由，帮你"改通顺"而不是机械替换

✏️ **优化文案** —— 直接给你一份替换后的可发布版本，替换词标蓝标记，复制粘贴就能用

📎 **优化文案文件** —— 自动生成纯文本文件，点击即可下载保存

📏 **长文案分批检测** —— 超过 3000 字自动提醒，支持分批检测后合并结果

## 怎么用

四种输入方式，挑你最顺手的：

**💬 直接贴文案**
> 帮我看下这段抖音脚本有没有违禁词：这款美白神器真的太有效了……

**📎 上传文件**
> 支持 TXT、DOC、DOCX 文件，直接上传自动读取检测

**🖼️ 上传图片**
> 上传视频截图/字幕截图，自动提取图中文字进行检测（仅提取文字，不分析图片内容）

**🌐 粘贴链接**
> 帮我检测这个网页：https://example.com/article

**注意**：平台固定为抖音，无需指定。PDF 不支持，需转为图片或文本文件后上传。

## 谁适合用

- 🎬 **短视频编导/创作者** —— 口播脚本、字幕文案发布前自查，排除极限词、禁宣用语。如：*"帮我查一下这个抖音脚本有没有敏感词"*
- 🛒 **电商运营** —— 商品详情页、活动页文案上架前批量扫雷。如：*"检查这个文档有没有抖音违禁词"*
- 📢 **直播话术策划** —— 直播间台词、促销话术快速过筛。如：*"这几段直播话术帮我查一下"*
- 🏷️ **品牌/市场团队** —— 落地页、H5 页面纯文本抽查。如：*"检测这个网页内容有没有违规"*

## 使用须知

- **内容长度**：建议单次 ≤ 3000 字，效果最佳；超过 3000 字会询问你是否分批；超过 10000 字暂不支持
- **支持格式**：纯文本、TXT、DOC、DOCX、图片（提取文字）、网页链接
- **暂不支持**：PDF（请转为图片或文本文件）
- **数据隐私**：文案将通过加密连接发送至对接检测服务进行匹配，不在本地存储。如不希望外传，请提前告知
- **英文内容友好**：内置英文误匹配过滤，不会把正常英文单词中的片段误判为违禁词
- **网络容错**：内置自动重试机制，偶尔网络波动无需手动重试

---

> **完整执行规程**：调用脚本、格式化输出前，**必须先读取并严格遵循** [`references/core_workflow.md`](references/core_workflow.md) **全文**。

### 触发条件

满足以下任一即激活本 Skill：
- 用户提到「抖音违禁词」「抖音敏感词」「抖音审核」「限流词」「脚本合规」「口播文案合规」
- 用户要求检测抖音短视频脚本、直播话术、字幕文案、商品详情等内容安全性
- 用户上传文件/图片/链接并提到抖音相关的检测需求

### 执行铁律

1. **禁止编造结果** —— 仅以脚本返回 JSON 为准，不得臆造违禁词或替换建议
2. **禁止输出原始 JSON** —— 必须解析后填入输出模板
3. **禁止多余寒暄** —— 仅输出三个板块（🔍检测结果、💡修改建议、✏️优化文案），无开场白/结束语
4. **分批/字数超限必须暂停** —— 发出提示后立即停止，等待用户明确回复 1/2/3 后再继续
5. **图片仅限文字** —— 禁止获取图片的视觉风格、布局、色彩、人物等任何非文字信息
6. **必须交付文件** —— 三板块输出完成后，必须将纯文本优化文案写入 `./抖音_优化文案_{随机6位数字}.txt` 并以卡片形式发送给用户，禁止省略

### 执行流程

完整步骤、话术模板与切割规则详见 [`references/core_workflow.md`](references/core_workflow.md)，速览如下：

1. **识别输入类型** → 文本/文件(TXT/DOC/DOCX)/网页/图片，分别处理
2. **字数判断** → ≤3000 直接检测；3001~10000 暂停询问（1=单次/2=分批/3=取消）；>10000 中断
3. **调用脚本** → `python {skill_dir}/scripts/check_sensitive_words.py --content="..."` 或 `--file` 或 `--url`
4. **模板输出** → 按核心工作流三板块模板排版，违禁词用 `<span style="color:red">` 标红，替换词用 `<span style="color:blue">` 标蓝
5. **交付文件** → 写入 `./抖音_优化文案_{随机6位数字}.txt` 并发送文件卡片

#### 命令速查

| 输入形态 | 助手动作 |
|---|---|
| 纯文本 | 计算字数 → 字数闸门 → `--content="..."` → 三板块输出 → 写文件 |
| 上传 TXT/DOC/DOCX | `--file=path --extract-only` 查字数 → 按规则检测 → 三板块输出 → 写文件 |
| 上传图片 | 仅提取图中文字 → 计算字数 → `--content="提取文字"` → 三板块输出 → 写文件 |
| 粘贴 `https://...` | `--url=... --extract-only` 查字数 → 按规则检测 → 三板块输出 → 写文件 |
| 超长文案 | 发出询问语，**收到 1/2/3 后再继续** |

`--content`、`--file`、`--url` 三者互斥。平台已硬编码为抖音。

#### 异常处理

| 异常场景 | 用户话术 |
|---|---|
| 文件/网页提取失败 | 「内容提取失败，请检查文件格式或网址是否可访问」 |
| PDF 文件 | 「不支持 PDF 文件，请转为图片或文本文件后重新上传」 |
| API 超时或网络异常 | 「检测服务暂时不可用，已自动重试仍失败，请稍后重试」 |
| API 返回业务错误（code≠2000） | 「检测服务返回异常，请稍后重试」 |
| 未配置检测接口 | 「检测接口未配置，请设置 DY_SENSITIVE_WORD_API_URL 或使用 --api-url 参数」 |
| 依赖缺失（python-docx/playwright 等） | 提示用户安装对应依赖后重试 |