Install
openclaw skills install sensitive-content-scanner专业的敏感内容扫描器,支持 PII 检测(身份证/手机号/银行卡/邮箱/IP)、敏感词检测、置信度评分、多格式报告生成。适用于文档审查、安全审计、内容合规检查、隐私保护等场景。
openclaw skills install sensitive-content-scanner帮您检查文档中是否有敏感内容(身份证、手机号、密码等)或违禁词。
办公室文员、行政人员、文档审核人员 —— 无需技术背景
操作:
.docx、.txt、.pdf)示例:
用户:帮我扫描这份文档 [附件:年度报告.docx]
会检测:
操作:
示例:
用户:扫描这份文档,检查这些词:密码、密钥、机密、内部 [附件:技术文档.docx]
支持的表达:
"检查这些词:密码、密钥""扫描并检查:机密、绝密""用关键词 密码 密钥 机密 扫描"操作:
数据字典格式(CSV):
| 关键词 | 权重分 | 类别 |
|---|---|---|
| 密码 | 10 | 技术敏感词 |
| 密钥 | 10 | 技术敏感词 |
| 机密 | 8 | 密级 |
| 内部 | 5 | 内部信息 |
示例:
用户:用数据字典扫描这份文档 [附件1:项目文档.docx] [附件2:敏感词字典.csv]
扫描完成后,会生成 HTML 格式报告(浏览器直接打开查看):
| 结果 | 含义 | 建议 |
|---|---|---|
| ✅ 安全(绿色) | 未发现敏感内容 | 可以放心使用 |
| ⚠️ 低风险(浅绿) | 发现轻微问题 | 可选处理或忽略 |
| ⚠️ 中风险(黄色) | 发现少量敏感内容 | 建议人工复核 |
| 🚨 高风险(红色) | 发现严重敏感内容 | 需要立即处理 |
报告特性:
也可通过
-f markdown输出 Markdown 格式。
如果您需要自定义数据字典,可以下载这个模板:
文件名:敏感词字典模板.csv
内容格式:
关键词,权重分,类别
密码,10,技术敏感词
密钥,10,技术敏感词
机密,8,密级
绝密,10,密级
内部,5,内部信息
公司名,5,商业信息
权重分说明:
| 类型 | 格式 | 支持情况 |
|---|---|---|
| Word 文档 | .docx | ✅ 完全支持 |
| 纯文本 | .txt | ✅ 完全支持 |
| Markdown | .md | ✅ 完全支持 |
| Excel | .xlsx | ✅ 完全支持 |
| ⚠️ 文本型支持,扫描版不支持 |
Q: 扫描需要多久? A: 一般文档几秒钟,大文档(100页以上)可能需要1-2分钟。
Q: 我的文档会被保存吗? A: 不会。扫描过程在本地完成,不会上传您的文档。
Q: 扫描结果保存在哪里?
A: 默认生成 report.html,浏览器直接打开即可查看精美报告。
Q: 可以输出其他格式吗?
A: 可以。-f html(默认,推荐)、-f markdown、-f json。
Q: 什么是权重分? A: 权重分表示敏感词的严重程度。分数越高,越需要关注。
用户操作指南.md 获取更详细的使用说明扫描脚本:scripts/scan_sensitive.py
命令行参考(如有需要):
# 快速扫描
python3 scan_sensitive.py 文档.docx
# 自定义关键词
python3 scan_sensitive.py 文档.docx -k "密码" -k "密钥"
# 使用数据字典
python3 scan_sensitive.py 文档.docx --dict-csv 敏感词字典.csv
版本:3.1.2 更新日期:2026-04-21