# 敏感词库和检查规则

## 概述
本文档列出了体制内文档中需要避免或谨慎使用的敏感词和表达方式，确保文档内容符合相关政策和规定。

## 敏感词分类

### 1. 政治敏感词

#### 1.1 绝对禁止使用
- 涉及国家主权和领土完整的错误表述
- 否定党的领导、社会主义制度的言论
- 攻击党和国家领导人的言论
- 宣扬分裂国家、破坏民族团结的言论

#### 1.2 谨慎使用
- 涉及重大政治事件的表述
- 涉及敏感历史时期的表述
- 涉及重要政治人物的评价
- 涉及重大政策调整的预测

### 2. 保密相关词

#### 2.1 涉密信息
- 国家秘密、军事秘密
- 商业秘密、技术秘密
- 个人隐私信息
- 未公开的内部决策

#### 2.2 敏感数据
- 未公开的经济数据
- 未公开的人口数据
- 未公开的军事数据
- 未公开的外交数据

### 3. 组织内部敏感词

#### 3.1 内部事务
- 未公开的人事任免
- 未公开的机构调整
- 未公开的工作失误
- 未公开的内部矛盾

#### 3.2 敏感话题
- 涉及重大责任事故
- 涉及群体性事件
- 涉及重大经济损失
- 涉及重大安全事故

### 4. 社会敏感词

#### 4.1 社会矛盾
- 涉及贫富差距的极端表述
- 涉及社会不公的煽动性言论
- 涉及民族宗教的敏感话题
- 涉及地域歧视的表述

#### 4.2 网络敏感词
- 网络流行语中的敏感词汇
- 网络谣言相关表述
- 网络暴力相关表述
- 网络诈骗相关表述

## 具体敏感词列表

### 1. 政治类敏感词
```
# 绝对禁止
台独、藏独、疆独、港独
法轮功、全能神
六四、八九
文革、大跃进
反党、反社会主义
攻击领导人姓名[具体姓名]

# 谨慎使用
政治体制改革
民主化进程
言论自由限制
网络管控
```

### 2. 经济类敏感词
```
# 绝对禁止
经济崩溃
金融危机爆发
大规模失业
通货膨胀失控

# 谨慎使用
经济增长放缓
房地产市场调整
股市波动
债务风险
```

### 3. 社会类敏感词
```
# 绝对禁止
群体性事件具体描述
暴力冲突细节
社会动荡预测
政府失能表述

# 谨慎使用
贫富差距扩大
社会保障不足
教育资源不均
医疗资源紧张
```

### 4. 外交类敏感词
```
# 绝对禁止
领土主权争议具体表述
军事冲突预测
外交关系破裂
国际制裁具体内容

# 谨慎使用
贸易摩擦
外交压力
国际舆论
多边合作挑战
```

## 检查规则

### 1. 绝对禁止规则
1. **立即替换**：发现绝对禁止词立即替换为规范表述
2. **内容删除**：涉及敏感话题的内容应删除或重写
3. **报告机制**：发现重大敏感问题应及时报告

### 2. 谨慎使用规则
1. **语境分析**：分析词汇使用的具体语境
2. **风险评估**：评估使用该词汇的风险等级
3. **替代方案**：提供更稳妥的表述方式
4. **审批流程**：重要文档需经审批后使用

### 3. 模糊处理规则
1. **数据脱敏**：敏感数据应进行脱敏处理
2. **概括表述**：敏感话题应概括表述
3. **正面引导**：负面话题应转向正面引导
4. **建设性建议**：问题应转为建设性建议

## 检查流程

### 1. 自动检查
```
流程：
1. 加载敏感词库
2. 扫描文档内容
3. 标记敏感词汇
4. 生成检查报告
5. 提供修改建议
```

### 2. 人工审核
```
流程：
1. 查看自动检查结果
2. 分析语境和风险
3. 判断是否需要修改
4. 确定修改方案
5. 记录审核意见
```

### 3. 多级审核
```
流程：
1. 起草人自查
2. 部门负责人审核
3. 分管领导审批
4. 主要领导审定
5. 最终发布
```

## 修改建议

### 1. 直接替换
```
原词：问题严重
替换：需要进一步改进

原词：效果很差
替换：效果有待提升

原词：意见很大
替换：存在不同看法
```

### 2. 模糊处理
```
原句：失业率达到8%
处理：就业形势面临一定压力

原句：上访人数增加
处理：群众诉求有所增多

原句：亏损严重
处理：经营效益需要提升
```

### 3. 正面引导
```
原句：问题很多
引导：工作中还存在一些需要改进的方面

原句：矛盾突出
引导：需要进一步加强沟通协调

原句：困难很大
引导：面临一些挑战需要克服
```

## 检查工具使用

### 1. 命令行工具
```bash
# 检查文本文件
python scripts/sensitive_words_check.py --file document.txt

# 检查字符串
python scripts/sensitive_words_check.py --text "需要检查的文本内容"

# 批量检查目录
python scripts/sensitive_words_check.py --directory ./documents
```

### 2. 参数选项
```
--file: 指定要检查的文件
--text: 直接检查文本内容
--directory: 检查目录下所有文件
--output: 指定输出报告文件
--level: 设置检查级别（strict/normal/lenient）
--category: 指定检查类别（all/political/economic/social）
```

### 3. 输出格式
```
检查报告示例：
========================================
敏感词检查报告
文档：example.docx
检查时间：2026-03-28 13:30:00
========================================

检查结果：
1. 发现绝对禁止词：0个
2. 发现谨慎使用词：3个
3. 建议修改内容：2处

详细结果：
1. [谨慎] 第15行："经济增长放缓"
   建议修改为："经济发展稳中向好"

2. [谨慎] 第28行："面临一定压力"
   建议修改为："需要进一步努力"

3. [建议] 第42行：数据表述不够精确
   建议补充具体数据支撑

========================================
检查完成，请根据建议修改文档。
```

## 培训和教育

### 1. 培训内容
1. 敏感词识别和判断
2. 风险等级评估方法
3. 修改技巧和策略
4. 案例分析和练习

### 2. 培训对象
1. 文档起草人员
2. 内容审核人员
3. 部门负责人
4. 相关工作人员

### 3. 培训频率
1. 新员工入职培训
2. 年度定期培训
3. 专题培训（如政策调整后）
4. 案例分享会

## 更新和维护

### 1. 更新机制
1. **定期更新**：每季度更新一次词库
2. **临时更新**：政策调整后及时更新
3. **用户反馈**：根据用户建议更新
4. **自动学习**：系统自动学习新词

### 2. 维护责任
1. **管理员**：负责词库维护和更新
2. **审核员**：负责检查规则优化
3. **用户**：负责反馈问题和建议
4. **技术员**：负责系统维护和升级

### 3. 版本管理
```
版本号：v1.0.0
更新日期：2026-03-28
更新内容：
1. 初始词库建立
2. 基本检查规则制定
3. 检查工具开发

版本号：v1.0.1
更新日期：2026-04-30（计划）
更新内容：
1. 根据用户反馈优化词库
2. 完善检查规则
3. 优化检查工具性能
```

## 注意事项

### 1. 使用原则
1. **安全第一**：确保内容安全合规
2. **实事求是**：在安全前提下如实反映情况
3. **建设性**：以建设性态度提出问题
4. **专业性**：保持专业性和客观性

### 2. 避免问题
1. **过度敏感**：避免因过度敏感影响正常表达
2. **形式主义**：避免只注重形式不注重内容
3. **一刀切**：避免不考虑语境的一刀切处理
4. **忽视实质**：避免只改词不改实质内容

### 3. 最佳实践
1. **提前预防**：起草时注意避免敏感词
2. **多层检查**：建立多级检查机制
3. **持续学习**：持续学习政策法规
4. **交流分享**：定期交流经验和案例