# 快速开始

**适用场景**: 已安装查重系统，开始第一次查重操作

---

## 一、理解查重类型

### 两种查重模式

**纵向查重**：
- 目的：检查待查文件是否复制比对库内容
- 适用：论文查重、作业查重、文档查重
- 要求：需要先添加比对库

**横向查重**：
- 目的：检查批次文件之间是否互相复制
- 适用：防串标、批次审核
- 要求：选择一批待查文件即可

### 选择查重模式

**AI执行说明**: AI将根据你的需求推荐模式

```
场景判断：
- "检查这篇论文是否抄袭" → 纵向查重
- "检查这些标书是否串标" → 横向查重
- "检查学生作业互相抄袭" → 横向查重
- "检查文件是否重复提交" → 横向查重
```

---

## 二、纵向查重操作

### 前提条件

**必须先添加比对库**：
- 比对库是查重的基准文件集合
- 添加比对库后才能进行纵向查重
- 不添加比对库，查重结果永远是0

### 步骤1: 准备比对库文件

**AI执行说明**: AI将指导准备比对库

```
准备比对库：
1. 收集历史论文、文档
2. 组织到一个文件夹
3. 支持格式：PDF、Word、文本文件
```

**注意事项**：
- 文件名最好唯一（避免与待查文件同名）
- 文件内容应为简体中文
- 文件大小适中（避免超大文件）

### 步骤2: 添加到比对库

**AI执行说明**: AI将指导添加操作

```
操作步骤：
1. 启动paper_checking.exe
2. 切换到"比对库管理"选项卡
3. 点击"添加到比对库"按钮
4. 选择存放文件的文件夹
5. 等待添加完成（按钮恢复正常）
```

**添加时间**：
- 小规模库（几百文件）：几分钟
- 大规模库（几千文件）：十几分钟
- 一亿字次级库：需较长时间

### 步骤3: 选择待查文件

```
操作步骤：
1. 切换到"纵向查重"选项卡
2. 点击"选择待查文件"
3. 选择要查重的文件
4. 可选择多个文件批量查重
```

### 步骤4: 设置查重参数

**AI执行说明**: AI将推荐合适的参数

```
参数设置：
- 查重阈值：推荐10-16（连续多少字相同判定为抄袭）
  - 阈值越小：越严格，更多判定为抄袭
  - 阈值越大：越宽松，较少判定为抄袭

- 保存查重报告的文件夹：选择报告输出位置

- 生成统计表：勾选可生成csv统计表

- 查重进程数：默认CPU核心数-2

- 格式转换线程数：默认CPU核心数-2
```

### 步骤5: 开始查重

```
操作步骤：
1. 点击"开始查重"按钮
2. 观察进度条
3. 等待查重完成
```

**查重速度**：
- 一亿字次级库：秒级查重
- 大批量文件：根据进程数调整

### 步骤6: 查看查重报告

```
报告内容：
- 重复率百分比
- 重复字数
- 重复段落标注
- 重复来源文件名

报告格式：
- rtf格式（可用Word打开）
- csv统计表（可选）
```

---

## 三、横向查重操作

### 适用场景

- 检查标书是否串标
- 检查学生作业互相抄袭
- 检查批次文件互相复制

### 步骤1: 选择待查文件

```
操作步骤：
1. 切换到"横向查重"选项卡
2. 点击"选择待查文件"
3. 选择一批待查文件
```

### 步骤2: 设置参数

```
参数设置：
- 查重阈值：推荐10-16
- 其他参数同纵向查重
```

### 步骤3: 开始查重

```
操作步骤：
1. 点击"开始查重"
2. 系统在批次文件间互相比对
3. 查重完成生成报告
```

### 步骤4: 分析结果

**AI执行说明**: AI将分析查重结果

```
横向查重结果分析：
- 高重复率文件对：可能互相抄袭
- 重复段落对比：具体抄袭内容
- 重复率排序：优先查看高重复率文件
```

---

## 四、查重报告解读

### 报告关键信息

**AI执行说明**: AI将解读查重报告

```
报告关键指标：
1. 重复率（百分比）
   - 0-5%：正常引用范围
   - 5-30%：需要关注
   - 30%+：可能抄袭

2. 重复字数
   - 30字以下：不计入重复
   - 单篇0.25%以下：不计入重复

3. 重复来源
   - 显示哪些比对库文件
   - 标注具体重复段落
```

### 报告注意事项

```
注意：
- 相同文件查重不会100%（文本预处理）
- 单篇文本重复率<0.25%不计入
- 重复字数<30字不计入
- 多次复制只计一次重复
```

---

## 五、查重阈值选择建议

**AI执行说明**: AI将根据场景推荐阈值

```
场景推荐阈值：
- 学术论文查重：10-13（严格）
- 标书查重防串标：13-16（中等）
- 学生作业查重：15-20（宽松）
- 企业文档查重：12-15（平衡）
```

---

## 六、常见误区

### 误区1: 不添加比对库直接查重

**问题**: 查重结果永远是0

**原因**: 纵向查重需要比对库

**解决**: 先添加比对库，再查重

### 误区2: 直接复制文件到比对库文件夹

**问题**: 文件不生效

**原因**: 必须通过"添加到比对库"按钮添加

**解决**: 使用软件界面添加，不要直接复制文件

### 误区3: 待查文件在比对库中

**问题**: 重复率可能高于90%

**原因**: 文件名相同会跳过，不同名会查重

**解决**: 待查文件名应与比对库文件名不同

---

## 七、中断恢复

### 适用场景

查重意外中断（程序退出、系统崩溃）

### 操作步骤

```
中断恢复：
1. 重新启动paper_checking.exe
2. 选择"中断恢复"复选框
3. 设置相同参数
4. 点击"开始查重"
5. 系统从上次进度继续
```

---

## 完成确认

### 检查清单
- [ ] 理解纵向查重和横向查重区别
- [ ] 成功添加比对库（纵向查重）
- [ ] 成功执行第一次查重
- [ ] 能解读查重报告
- [ ] 知道常见误区和解决方法

### 下一步
继续阅读 [高级用法](03-advanced-usage.md) 学习关键词过滤、进程优化等高级功能