会议纪要生成器
智能会议录音转文字文档整理工具,通过四轮严格处理确保信息100%不遗漏且字数至少2000字,将非结构化的原始记录转换为规范、详细、完整的结构化会议纪要。
核心能力
- PDF/Word 文档解析
- AI 智能提取会议信息(时间、地点、参与者、主持人)
- 100%信息完整性保证 - 通过逐句校验确保不遗漏任何信息
- 至少2000字保证 - 强制字数要求,不足时自动补充扩展
- 四轮严格处理流程(提取、校验、补充、终审)
- 按议题组织讨论内容
- 自动识别和验证公司名称
- 支持输出 PDF 或 Word 格式
工作流程
阶段 1:接收输入
接受以下格式的文件:
- PDF 文档(.pdf)
- Word 文档(.docx)
阶段 2:文档解析
使用 extract_pdfs_full_content 提取 PDF 内容,或直接读取 Word 文档获取原始文本。
阶段 3:AI 智能处理
使用 DeepSeek API 进行严格的四轮处理,确保信息完整性和字数要求:
-
第一轮:结构化提取 - 完整提取所有信息点
请基于材料内容识别和归纳主要议题,每个议题按以下格式组织:
议题1:[主题名称]
· 要点1
· 要点2
· 要点3
议题2:[主题名称]
· 要点1
· 要点2
· 要点3
(依此类推,根据原文内容展开更多议题)
强制性要求(必须严格遵守):
- 严格按照上述结构和格式输出
- 必须逐句、逐段分析原文,确保完整覆盖原始材料中的所有讨论点,不遗漏任何信息
- 基于材料内容合理识别和分组议题,确保每个议题主题明确
- 只输出会议纪要内容,不要任何说明或解释
- 严格基于材料内容,不添加额外信息
- 纪要总字数必须达到或超过2000字。如果信息不足,需对要点进行详细展开,但不得添加虚假信息
- 不要生成"会议背景"相关描述(如"会议于XX时间开始"、"石老师安排录音"等),只保留结构化内容
- 每个要点前用"· "排版
- 输出时必须包含字数统计:[本次生成字数:XXX字]
-
第二轮:逐句校验对比 - 确保零信息遗漏
逐句、逐细节对比原文与结构化提取的内容,进行精确校验:
校验要求:
-
创建原文和提取内容的对应映射表,确保每个原文段落都有对应的纪要内容
-
重点核查以下信息是否全部保留:
- 所有发言人表述是否完整
- 所有关键数字、时间、责任人是否无遗漏
- 所有争议点、不同意见是否全部记录
- 所有待定事项、行动项是否完整
- 所有方案细节、技术参数是否无缺失
- 所有决策结论是否明确记录
-
统计信息覆盖率:
- 原文信息点总数:XXX
- 提取信息点总数:XXX
- 遗漏信息点:XXX
- 覆盖率:XXX%
-
校验通过标准:必须达到100%信息覆盖率,遗漏信息点必须为0
-
第三轮:强制补充完善 - 修复所有遗漏
根据校验报告中的遗漏信息,对会议纪要进行全面补充:
补充要求:
- 必须逐条补充所有遗漏的信息点
- 必须修正所有语义偏差
- 保持原有的层次结构和格式
- 不要添加原文未涉及的内容
- 补充后重新计算字数,确保仍满足2000字要求
- 输出补充后的完整纪要,并标注补充内容
-
第四轮:字数验证和质量终审 - 确保最终质量
对补充完善后的纪要进行最终验证:
终审要求:
-
字数强制验证:统计最终字数,必须达到或超过2000字
- 如果字数不足,必须分析原因并补充细节,但不得重复内容
- 可对已有要点进行合理扩展,增加具体描述和上下文
-
信息完整性终审:再次对照原文,确认所有信息都已包含
-
格式规范检查:确保符合输出格式要求
-
输出最终合格纪要:附带验证报告:
- 最终总字数:XXX字(必须≥2000)
- 信息覆盖率:100%(必须达标)
- 校验状态:通过/不通过
阶段 4:输出交付
根据用户需求输出 PDF 或 Word 格式的规范会议纪要。要求排版美观
详细用法示例
示例 1:上传 PDF 文件整理
用户:请帮我整理这份会议记录,生成会议纪要
[附上 meeting_audio.pdf]
AI 处理流程:
- 解析 PDF 文件内容
- 提取会议日期(从文件名或内容)
- 识别参与人员和讨论议题
- 生成结构化纪要
- 校验完善确保完整
- 输出 PDF 格式会议纪要
示例 2:处理 Word 文档
用户:这是我们部门月度会议的文字记录,帮我整理成规范的会议纪要
[附上 monthly_meeting.docx]
AI 处理流程:
- 读取 Word 文档
- 识别会议类型和核心议题
- 按议题分组讨论内容
- 提取决策事项和待办
- 生成规范格式纪要
示例 3:提取会议要点
用户:帮我从这份会议记录中提取关键要点和待办事项
[附上 project_review.pdf]
AI 处理流程:
- 解析文档
- 识别决策事项和待办
- 提取关键结论
- 输出要点摘要
示例 4:批量整理
用户:我有5份会议录音转文字的文档,能帮我都整理成会议纪要吗?
[附上多个文件]
AI 处理流程: 逐一处理每个文档,生成对应的规范纪要。
输出格式
生成的会议纪要包含以下结构:
[来源/类型] 关于 [核心议题] 的讨论纪要
一、会议基本信息
1. 会议时间:YYYY年MM月DD日
2. 会议地点:XXX(如无写"未明确")
3. 参与人员:列出核心发言方、机构及职务
4. 主持人:XXX(如无写"未明确")
二、讨论内容
议题1:[主题名称]
· 要点1
· 要点2
· 要点3
议题2:[主题名称]
· 要点1
· 要点2
· 要点3
格式选择
| 格式 | 适用场景 | 特点 |
|---|
| PDF | 正式存档、存档留底 | 楷体、1.5倍行距、规范排版,字体大小(主标题:18;章节标题:14;正文:12) |
| Word | 需要后续编辑修改 | 便于修改、可直接使用 ,字体大小(主标题:18;章节标题:14;正文:12) |
配置参数
| 参数 | 说明 | 默认值 |
|---|
output_format | 输出格式 | pdf |
processing_rounds | 处理轮次(1-4轮) | 4 |
min_word_count | 最少字数要求 | 2000 |
require_100_percent_coverage | 要求100%信息覆盖率 | true |
enable_final_validation | 启用最终验证 | true |
使用技巧
获取最佳效果
- 上传录音转文字的原始文档(未经整理的版本效果更佳)
- 文件名包含日期信息(如
会议记录_20240315.pdf)
- 包含清晰的发言人信息(有助于识别观点来源)
- 指明输出格式偏好(PDF 或 Word)
- 如需保证信息完整性和详细程度:系统默认确保100%信息覆盖和至少2000字,如需调整可在请求中说明
常见需求表达
- "帮我整理成会议纪要" → 生成完整规范纪要(默认100%信息覆盖+2000字)
- "提取关键要点" → 输出精简要点摘要
- "整理成Word格式" → 输出可编辑的 Word 文档
- "帮我检查有没有遗漏" → 进行二次校验
- "保证不遗漏任何信息" → 启用严格校验模式
- "纪要要详细,至少2000字" → 强制字数达标处理
- "既要完整又要详细" → 同时启用信息完整性和字数保证
注意事项
- 输入要求:上传录音转文字的原始文档效果最佳
- 信息验证:可帮助纠正语音转文字时的公司名称错误
- 信息完整性保证:通过四轮严格处理确保100%信息覆盖率,不遗漏任何信息
- 字数保证:强制要求至少2000字,通过多轮验证和补充确保字数达标
- 质量保证:通过逐句校验、强制补充、最终验证三重质量检查
- 格式规范:输出为标准会议纪要格式,无 Markdown 符号
参考资料
详细实现逻辑见 references/ 目录:
ai-prompts.md - AI 处理提示词模板
format-specs.md - 输出格式规范