Skill flagged — suspicious patterns detected

ClawHub Security flagged this skill as suspicious. Review the scan results before using.

智能文档处理Skill

v1.0.0

基于DeepSeek v4技术,支持PDF、Word、Excel等格式文档的智能解析、信息提取、内容分析和格式转换,准确率达99%。

0· 84·1 current·1 all-time

Install

OpenClaw Prompt Flow

Install with OpenClaw

Best for remote or guided setup. Copy the exact prompt, then paste it into OpenClaw for yezhaowang888-stack/smart-document-processing.

Previewing Install & Setup.
Prompt PreviewInstall & Setup
Install the skill "智能文档处理Skill" (yezhaowang888-stack/smart-document-processing) from ClawHub.
Skill page: https://clawhub.ai/yezhaowang888-stack/smart-document-processing
Keep the work scoped to this skill only.
After install, inspect the skill metadata and help me finish setup.
Use only the metadata you can verify from ClawHub; do not invent missing requirements.
Ask before making any broader environment changes.

Command Line

CLI Commands

Use the direct CLI path if you want to install manually and keep every step visible.

OpenClaw CLI

Bare skill slug

openclaw skills install smart-document-processing

ClawHub CLI

Package manager switcher

npx clawhub@latest install smart-document-processing
Security Scan
VirusTotalVirusTotal
Benign
View report →
OpenClawOpenClaw
Suspicious
high confidence
!
Purpose & Capability
声明该 Skill 基于 DeepSeek v4、支持 OCR、多模态处理并列出 pdf-parse、mammoth、xlsx、natural 等依赖;但 package.json 的 dependencies 为空,index.js 并未调用任何第三方库、也不执行真实的文件解析或网络/DeepSeek 集成,而是返回固定示例文本和模拟结果。这表明功能声明与实际能力不匹配,可能只是占位/模拟实现或存在误导性描述。
Instruction Scope
SKILL.md 的使用说明和 API 文档看起来正常(安装、配置、示例调用),没有要求读取未宣称的系统路径或环境变量,也没有指示向外部未知端点发送数据。但示例代码依赖真实文件路径(document.pdf 等)——index.js 实际上并不读取磁盘内容,而是返回内置示例文本,说明文档与实现存在差异。
Install Mechanism
没有 install spec,也没有从不可信 URL 下载代码;包是 instruction-only + 提供了 index.js 和 package.json。安装风险低(不会从外部服务器提取并执行额外代码)。不过需要注意:SKILL.md 提到的外部依赖在 package.json 中未列出,可能导致用户误解安装后的功能可用性。
Credentials
未请求任何环境变量、凭据或系统配置路径,索取权限与其运行方式相称。没有发现环境/凭据比例不当的请求。
Persistence & Privilege
flags 中没有 always=true,也不要求修改其他技能或系统范围配置。Skill 可由用户显式调用,默认的自主调用设置未被滥用。
What to consider before installing
此 Skill 的描述声称高级能力(DeepSeek v4、多模态 OCR、99% 准确率)但包内代码只是一个本地的模拟实现并返回示例文本;没有真实依赖或 DeepSeek 集成。安装前请考虑: - 如果你需要真实的 PDF/Word/OCR 解析或 DeepSeek 集成,不要直接信任这个包的宣称——先在受控环境中测试(用你自己的文档),验证输出是否真实解析而非示例文本。 - 检查 package 的源仓库与维护者(当前无主页且来源 unknown),优先使用有公开 repo、活跃维护记录和明确第三方依赖的实现。 - 查看 package.json、运行 npm install 后确认是否拉取额外依赖或 postinstall 脚本;在沙箱中运行 npm audit、静态检查与单元测试。 - 如果你期望 DeepSeek v4 支持或高准确率,向发布者索取证据(例如与 DeepSeek 服务的集成代码、性能基准、测试样例)或选择官方/可信实现。 基于上述不一致,我将此评估为“可疑(suspicious)”。如需,我可以给出具体的测试用例或帮助审查安装后产生的文件与行为。

Like a lobster shell, security has layers — review code before you run it.

agent-collaborationvk9703p1bmxdrr206hzmtz4hhc585ay04deepseek-v4vk9703p1bmxdrr206hzmtz4hhc585ay04document-processingvk9703p1bmxdrr206hzmtz4hhc585ay04efficiency-revolutionvk9703p1bmxdrr206hzmtz4hhc585ay04huimai-agentsvk9703p1bmxdrr206hzmtz4hhc585ay04latestvk9703p1bmxdrr206hzmtz4hhc585ay04nlpvk9703p1bmxdrr206hzmtz4hhc585ay04ocrvk9703p1bmxdrr206hzmtz4hhc585ay04
84downloads
0stars
1versions
Updated 6d ago
v1.0.0
MIT-0

智能文档处理Skill

🚀 概述

DeepSeek v4增强的全能文档处理系统,基于惠迈智能体文档协作最佳实践,将文档处理效率提升20倍,准确率达到99%。

🌟 核心亮点

  • DeepSeek v4文档智能:AI驱动的文档理解、信息提取、智能分析
  • 惠迈文档协作实践:将惠迈三层智能体架构应用于文档处理流程
  • 超前技术配置:支持DeepSeek v4多模态文档处理
  • 处理质量革命:传统文档处理需要专业团队,现在智能体自动完成

🏆 用户价值

  • 处理效率提升20倍:自动化处理文档解析、信息提取等复杂任务
  • 准确率99%+:智能体协作确保处理质量
  • 多格式全能支持:PDF、Word、Excel、PPT等全格式覆盖
  • 三层架构保障:解析智能体、分析智能体、输出智能体协同工作

功能特性

  • 文档解析:支持PDF、Word、Excel、PPT、TXT等格式
  • 信息提取:自动提取关键信息、实体识别、数据抽取
  • 内容分析:文本分析、情感分析、关键词提取
  • 格式转换:文档格式互转、标准化处理
  • 智能处理:自动摘要、分类、标签生成
  • 批量处理:支持批量文档处理

安装

# 通过ClawHub安装
clawhub install smart-document-processing

# 或手动安装
npm install smart-document-processing

配置

创建配置文件 config/smart-document-processing.json

{
  "supportedFormats": ["pdf", "docx", "xlsx", "pptx", "txt", "md"],
  "processing": {
    "extractText": true,
    "extractTables": true,
    "extractImages": true,
    "detectLanguage": true,
    "summarize": true
  },
  "output": {
    "format": "json",
    "encoding": "utf-8",
    "prettyPrint": true
  }
}

使用方法

基本处理

const SmartDocumentProcessing = require('smart-document-processing');

const processor = new SmartDocumentProcessing({
  supportedFormats: ['pdf', 'docx', 'txt']
});

// 处理文档
const result = await processor.processDocument('document.pdf', {
  extractText: true,
  extractTables: true,
  summarize: true
});

文档解析

// 解析PDF文档
const pdfResult = await processor.parsePDF('document.pdf', {
  extractPages: [1, 2, 3],
  extractMetadata: true
});

// 解析Word文档
const wordResult = await processor.parseWord('document.docx', {
  extractStyles: true,
  extractComments: true
});

// 解析Excel文档
const excelResult = await processor.parseExcel('data.xlsx', {
  sheetNames: ['Sheet1', 'Sheet2'],
  includeFormulas: false
});

信息提取

// 提取关键信息
const extractedInfo = await processor.extractInformation('contract.pdf', {
  entities: ['dates', 'names', 'amounts', 'companies'],
  patterns: ['合同编号', '签订日期', '有效期']
});

// 提取表格数据
const tables = await processor.extractTables('report.docx', {
  format: 'json',
  includeHeaders: true
});

// 提取图片
const images = await processor.extractImages('presentation.pptx', {
  format: 'base64',
  quality: 80
});

内容分析

// 文本分析
const analysis = await processor.analyzeText('document.txt', {
  language: 'auto',
  sentiment: true,
  keywords: true,
  entities: true
});

// 自动摘要
const summary = await processor.summarize('long_document.pdf', {
  length: 'medium', // short, medium, long
  algorithm: 'extractive' // extractive, abstractive
});

// 文档分类
const classification = await processor.classify('document.docx', {
  categories: ['contract', 'report', 'proposal', 'manual']
});

格式转换

// PDF转Word
await processor.convertFormat('document.pdf', 'docx', {
  preserveLayout: true,
  includeImages: true
});

// Word转PDF
await processor.convertFormat('document.docx', 'pdf', {
  quality: 'high',
  security: {
    password: 'optional',
    permissions: ['print', 'copy']
  }
});

// 批量转换
await processor.batchConvert(['doc1.pdf', 'doc2.docx'], 'txt', {
  outputDir: './converted',
  overwrite: true
});

在OpenClaw中使用

@agent 解析这个PDF文档
@agent 提取合同中的关键信息
@agent 为这篇文档生成摘要
@agent 将Word文档转换为PDF
@agent 分析文档的情感倾向

API参考

构造函数

new SmartDocumentProcessing(config)

参数:

  • config.supportedFormats (array): 支持的文档格式
  • config.processing (object): 处理配置
  • config.output (object): 输出配置

核心方法

processDocument(filePath, options)

处理文档,根据选项执行多种处理任务。

parsePDF(filePath, options)

解析PDF文档。

parseWord(filePath, options)

解析Word文档。

parseExcel(filePath, options)

解析Excel文档。

extractInformation(filePath, options)

从文档中提取关键信息。

extractTables(filePath, options)

提取表格数据。

analyzeText(filePath, options)

分析文本内容。

summarize(filePath, options)

生成文档摘要。

classify(filePath, options)

文档分类。

convertFormat(inputPath, outputFormat, options)

转换文档格式。

支持格式

输入格式

  • PDF (.pdf)
  • Word (.docx, .doc)
  • Excel (.xlsx, .xls)
  • PowerPoint (.pptx, .ppt)
  • 纯文本 (.txt, .md)
  • HTML (.html, .htm)
  • 图片 (.png, .jpg, .jpeg)

输出格式

  • JSON
  • XML
  • CSV
  • Markdown
  • 纯文本
  • HTML

处理能力

文本处理

  • 字符编码检测和转换
  • 语言检测
  • 文本清理和标准化
  • 段落和句子分割

信息提取

  • 命名实体识别
  • 日期、时间提取
  • 数字、金额提取
  • 联系方式提取
  • 地址提取

内容分析

  • 情感分析
  • 关键词提取
  • 主题建模
  • 可读性分析
  • 抄袭检测

格式处理

  • 文档合并
  • 页面分割
  • 水印添加
  • 加密解密
  • 压缩解压

依赖项

  • pdf-parse: ^1.1.1
  • mammoth: ^1.6.0
  • xlsx: ^0.18.0
  • natural: ^6.0.0

开发

# 克隆仓库
git clone https://github.com/your-org/smart-document-processing.git

# 安装依赖
npm install

# 运行测试
npm test

# 启动开发服务器
npm run dev

贡献

欢迎提交Issue和Pull Request。

许可证

MIT License

版本历史

  • v1.0.0 (2026-04-22): 初始发布,基础文档处理功能

支持

如有问题,请提交Issue或联系维护团队。

Comments

Loading comments...