Skill flagged — suspicious patterns detected

ClawHub Security flagged this skill as suspicious. Review the scan results before using.

ynu-papergraphgeneration-openclaw

v1.0.0

多模态论文可视化引擎 — 从 PDF 或纯文本论文自动生成学术插图。 支持:全篇扫描识别可图化内容、双编码器架构图/算法流程图/动机图生成、 自校核机制、LaTeX/Word 图注输出、Matplotlib 结果图精确绘图。 也包含独立的 PDF → Text 提取工具。

0· 107· 1 versions· 0 current· 0 all-time· Updated 2w ago· MIT-0

paper-diagram-skill

从论文(PDF 或纯文本)自动生成学术插图的完整工具链。

工具概览

工具功能调用方式
draw.py论文可视化主流程python draw.py [args]
pdf_to_text.pyPDF → 纯文本提取python pdf_to_text.py [args]

工具 1:PDF → Text 提取

将 PDF 文件转换为纯文本,供 draw.py 使用。

# 基本用法
python {baseDir}/scripts/pdf_to_text.py "/path/to/paper.pdf"

# 限制页数(取前 20 页)
python {baseDir}/scripts/pdf_to_text.py "/path/to/paper.pdf" --max-pages 20

# 输出到文件
python {baseDir}/scripts/pdf_to_text.py "/path/to/paper.pdf" -o extracted.txt

支持的后端(自动选择): pdfminer.six → PyMuPDF → pdfplumber → PyPDF2 → pypdf

注意:推荐先安装 pip install pdfminer.six,提取质量最高。


工具 2:论文图生成

快速开始

# 方式 A:从 PDF 直接生成(自动提取 + 画图)
python {baseDir}/scripts/draw.py \
  --pdf-path "/path/to/paper.pdf" \
  --user-requirement "Transformer 架构图" \
  --api-url "https://api.example.com/generate" \
  --api-key "sk-your-key"

# 方式 B:扫描模式(自动识别所有可图化内容)
python {baseDir}/scripts/draw.py \
  --pdf-path "/path/to/paper.pdf" \
  --mode scan

# 方式 C:批量生成(选定的图)
python {baseDir}/scripts/draw.py \
  --pdf-path "/path/to/paper.pdf" \
  --mode scan \
  --scan-results "<base64-encoded-results>" \
  --selected-ids "1,3,5" \
  --api-url "..." --api-key "..."

# 方式 D:直接传入论文文本
python {baseDir}/scripts/draw.py \
  --paper-content "论文纯文本内容..." \
  --user-requirement "画一个算法流程图" \
  --style cvpr

核心参数

参数说明默认值
--pdf-pathPDF 文件路径(会自动提取文本)
--paper-content直接传入论文纯文本
--user-requirement用户对图片的描述
--modesingle(单图) 或 scan(全篇扫描)single
--api-url生图 API 地址环境变量
--api-key生图 API 密钥环境变量
--style学术风格: cvpr neurips icml naturecvpr
--skip-check跳过自校核False
--section-ref对应论文章节(如 Section 3.1

环境变量

生图 API 凭证按以下优先级自动解析,任意一个有值即可

优先级API Key 变量API URL 变量
1 (推荐)BANANA2_API_KEYBANANA2_API_URL
2ACEDATA_API_KEYPAPER_DIAGRAM_API_URL
3PAPER_DIAGRAM_API_KEY

未设置 URL 时默认 https://api.acedata.cloud/nano-banana/images

推荐在 ~/.openclaw/openclaw.json 中配置:

{
  "skills": {
    "paper-diagram": {
      "env": {
        "BANANA2_API_URL": "https://api.acedata.cloud/nano-banana/images",
        "BANANA2_API_KEY": "your-api-key-here",
        "PAPER_DIAGRAM_LLM_URL": "https://your-llm-api/v1/chat/completions",
        "PAPER_DIAGRAM_LLM_KEY": "your-llm-key-here",
        "PAPER_DIAGRAM_LLM_MODEL": "gpt-4"
      }
    }
  }
}

生成的图类型

类型说明生成方式
teaser动机/概念对比图Mermaid → AI 生图
architecture系统架构图Mermaid → AI 生图
flowchart算法流程图Mermaid → AI 生图
environment实验环境图Mermaid → AI 生图
results结果对比图Matplotlib 代码绘图(精确数据)

学术风格预设

预设场景主色调
cvprCV/CG 会议蓝色系
neuripsML/NLP 会议紫橙系
icmlML 会议蓝红绿系
natureScience/Nature 期刊柔蓝柔绿

输出

  • 图片文件:保存到 outputs/ 目录(或设置的输出目录)
  • LaTeX 图注:可直接复制到论文
  • Word 图注:纯文本格式
  • Mermaid 拓扑:可导出用于其他绘图工具

自校核机制

生成图前会自动对比拓扑描述与原文:

  • ✅ 一致 → 直接生成
  • ⚠️ 小问题 → 询问用户(接受 / 重新生成 / 手动修改)
  • ❌ 严重错误 → 建议重新生成

推荐工作流

论文 PDF
  │
  ▼
pdf_to_text.py  ──→  纯文本
  │                  │
  ▼                  ▼
draw.py (scan)   draw.py (single)
  │                  │
  ▼                  ▼
扫描报告           指定描述 → 生成单张图
  │
  ▼
用户选择 (e.g. 1,3,5)
  │
  ▼
draw.py (batch)  ──→  多张图 + LaTeX 图注

安装依赖

pip install pdfminer.six requests

可选(提升 PDF 提取质量):

pip install pymupdf pdfplumber pypdf

Version tags

latestvk977pt3prvw9va6skp8ghef1vx84pswm

Runtime requirements

📊 Clawdis
Binspython
EnvBANANA2_API_URL, BANANA2_API_KEY
Primary envBANANA2_API_KEY