领域调研

Other

输入中文关键词后,生成中英双语关键词与文献检索结果表:中文来源知网、英文来源Google Scholar,近10年、相关性排序、按年份降序输出标准Markdown表格;优先可见浏览器人工验证。

Install

openclaw skills install field-research

双语文献检索表(浏览器优先)

适用场景

当用户提出以下需求时使用本 skill:

  • 输入中文关键词,自动生成双语关键词并检索文献
  • 需要中文(知网)+ 英文(Google Scholar)双来源
  • 需要固定字段、可复制进论文的标准 Markdown 表格

核心规则(必须遵守)

  1. 双语关键词

    • 中文:使用用户提供的原始中文关键词(不改写主语义)。
    • 英文:给出标准学术翻译(精准、专业、学术常用表达)。
  2. 检索来源

    • 中文来源:知网(CNKI)。
    • 英文来源:Google Scholar。
  3. 检索筛选条件

    • 时间范围:近 10 年(2016–2026)。
    • 平台内排序:按相关性(Relevance)。
  4. 结果总表排序

    • 严格按 出版年份 降序(最新在前)。
  5. 数据真实性

    • 不得编造任何条目、指标或字段。
    • 无法确认的数据留空或填写 -
    • 若整体无可用结果,明确说明"未检索到满足条件的数据",并输出空表结构。
  6. 固定表头(不得变更)

    • 标题期刊/会议名分区方法被引次数出版年份使用技术
  7. 输出格式

    • 仅输出标准 Markdown 表格(可直接复制到论文)。

浏览器优先策略(核心规则)

为提升可验证性并降低反爬影响,执行检索时遵循:

1. 验证码处理流程(重要)

遇到验证码时必须暂停,等待用户手动处理:

  • 当检测到验证码页面时,立即停止操作
  • 提示用户:"检测到验证码,请手动完成验证,完成后告诉我'继续'"
  • 等待用户确认后,再继续后续操作
  • 严禁在验证码未处理的情况下继续尝试访问

2. 浏览器启动

  • 启动 Chrome:/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=18800 --user-data-dir=/tmp/openclaw_chrome_profile
  • 使用 browser 工具进行导航和检索

3. 知网检索流程

  • 打开 https://kns.cnki.net/kns8s/search
  • 在搜索框输入中文关键词
  • 点击搜索按钮
  • 检查是否出现验证码,如出现则暂停并提示用户
  • 使用 browser snapshot 提取检索结果
  • 如需进入详情页,点击文献标题链接
  • 详情页如出现验证码,同样暂停等待用户处理

4. Google Scholar 检索流程

  • 打开 https://scholar.google.com/scholar?q=<英文关键词>&hl=en&as_sdt=0,5&as_ylo=2016&as_yhi=2026
  • 检查是否出现验证码,如出现则暂停并提示用户
  • 使用 browser snapshot 提取检索结果

5. 数据提取策略

  • 从 browser snapshot 中解析表格数据
  • 提取字段:标题、期刊/会议名、被引次数、出版年份
  • 方法和使用技术:从标题/摘要/来源类型推断,或进入详情页提取

6. 若当前环境无法打开浏览器

  • 进入"离线模板模式",只输出规范化结果框架与可填空位,不伪造数据

字段填写细则(参考示例优化)

分区

  • 中文期刊:标注 CSSCI/CSCD/北大核心/AMI 等
  • 英文期刊:标注 SCI Q1/Q2/Q3/Q4、中科院分区等
  • 无法确认时填写 -

方法

  • 详细描述研究采用的方法论和技术路线
  • 可包含:研究设计、数据处理流程、分析框架等
  • 示例格式:
    • "深度学习边缘滤波(DEF)→ 闭合形状提取(CSE)"
    • "地理配准 → 矢量化 → 坐标校正 → 地名数据库构建"
    • "高清扫描 → 几何校正 → 要素提取 → CAD数字化转绘"

使用技术

  • 列出具体使用的技术、工具、算法、模型
  • 示例:
    • "ArcGIS, U-Net, HED, BDCN, Vision Transformer"
    • "知识图谱, RDF, SPARQL, Neo4j, NLP"
    • "GIS, 遥感(RS), 计算机视觉(CV), 深度学习(DL)"

被引次数

  • 使用检索平台可见数字
  • 不可见时填写 -待查

标准执行流程

  1. 获取用户中文关键词
  2. 生成英文学术翻译关键词
  3. 启动 Chrome 浏览器(如未运行)
  4. 中文通道:
    • 打开知网搜索页面
    • 输入关键词并搜索
    • 提取结果列表(标题、期刊、年份、被引等)
    • 如需详情,点击进入单篇文献页面
  5. 英文通道:
    • 打开 Google Scholar 搜索页面
    • 提取结果列表
  6. 合并结果并按出版年份降序排序
  7. 输出 Markdown 表格

输出模板

中文关键词:<用户原词>
英文关键词:<学术翻译>

| 标题 | 期刊/会议名 | 分区 | 方法 | 被引次数 | 出版年份 | 使用技术 |
|:---|:---|:---:|:---|:---:|:---:|:---|
| <标题> | <期刊/会议> | <分区> | <方法描述> | <被引> | <年份> | <技术列表> |

验证码检测与处理(强制规则)

检测方式

通过 browser snapshot 内容判断:

  • 页面标题或内容包含"验证"、"captcha"、"安全验证"等关键词
  • 页面内容异常简短(如只有 document 标签而无实质内容)
  • 页面 URL 包含 verify、/captcha/、security-check 等路径

处理流程

  1. 立即停止:不再进行任何后续操作
  2. 截图提示:如有必要,截图当前页面状态
  3. 明确告知:"检测到验证码/安全验证,请手动完成验证"
  4. 等待确认:等待用户回复"继续"或"ok"后再继续
  5. 恢复操作:用户确认后,重新尝试获取页面内容

示例对话

AI: 正在打开知网进行检索...
AI: [截图显示验证码页面]
AI: 检测到知网验证码,请手动完成验证后告诉我"继续"
用户: 继续
AI: 好的,继续获取检索结果...

失败与空结果处理

  • 任一来源失败:继续输出另一来源可得数据,并对失败来源字段留 -
  • 双来源都失败:输出空表,不编造
  • 如遇验证码/反爬:必须暂停等待用户手动处理,严禁自动绕过

示例参考(高质量字段填写)

方法字段示例

类型示例
技术流程图像质量优化(扫描、校正、修复、地理配准)→ 信息提取(矢量化、符号识别、深度学习语义分割)→ 数据库构建
分析框架资源实体 → 描述对象 → 知识抽象 → 舆图表达 → 舆图展示
数字化流程高清扫描 → 几何校正 → 要素提取 → CAD数字化转绘 → 与现状图配准叠加
深度学习流程边缘滤波(U-Net/HED/BDCN)→ 闭合形状提取(Meyer分水岭变换)→ 拓扑优化

使用技术字段示例

类别技术
GIS/遥感ArcGIS, QGIS, ENVI, 遥感(RS)
深度学习U-Net, HED, BDCN, ViT, PVT, Mask R-CNN, 语义分割
知识图谱RDF, SPARQL, Neo4j, 知识图谱, 关联数据
计算机视觉OpenCV, 计算机视觉(CV), OCR, 目标检测
数据处理Python, MATLAB, CAD, 矢量化工具

对用户的最小交互提示

验证码相关提示

  • "检测到知网验证码,请手动完成验证后回复'继续'"
  • "检测到 Google Scholar 验证码,请手动完成验证后回复'继续'"
  • "当前页面需要安全验证,请完成验证后告诉我'ok'"

操作确认提示

  • "请确认已在页面中勾选时间范围 2016–2026,并选择按相关性排序"
  • "如需更详细的文献信息(如摘要、关键词),请告诉我进入详情页提取"
  • "准备进入文献详情页,如遇验证码请手动处理"

等待用户时的回复模板

当检测到验证码并等待用户时:

检测到 [知网/Google Scholar] 验证码/安全验证,请手动完成验证。

完成后请回复"继续"或"ok",我将接着获取检索结果。

[可选:附上当前页面截图]