Skill flagged — suspicious patterns detected

ClawHub Security flagged this skill as suspicious. Review the scan results before using.

Business Information Inquiry Tool‌

v4.1.0

企业信息调研工具。接收企业名称,使用四层搜索降级链路(Tavily → 宿主原生 → SearXNG/DDG → web_fetch)从公开网络获取企业工商信息、业务概况、行业地位及数字化系统应用,生成结构化的HTML调研报告。用于ERP售前客户背景调查、合作伙伴资质审查、竞争对手分析等场景。v4.1 强制防幻觉...

0· 38· 3 versions· 0 current· 0 all-time· Updated 4h ago· MIT-0

Install

openclaw skills install kd-enterprise-info

企业信息调研 Skill v4.1 · 金蝶灵境风格

功能概述

接收用户输入的企业名称,通过四层搜索降级链路(Tavily Search API → 宿主原生搜索 → SearXNG/DDG → web_fetch 兜底)从公开网络获取企业的工商信息、业务规模、行业地位、行业洞察趋势、财务数据及数字化系统应用(ERP、CRM、WMS、TMS等14个系统),生成结构化的 金蝶灵境风格 HTML 调研报告。所有缺失字段自动显示"暂未获取",杜绝幻觉数据。

适用场景

  • ERP售前客户背景调查(了解目标企业数字化现状)
  • 合作伙伴资质审查(评估其信息化成熟度)
  • 竞争对手分析(掌握对手业务与系统布局)
  • 行业洞察分析(快速了解目标企业所在行业趋势与竞争格局)

安装方式

方式一:ClawHub CLI 安装(推荐)

openclaw skills install kd-enterprise-info

或者指定来源:

openclaw skills install kindeex/kd-enterprise-info

方式二:手动下载 ZIP 并配置

如果 ClawHub CLI 不可用,请使用以下提示词在支持 Claw 的环境中进行安装:

Install the skill "Business Information Inquiry Tool" (kindeex/kd-enterprise-info) from ClawHub.
Skill page: https://clawhub.ai/kindeex/kd-enterprise-info
Keep the work scoped to this skill only.
After install, inspect the skill metadata and help me finish setup.
Use only the metadata you can verify from ClawHub; do not invent missing requirements.
Ask before making any broader environment changes.

🚨 核心行为准则(v4.1 强制)

本 Skill 严禁编造任何数据,所有输出必须基于真实的搜索结果。

  1. 来源可溯原则

    • 每个展示的数据字段,必须在内部记录其来源 URL 或搜索摘要。
    • 最终 HTML 中不强制显示链接,但生成过程中若找不到来源,不得输出该字段(改为"暂未获取")。
  2. 确定性填充规则

    • 搜索结果中明确存在的 → 直接使用。
    • 搜索结果中模糊提及但无具体数值 → 用"【模糊描述】"并加注来源。
    • 完全未提及 → 必须填"暂未获取",禁止推测。
  3. 禁止伪造示例

    • ❌ 禁止:注册资本没查到,编造"5000 万人民币"
    • ✅ 正确:显示"暂未获取"
    • ❌ 禁止:股东信息只查到 2 家,自己编造第 3 家
    • ✅ 正确:只展示查到的信息,并注明"仅列出公开披露的前几位"
  4. 可信度分级

    • 高可信来源:gov.cn、qichacha.com、tianyancha.com、启信宝、公司官网发布的年报/公告
    • 中可信来源:新浪财经、东方财富、36氪、行业垂直媒体(注明引用)
    • 低可信来源:个人博客、百度知道、论坛 → 不作为主要依据,仅在无其他来源时降级使用并特别标注"待核实"

🧠 内置 COT(思维链)推理流程

执行 /enterprise_info <企业名称> 时,必须严格按以下 7 步思考并执行(模型内部必须模拟该流程,无需输出给用户,但最终报告质量依赖于流程遵守):

Step 1:企业名称标准化

  • 思考:用户输入可能是不全称、俗称或含后缀。
  • 动作:调用搜索,检索"<企业名> 统一社会信用代码"或"<企业名> 官网"。
  • 判定:若找到官方注册名称,则后续所有搜索以此为准;否则使用用户输入原词,并在报告中注明。

Step 2:并行搜索关键维度

  • 固定搜索清单(按优先级,使用下文的四层降级搜索执行):
    • a. 工商信息(法人、注册资本、成立日期、经营范围) → "<企业名> 工商信息 统一社会信用代码 法定代表人 注册资本"
    • b. 业务概况与简介"<企业名> 公司简介 主营业务 行业地位"
    • c. 品牌与产品"<企业名> 品牌 产品系列 解决方案"
    • d. 技术实力"<企业名> 技术实力 研发投入 专利 核心技术"
    • e. 市场与客户"<企业名> 主要客户 市场覆盖 销售渠道"
    • f. 数字化系统"<企业名> ERP CRM SAP 金蝶 用友 数字化 系统"
    • g. 高管团队"<企业名> 董事 董事长 总经理 CEO 高管 总裁"
    • h. 行业洞察与趋势"<企业名> 行业 市场规模 发展趋势 竞争格局"
    • i. 竞争对手与关联"<企业名> 竞争对手 合作伙伴 产业链 近期动态"
    • j. 财务数据(如上市)"<企业名> 股票 财报 营收 净利润 上市 港股 A股"

Step 3:可信度评估与提取

  • 对每个搜索结果判断可信度(高/中/低)。
  • 提取关键字段值,并同时记录来源 URL(用于后续占位符填充时的出处标记,若模板不支持可仅内部记录)。

Step 4:交叉验证

  • 若两个独立来源对同一字段(如注册资本)数据不一致,优先采用企业年报工商登记最新公示(通常 .gov 或官方工商系统)。
  • 若无交叉来源,仅采用一个来源并内部标注"依据 [来源名] 披露"。

Step 5:缺失字段统一处理

  • 遍历所有目标字段(参见后文"输出格式"中的板块及细粒度字段)。
  • 若搜索结果中未找到任何相关信息 → 标记为 MISSING_DATA
  • 最后生成报告时,MISSING_DATA 一律转换为**"暂未获取"**(用户友好且无歧义)。

Step 6:生成结构化 JSON 数据

  • 按照 html_generator.py 所需的数据字典格式组织数据,所有值必须是字符串,且不含未替换的占位符
  • 额外字段:data_date(数据截至时间)、data_sources(核心数据来源列表)。

Step 7:调用生成器输出 HTML

  • 将 JSON 数据传入 scripts/html_generator.pygenerate_html() 函数。
  • 若生成器外部调用失败,则手动拼接模板,但严禁在此步引入编造数据。所有缺失字段必须显示"暂未获取",不得自行推测。

接口定义

输入参数

参数名类型必填说明
company_namestring企业全称或关键字(建议使用全称提高准确率)

调用方式

/enterprise_info <企业名称>

输出格式

生成完整HTML页面(金蝶灵境风格),包含以下板块(所有字段若缺失则填"暂未获取"):

1. 企业基础信息

  • 企业名称、统一社会信用代码
  • 法定代表人、注册资本、实缴资本
  • 成立日期、经营状态、登记机关
  • 企业类型、所属行业
  • 注册地址、经营范围

2. 行业洞察及趋势

  • 市场规模、增长动力、政策影响
  • 发展趋势、竞争格局、技术方向
  • 各维度描述需详尽,至少 30-50 字/维度

3. 公司简介

  • 企业概况(发展历史、核心业务)
  • 发展历程(关键里程碑)
  • 企业文化(使命、愿景、价值观)
  • 荣誉资质(高新技术企业、专精特新等)

4. 核心高管

  • 姓名、职务(头像首字展示)

5. 数字化应用系统

  • 14类系统:ERP、CRM、MES、WMS、TMS、BI、SRM、PLM、SCM、OA、HRM、QMS、EAM、APS
  • 已部署系统显示"已部署"及具体厂商名称(若未知则显示"厂商未知"),未部署显示"未部署"
  • 所有系统状态均基于公开信息提取,严禁无据假设。

6. 财务数据(仅上市公司展示)

  • 核心KPI:营收、净利润、毛利率、ROE
  • 近三/四年财务数据对比表(含同比环比)
  • 数据来源标注

7. 主营业务与行业地位

  • 主营业务、主要产品/服务
  • 行业地位、市场地位

8. 品牌与产品

  • 核心品牌、产品系列、核心产品、解决方案

9. 技术实力

  • 研发投入、专利情况、核心技术、研发中心

10. 市场与客户

  • 主要客户、市场覆盖、销售渠道

11. 热门关联信息

  • 产业链位置、主要竞争对手、合作伙伴、近期热点

数据源(四层降级链路)

L1:Tavily Search API

  • 结构化搜索,返回带来源的摘要,数据质量高,强烈建议配置 API Key。
  • 配置方式:环境变量 TAVILY_API_KEY,或自动读取 ~/.openclaw/workspace/.env 等路径。

L2:宿主平台原生搜索(跨平台自适应)

  • 当无 Tavily Key 时,自动检测所在平台的预置搜索引擎:
    • KimiClaw → Kimi Search(月之暗面)
    • MaxClaw → MiniMax Search(结构化结果)
    • 其他环境可扩展。
  • 支持的环境变量:KIMI_API_KEY / MOONSHOT_API_KEYMINIMAX_CODE_PLAN_KEY 等。

L3:免 Key 降级(SearXNG / DuckDuckGo)

  • SearXNG:自托管元搜索,需配置 SEARXNG_BASE_URL
  • DuckDuckGo:免 Key 公共搜索,HTML 解析,无需任何配置。

L4:web_fetch 最终兜底

  • 直接抓取 Baidu / Bing 搜索结果页的纯文本内容。
  • 数据质量和完整性最低,仅作为最后一道防线。

深度抓取增强

对于工商、业务、数字化、财务四个核心维度,会自动提取搜索结果中的高质量 URL(百度百科、企查查、公司官网、东方财富等),并抓取其页面全文用于信息提取,最大程度降低"暂未获取"的出现概率。


数字化系统提取规则

采用系统‑厂商映射表自动识别企业 IT 环境,覆盖14类核心系统,共100+个常见厂商关键词。提取逻辑:

  1. 检测全文中是否出现系统关键词(例如"ERP"、"CRM")。
  2. 若未出现 → 标记为"未部署"。
  3. 若出现 → 扫描已知厂商列表,匹配到则输出厂商名(如"金蝶云·星空");未匹配到则标记为"已部署",生成报告时显示"厂商未知"。

此机制有效解决了以往"只知道有系统,不知道谁家的"痛点,大幅提升数字化卡片的实用价值。


使用示例

示例 1:查询上市公司

/enterprise_info 深圳市共进电子股份有限公司

返回:企业信息调研报告 HTML 页面,包含完整财务数据卡片及数字化系统详情。

示例 2:查询民营企业

/enterprise_info 西安农心作物科技股份有限公司

返回:企业信息调研报告 HTML 页面(无财务数据卡片,数字化系统根据公开信息展示)。


异常处理 + 防幻觉护栏

  • 企业未找到:返回提示页"未找到相关企业,请检查企业名称",禁止猜测任何信息。
  • 搜索失败(所有层级均不可用):显示"搜索服务异常,无法获取数据",不输出任何可能误导的占位符数据。
  • 部分字段缺失:对应位置填"暂未获取",绝不用"未知"或"待核实"等模糊词替代(除非搜索结果中明确要求标注"待核实"且与低可信来源绑定)。
  • 降级提醒:报告顶部根据当前降级层级显示提示横幅:
    • L2:"⚠️ 使用宿主平台原生搜索引擎(非 Tavily),数据质量可能有所不同"
    • L3:"⚠️ 使用 SearXNG/DuckDuckGo 搜索(免 Key 降级),数据可能不完整"
    • L4:"⚠️ 使用 web_fetch 兜底搜索,数据质量和完整性最低,建议配置 Tavily API Key"
  • 数据完整性统计:报告末尾增加一行小字:"本报告基于公开搜索,数据完整度:X/N 字段有明确来源,其余为暂未获取。"——此功能需 html_generator.py 支持(当前版本已实现)。

依赖说明

主要依赖:Tavily Search API

本 Skill 使用 Tavily Search API 作为主要数据源,纯 Python HTTP 实现,无需外部文件依赖

配置方式(任选其一)

方式1:环境变量(推荐)

export TAVILY_API_KEY=your_tavily_api_key_here

方式2:.env 文件(自动检测常见路径)

# 以下路径自动识别:
~/.openclaw/workspace/.env
~/.qclaw/workspace/.env
~/.maxclaw/workspace/.env
~/.kimiclaw/workspace/.env
~/.env
./.env

获取 Tavily API Key:

  1. 访问 https://tavily.com/
  2. 注册账号并获取 API Key
  3. 免费额度:每月约 1000 次调用

降级方案(无 Tavily API Key)

若未配置 TAVILY_API_KEY,Skill 会自动按 L2 → L3 → L4 顺序降级,无需手动干预。报告顶部会显示当前降级层级提示,确保用户知晓数据质量。

⚠️ 重要提醒

  • 降级后的数据完整性可能明显低于 Tavily,部分字段可能显示"暂未获取"。
  • 强烈建议配置 Tavily API Key 以获得最佳体验。

配套资源

核心脚本

  • scripts/enterprise_search.py - 企业信息搜索脚本(四层降级链路 + 多维提取 + 系统映射 + 深度抓取)
  • scripts/html_generator.py - HTML报告生成器 v4.1(数据清洗、缺失统一为"暂未获取")

模板文件(v4.1 金蝶灵境风格)

  • templates/report-css-v4.css - CSS样式模板(独立文件,金蝶灵境风格)
  • templates/report-html-v4.html - HTML结构模板(14个板块,全部占位符)

参考文档

  • references/search_patterns.md - 搜索查询模板、提取规则、系统映射与提取逻辑

模板架构说明(v4.1)

拆分原则

  • 样式与逻辑分离:CSS 完全独立到 templates/report-css-v4.css,生成器只做数据填充。
  • 兜底机制:如果外部模板丢失,生成器内置基础样式保证报告可读。
  • 数据清洗前置:生成器在渲染前统一将所有空值转换为"暂未获取",杜绝占位符残留。

目录结构(v4.1)

kd-enterprise-info/
├── SKILL.md                   # 技能说明文档(v4.1 · 金蝶灵境风格)
├── README.md                  # 用户使用指南
├── templates/
│   ├── report-css-v4.css      # CSS样式模板(金蝶灵境风格)
│   └── report-html-v4.html    # HTML结构模板(106个占位符)
├── scripts/
│   ├── html_generator.py      # 生成器 v4.1(强制清洗 + "暂未获取"默认值)
│   └── enterprise_search.py   # 搜索脚本 v4.1(四层降级 + 系统映射 + 深度抓取)
├── references/
│   └── search_patterns.md     # 搜索规则参考(v4.1 更新)
└── assets/                    # 资源目录(预留)

模板定制

如需修改报告样式,直接编辑 templates/report-css-v4.css,无需修改生成器代码。

如需修改报告结构,编辑 templates/report-html-v4.html,占位符对应各数据字段。


版本历史

  • v4.1 (2026-04-30) — 重构搜索提取引擎:新增14类数字化系统厂商映射、高管提取扩展至8人、行业洞察及趋势维度清洗、财务判定强化、所有缺失字段统一显示为"暂未获取"、深度网页抓取增强、搜索查询维度扩大至10个方向。保持金蝶灵境风格与四层搜索降级链路。
  • v4.0 (2026-04-27) — 新增核心行为准则、COT 7步推理流程、可信度分级、行业洞察卡片、财务数据卡片(上市公司)、Footer 三排居中布局、导航栏日期变量、数字化系统厂商展示优化、CSS 升级为金蝶灵境风格。
  • v3.2 — 模板架构完善:CSS + HTML 模板完全分离,88个细粒度占位符,新增 README 使用指南
  • v3.1 — CSS 样式拆分到独立文件
  • v3.0 — 统一 CSS 样式,完整数据维度(10大板块)
  • v2.0 — 支持两层搜索降级链路
  • v1.0 — 初始版本

Version tags

latestvk97b2z3svjhbr1v7p7gmzbfg5n85v3pz