Skill flagged — suspicious patterns detected

ClawHub Security flagged this skill as suspicious. Review the scan results before using.

Business Information Inquiry Tool‌

v4.1.2

企业信息调研/搜索/查询工具。当用户要求"查一下某企业"、"做企业背景调研"、"搜索公司信息"、"生成企业调查报告"时,应使用此 Skill。接收企业名称,使用四层搜索降级链路从公开网络获取企业工商信息、业务概况、行业地位及数字化系统应用,生成金蝶灵境风格HTML报告。支持PC端、移动端、平板、折叠屏多端自适应访...

0· 40· 5 versions· 0 current· 0 all-time· Updated 44m ago· MIT-0

Install

openclaw skills install kd-enterprise-info

企业信息调研 Skill v4.2 · 金蝶灵境风格

功能概述

接收用户输入的企业名称,通过四层搜索降级链路(Tavily Search API → 宿主原生搜索 → SearXNG/DDG → web_fetch 兜底)从公开网络获取企业的工商信息、业务规模、行业地位、行业洞察趋势、财务数据及数字化系统应用(ERP、CRM、WMS、TMS等14个系统),生成结构化的 金蝶灵境风格 HTML 调研报告。所有缺失字段自动显示"暂未获取",杜绝幻觉数据。报告全面兼容PC端、移动端、平板(iPad/Android Pad)、折叠屏手机多端自适应访问。

适用场景:

  • ERP售前客户背景调查(了解目标企业数字化现状)
  • 合作伙伴资质审查(评估其信息化成熟度)
  • 竞争对手分析(掌握对手业务与系统布局)
  • 行业洞察分析(快速了解目标企业所在行业趋势与竞争格局)

🔒 安全合规声明

本 Skill 的所有网络请求、文件读取及正则表达式均用于合法的企业公开信息搜索,具体说明如下:

操作类型用途风险评估
\u4e00-\u9fff Unicode 范围匹配中文字符,过滤非中文搜索结果✅ 标准中文处理,无混淆意图
urllib HTTP 请求调用 Tavily/Bing/Baidu 等公开搜索 API✅ 仅访问公开网络资源
网页内容抓取 fetch_page_content()从百度百科、企查查等公开页面提取企业信息✅ 无认证绕过,仅读取公开 HTML
读取 .env 文件 open(env_path)自动检测用户配置的 TAVILY_API_KEY✅ 仅读取指定路径,用于 API 认证
读取环境变量 os.environ.get()获取 API Key 及平台搜索配置✅ 标准 Python 配置读取

本 Skill 不执行以下操作

  • ❌ 不执行系统命令(无 subprocess/os.system/eval/exec
  • ❌ 不修改任何文件(只读操作)
  • ❌ 不发送数据到非公开网络(仅向 Tavily/Bing/Baidu/DuckDuckGo 发起搜索请求)
  • ❌ 不收集用户隐私信息(仅处理用户主动输入的企业名称)

安装方式

方式一:ClawHub CLI 安装(推荐)

openclaw skills install kd-enterprise-info

或者指定来源:

openclaw skills install kindeex/kd-enterprise-info

方式二:手动下载 ZIP 并配置

如果 ClawHub CLI 不可用,请使用以下提示词在支持 Claw 的环境中进行安装:

Install the skill "Business Information Inquiry Tool" (kindeex/kd-enterprise-info) from ClawHub.
Skill page: https://clawhub.ai/kindeex/kd-enterprise-info,Keep the work scoped to this skill only.

🚨 核心行为准则(v4.2 强制)

本 Skill 严禁编造任何数据,所有输出必须基于真实的搜索结果。

  1. 来源可溯原则

    • 每个展示的数据字段,必须在内部记录其来源 URL 或搜索摘要。
    • 最终 HTML 中不强制显示链接,但生成过程中若找不到来源,不得输出该字段(改为"暂未获取")。
  2. 确定性填充规则

    • 搜索结果中明确存在的 → 直接使用。
    • 搜索结果中模糊提及但无具体数值 → 用"【模糊描述】"并加注来源。
    • 完全未提及 → 必须填"暂未获取",禁止推测。
  3. 禁止伪造示例

    • ❌ 禁止:注册资本没查到,编造"5000 万人民币"
    • ✅ 正确:显示"暂未获取"
    • ❌ 禁止:股东信息只查到 2 家,自己编造第 3 家
    • ✅ 正确:只展示查到的信息,并注明"仅列出公开披露的前几位"
  4. 可信度分级

    • 高可信来源:gov.cn、qichacha.com、tianyancha.com、启信宝、公司官网发布的年报/公告
    • 中可信来源:新浪财经、东方财富、36氪、行业垂直媒体(注明引用)
    • 低可信来源:个人博客、百度知道、论坛 → 不作为主要依据,仅在无其他来源时降级使用并特别标注"待核实"

🧠 内置 COT(思维链)推理流程

执行 /enterprise_info <企业名称> 时,必须严格按以下 7 步思考并执行(模型内部必须模拟该流程,无需输出给用户,但最终报告质量依赖于流程遵守):

Step 1:企业名称标准化

  • 思考:用户输入可能是不全称、俗称或含后缀。
  • 动作:调用搜索,检索"<企业名> 统一社会信用代码"或"<企业名> 官网"。
  • 判定:若找到官方注册名称,则后续所有搜索以此为准;否则使用用户输入原词,并在报告中注明。

Step 2:并行搜索关键维度

  • 固定搜索清单(按优先级,使用下文的四层降级搜索执行):
    • a. 工商信息(法人、注册资本、成立日期、经营范围) → "<企业名> 工商信息 统一社会信用代码 法定代表人 注册资本"
    • b. 业务概况与简介"<企业名> 公司简介 主营业务 行业地位"
    • c. 品牌与产品"<企业名> 品牌 产品系列 解决方案"
    • d. 技术实力"<企业名> 技术实力 研发投入 专利 核心技术"
    • e. 市场与客户"<企业名> 主要客户 市场覆盖 销售渠道"
    • f. 数字化系统"<企业名> ERP CRM MES WMS 数字化 管理系统 供应商"
    • g. 数字化厂商与项目"<企业名> 信息化 招标 实施 部署 项目 系统上线"
    • h. 高管团队"<企业名> 董事 董事长 总经理 CEO 高管 总裁"
    • i. 行业洞察与趋势"<企业名> 行业 市场规模 发展趋势 竞争格局"
    • j. 竞争对手与关联"<企业名> 竞争对手 合作伙伴 产业链 近期动态"
    • k. 财务数据(如上市)"<企业名> 股票 财报 营收 净利润 上市 港股 A股"

Step 3:可信度评估与提取

  • 对每个搜索结果判断可信度(高/中/低)。
  • 提取关键字段值,并同时记录来源 URL(用于后续占位符填充时的出处标记,若模板不支持可仅内部记录)。

Step 4:交叉验证

  • 若两个独立来源对同一字段(如注册资本)数据不一致,优先采用企业年报工商登记最新公示(通常 .gov 或官方工商系统)。
  • 若无交叉来源,仅采用一个来源并内部标注"依据 [来源名] 披露"。

Step 5:缺失字段统一处理

  • 遍历所有目标字段(参见后文"输出格式"中的板块及细粒度字段)。
  • 若搜索结果中未找到任何相关信息 → 标记为 MISSING_DATA
  • 最后生成报告时,MISSING_DATA 一律转换为**"暂未获取"**(用户友好且无歧义)。

Step 6:生成结构化 JSON 数据

  • 按照 html_generator.py 所需的数据字典格式组织数据,所有值必须是字符串,且不含未替换的占位符
  • 额外字段:data_date(数据截至时间)、data_sources(核心数据来源列表)。

Step 7:调用生成器输出 HTML

  • 将 JSON 数据传入 scripts/html_generator.pygenerate_html() 函数。
  • 若生成器外部调用失败,则手动拼接模板,但严禁在此步引入编造数据。所有缺失字段必须显示"暂未获取",不得自行推测。

接口定义

输入参数

参数名类型必填说明
company_namestring企业全称或关键字(建议使用全称提高准确率)

调用方式

/enterprise_info <企业名称>

支持的触发方式

你可以使用以下任一种自然语言表达来调用本工具(代理会自动识别意图):

  • 直接命令式:/enterprise_info 金蝶国际软件集团
  • 口语化请求:
    • "帮我查一下深圳市共进电子股份有限公司的信息"
    • "用企业信息搜索工具搜索一下华为"
    • "我想调研一下西安农心作物科技股份有限公司"
  • 明确工具名:
    • "启动企业信息调研工具,目标:比亚迪股份有限公司"
    • "调用企业信息搜索技能,查一下三一重工"
    • "打开企业调研报告工具,分析南通振康"

💡 只要对话中包含"企业调研""企业信息搜索""公司信息查询""企业背景调查"等意图,并跟随一个具体的企业名称,模型就会自动启用该 Skill,无需记忆固定命令。

如果用户输入只有企业名,模型会自动补全意图并执行查询。例如直接说:

格力电器

代理可能会追问是否需要调研,或直接执行查询,取决于设置。


输出格式

生成完整HTML页面(金蝶灵境风格),包含以下板块(所有字段若缺失则填"暂未获取"):

1. 企业基础信息

  • 企业名称、统一社会信用代码
  • 法定代表人、注册资本、实缴资本
  • 成立日期、经营状态、登记机关
  • 企业类型、所属行业
  • 注册地址、经营范围

2. 行业洞察及趋势

  • 市场规模、增长动力、政策影响
  • 发展趋势、竞争格局、技术方向
  • 各维度描述需详尽,至少 30-50 字/维度

3. 公司简介

  • 企业概况(发展历史、核心业务)
  • 发展历程(关键里程碑)
  • 企业文化(使命、愿景、价值观)
  • 荣誉资质(高新技术企业、专精特新等)

4. 核心高管

  • 姓名、职务(头像首字展示)

5. 数字化应用系统

  • 14类系统:ERP、CRM、MES、WMS、TMS、BI、SRM、PLM、SCM、OA、HRM、QMS、EAM、APS
  • 已部署系统显示"已部署"及具体厂商名称(若未知则显示"厂商未知"),未部署显示"未部署"
  • 所有系统状态均基于公开信息提取,严禁无据假设。

6. 财务数据(仅上市公司展示)

  • 核心KPI:营收、净利润、毛利率、ROE
  • 近三/四年财务数据对比表(含同比环比)
  • 数据来源标注

7. 主营业务与行业地位

  • 主营业务、主要产品/服务
  • 行业地位、市场地位

8. 品牌与产品

  • 核心品牌、产品系列、核心产品、解决方案

9. 技术实力

  • 研发投入、专利情况、核心技术、研发中心

10. 市场与客户

  • 主要客户、市场覆盖、销售渠道

11. 热门关联信息

  • 产业链位置、主要竞争对手、合作伙伴、近期热点

数据源(四层降级链路)

L1:Tavily Search API

  • 结构化搜索,返回带来源的摘要,数据质量高,强烈建议配置 API Key。
  • 配置方式:环境变量 TAVILY_API_KEY,或自动读取 ~/.openclaw/workspace/.env 等路径。

L2:平台原生搜索工具(由 AI 调用,非脚本)

⚠️ L2 不由脚本执行,由 AI 使用系统搜索工具完成。

执行流程:

  1. 当 L1 Tavily 不可用时,AI 调用所在平台的搜索工具(如 kimi_searchweb_search,模型会自动选择可用的工具)
  2. 针对每个搜索维度进行查询(参考 Step 2 的11条搜索清单)
  3. 将搜索结果整理成 JSON 格式,通过 external_results 参数传入 query_enterprise()

参数格式:

{
  "basic": "搜索结果文本...",
  "business": "搜索结果文本...",
  "brand": "...",
  "tech": "...",
  "market": "...",
  "digital": "...",
  "digital_vendor": "...",
  "executive": "...",
  "industry": "...",
  "related": "...",
  "finance": "..."
}

AI 执行步骤:

  1. 先尝试 L1:调用 enterprise_search.py 并检查返回中是否标记了降级
  2. 如果降级到 L2,AI 自行搜索 11 个维度,参考 references/search_patterns.md 中的查询模板
  3. 将搜索结果作为 external_results 参数传入 query_enterprise() 函数

如果 AI 未提供 L2 数据,脚本自动降级到 L3(SearXNG/DuckDuckGo)。

L3:免 Key 降级(SearXNG / DuckDuckGo)

  • SearXNG:自托管元搜索,需配置 SEARXNG_BASE_URL
  • DuckDuckGo:免 Key 公共搜索,HTML 解析,无需任何配置。

L4:web_fetch 最终兜底

  • 直接抓取 Baidu / Bing 搜索结果页的纯文本内容。
  • 数据质量和完整性最低,仅作为最后一道防线。

深度抓取增强

对于工商、业务、数字化、财务四个核心维度,会自动提取搜索结果中的高质量 URL(百度百科、企查查、公司官网、东方财富等),并抓取其页面全文用于信息提取,最大程度降低"暂未获取"的出现概率。


数字化系统提取规则

采用系统-厂商映射表自动识别企业 IT 环境,覆盖14类核心系统,共100+个常见厂商关键词。提取逻辑:

  1. 检测全文中是否出现系统关键词(例如"ERP"、"CRM")。
  2. 若未出现 → 标记为"未部署"。
  3. 若出现 → 扫描已知厂商列表,匹配到则输出厂商名(如"金蝶云·星空");未匹配到则标记为"已部署",生成报告时显示"厂商未知"。

此机制有效解决了以往"只知道有系统,不知道谁家的"痛点,大幅提升数字化卡片的实用价值。


使用示例

示例 1:查询上市公司

/enterprise_info 深圳市共进电子股份有限公司

返回:企业信息调研报告 HTML 页面,包含完整财务数据卡片及数字化系统详情。

示例 2:查询民营企业

/enterprise_info 西安农心作物科技股份有限公司

返回:企业信息调研报告 HTML 页面(无财务数据卡片,数字化系统根据公开信息展示)。


异常处理 + 防幻觉护栏

  • 企业未找到:返回提示页"未找到相关企业,请检查企业名称",禁止猜测任何信息。
  • 搜索失败(所有层级均不可用):显示"搜索服务异常,无法获取数据",不输出任何可能误导的占位符数据。
  • 部分字段缺失:对应位置填"暂未获取",绝不用"未知"或"待核实"等模糊词替代(除非搜索结果中明确要求标注"待核实"且与低可信来源绑定)。
  • 降级提醒:报告顶部根据当前降级层级显示提示横幅:
    • L2:"⚠️ 使用宿主平台原生搜索引擎(非 Tavily),数据质量可能有所不同"
    • L3:"⚠️ 使用 SearXNG/DuckDuckGo 搜索(免 Key 降级),数据可能不完整"
    • L4:"⚠️ 使用 web_fetch 兜底搜索,数据质量和完整性最低,建议配置 Tavily API Key"
  • 数据完整性统计:报告末尾增加一行小字:"本报告基于公开搜索,数据完整度:X/N 字段有明确来源,其余为暂未获取。"--此功能需 html_generator.py 支持(当前版本已实现)。

依赖说明

主要依赖:Tavily Search API

本 Skill 使用 Tavily Search API 作为主要数据源,纯 Python HTTP 实现,无需外部文件依赖

配置方式(任选其一)

方式1:环境变量(推荐)

export TAVILY_API_KEY=your_tavily_api_key_here

方式2:.env 文件(自动检测常见路径)

# 以下路径自动识别:
~/.openclaw/workspace/.env
~/.qclaw/workspace/.env
~/.maxclaw/workspace/.env
~/.kimiclaw/workspace/.env
~/.env
./.env

获取 Tavily API Key:

  1. 访问 https://tavily.com/
  2. 注册账号并获取 API Key
  3. 免费额度:每月约 1000 次调用

降级方案(无 Tavily API Key)

若未配置 TAVILY_API_KEY,Skill 会自动按 L2 → L3 → L4 顺序降级,无需手动干预。报告顶部会显示当前降级层级提示,确保用户知晓数据质量。

⚠️ 重要提醒:

  • 降级后的数据完整性可能明显低于 Tavily,部分字段可能显示"暂未获取"。
  • 强烈建议配置 Tavily API Key 以获得最佳体验。

配套资源

核心脚本

  • scripts/enterprise_search.py - 企业信息搜索脚本(四层降级链路 + 多维提取 + 系统映射 + 深度抓取)
  • scripts/html_generator.py - HTML报告生成器 v4.2(数据清洗、缺失统一为"暂未获取")

模板文件(v4.2 金蝶灵境风格)

  • templates/report-css-v4.css - CSS样式模板(独立文件,金蝶灵境风格)
  • templates/report-html-v4.html - HTML结构模板(14个板块,全部占位符)

参考文档

  • references/search_patterns.md - 搜索查询模板、提取规则、系统映射与提取逻辑

模板架构说明(v4.2)

拆分原则

  • 样式与逻辑分离:CSS 完全独立到 templates/report-css-v4.css,生成器只做数据填充。
  • 兜底机制:如果外部模板丢失,生成器内置基础样式保证报告可读。
  • 数据清洗前置:生成器在渲染前统一将所有空值转换为"暂未获取",杜绝占位符残留。

多端自适应设计

报告全面兼容 PC端、移动端、平板(iPad/Android Pad)、折叠屏手机 浏览,核心适配策略:

设备类型屏幕宽度适配策略
PC / 大屏≥1024px卡片最大宽度1180px居中,信息网格自适应多列,高管色块一排展示
平板768-1023px卡片全宽,信息网格2列,高管色块自适应缩放
折叠屏(展开态)600-767px卡片全宽,信息网格1-2列,数字化系统2列,高管色块2列换行
手机(直板/折叠屏折叠态)<600px卡片全宽,信息网格1列,数字化系统1列,高管色块2列换行

关键CSS断点:

@media (max-width: 768px)  { /* 平板及以下 */ }
@media (max-width: 600px)  { /* 手机及折叠屏折叠态 */ }
@media (max-width: 480px)  { /* 小屏手机 */ }

折叠屏专项优化:

  • 使用 viewport meta 标签的 viewport-fit=cover 适配安全区域
  • 所有交互元素最小点击区域 44×44px,适配触控操作
  • 字体使用 clamp() 流式缩放,避免折叠屏展开/折叠时布局突变
  • 卡片间距和内边距在小屏自动收紧,大屏保持宽松呼吸感
  • 图表/表格横向溢出时自动滚动,不截断内容

目录结构(v4.2)

kd-enterprise-info/
├── SKILL.md                   # 技能说明文档(v4.2 · 金蝶灵境风格)
├── README.md                  # 用户使用指南
├── templates/
│   ├── report-css-v4.css      # CSS样式模板(金蝶灵境风格)
│   └── report-html-v4.html    # HTML结构模板(106个占位符)
├── scripts/
│   ├── html_generator.py      # 生成器 v4.2(强制清洗 + "暂未获取"默认值)
│   └── enterprise_search.py   # 搜索脚本 v4.2(四层降级 + 系统映射 + 深度抓取)
├── references/
│   └── search_patterns.md     # 搜索规则参考(v4.2 更新)
└── assets/                    # 资源目录(预留)

模板定制

如需修改报告样式,直接编辑 templates/report-css-v4.css,无需修改生成器代码。

如需修改报告结构,编辑 templates/report-html-v4.html,占位符对应各数据字段。


版本历史

版本历史

v4.2 - L2架构改为AI搜索接口,新增 digital_vendor 维度,去除数字化搜索词厂商偏见,修复正则与降级提示。
v4.1 - 14类数字化系统映射,高管提取扩展,行业洞察清洗,缺失统一“暂未获取”。
v4.0 - 核心行为准则、COT 7步推理、可信度分级、财务卡、金蝶灵境风格升级。


反馈与支持

如有问题或建议,请联系金蝶总部张贺老师。若发现模型仍有编造数据行为,请检查是否正确遵循了 Step 5(缺失字段强行填"暂未获取")及核心行为准则第2条。

Version tags

latestvk97adtn7g5b3d3w4t6t2j05rts85ta14