Prospector

根据关键词自动搜索潜在客户公司,提取联系方式(邮箱),输出结构化客户列表。 适用场景: - 用户需要寻找潜在客户时 - 用户需要获取公司联系方式时 - 用户提到"找客户"、"获客"、"销售线索"、"潜在客户"等关键词 - 用户需要查询已收集的客户数据 功能: 1. 根据关键词和地区搜索潜在客户公司 2. 访问公司...

MIT-0 · Free to use, modify, and redistribute. No attribution required.
0 · 54 · 0 current installs · 0 all-time installs
MIT-0
Security Scan
VirusTotalVirusTotal
Benign
View report →
OpenClawOpenClaw
Benign
high confidence
Purpose & Capability
The name/description (prospecting companies and extracting emails) matches the included scripts and declared dependencies (requests, BeautifulSoup, python-whois, dnspython). Required binaries (python3, curl) and the pip dependency list are proportional to the stated functionality.
Instruction Scope
SKILL.md and scripts explicitly instruct the agent to perform network operations (search multiple search engines, crawl websites, WHOIS lookups, DNS checks) and to read/write a local cache. This is within scope for a prospector tool, but the skill will perform broad network access and fetch arbitrary external pages during normal use—users should expect outbound HTTP(S) requests and WHOIS/DNS lookups.
Install Mechanism
There is no remote binary/download install. The SKILL.md recommends installing Python packages via pip (standard and expected). The packages are common and appropriate for web requests, HTML parsing, WHOIS and DNS checks.
Credentials
The skill does not request credentials or secret environment variables. It reads common proxy environment variables (HTTP_PROXY, HTTPS_PROXY, ALL_PROXY) to support network routing—this is expected for a networked crawler but users should be aware that proxy env vars will affect all outbound requests.
Persistence & Privilege
The skill writes local cache files (companies.json, searches.json, emails.json) in a skill-local cache directory. It does not request always:true, does not modify other skills, and does not persist system-wide credentials. Local file writes are proportional to the functionality.
Assessment
This skill appears to do what it says: search the web, crawl sites, run WHOIS/DNS checks, and store results locally. Before installing: 1) expect it to make many outbound HTTP(S) requests and WHOIS/DNS queries (ensure this is allowed on your network); 2) proxy environment variables (HTTP_PROXY/HTTPS_PROXY/ALL_PROXY) will route its traffic—ensure proxies are trusted; 3) cached data is stored in the skill's cache directory (inspect and clean as needed); 4) respect search engine/site terms of service and local privacy/regulatory rules when scraping or collecting contact data; 5) review and run the scripts in an isolated environment if you have concerns (they are plain Python and readable). If you need stricter controls, run the scripts manually rather than enabling autonomous invocation and avoid setting global proxies that point to untrusted endpoints.

Like a lobster shell, security has layers — review code before you run it.

Current versionv1.0.1
Download zip
latestvk97eshr8athckdhjhv68wvq5ys82sy8j

License

MIT-0
Free to use, modify, and redistribute. No attribution required.

Runtime requirements

⛏️ Clawdis
Binspython3, curl

SKILL.md

Prospector - 潜在客户挖掘器

快速开始

用户只需描述目标客户,即可自动搜索并提取联系方式:

用户:帮我找上海地区的软件外包公司
用户:搜索北京的人工智能企业,需要50家
用户:找一些外贸公司,规模大一点的
用户:继续找更多软件公司(翻页搜索)
用户:查看已收集的客户列表
用户:搜索包含"阿里"的客户

工作流程

找客户流程

Step 1: 解析需求

  • 提取关键词:行业、产品、服务类型
  • 提取地区:城市、省份、国家
  • 提取数量:需要多少家

Step 2: 检查缓存

  • 检查是否有相同关键词的缓存结果
  • 缓存有效期:7天
  • 如果有缓存,直接返回,避免重复搜索

Step 3: 搜索公司

  • 调用 scripts/search_companies.py
  • 使用多搜索引擎:Google、DuckDuckGo、Bing、百度、Searx
  • 支持代理访问(Google等需要代理)
  • 返回公司名称、域名、简介

Step 4: 排重处理

  • 检查公司是否已存在于数据库
  • 跳过已处理的公司
  • 只处理新公司

Step 5: 提取邮箱

  • 调用 scripts/extract_emails.py
  • 爬取官网页面提取邮箱
  • WHOIS查询域名注册信息
  • 缓存邮箱结果

Step 6: 输出结果

  • 结构化JSON格式
  • 可选CSV导出
  • 统计汇总信息

查询客户流程

Step 1: 解析查询意图

  • 列表查询:列出已收集的客户
  • 关键词搜索:按公司名搜索
  • 邮箱搜索:按邮箱关键词搜索
  • 统计查询:查看数据统计

Step 2: 从缓存读取

  • 从本地缓存读取客户数据
  • 支持多种筛选条件

Step 3: 返回结果

  • 表格或JSON格式
  • 支持导出

使用示例

找客户示例

示例1:首次搜索

用户:帮我找10家上海的SaaS公司

执行:
1. 搜索 "上海 SaaS公司"
2. 提取邮箱
3. 缓存结果
4. 返回结果

输出:
📊 搜索结果
━━━━━━━━━━━━━━━━━━━━━━━━━━
✅ 找到公司:10家
✅ 有效邮箱:7个

📈 累计数据:
   总公司数:10
   总邮箱数:7

示例2:再次搜索相同关键词

用户:帮我找上海的SaaS公司

执行:
1. 检查缓存 → 发现缓存
2. 使用缓存结果
3. 跳过已存在的公司

输出:
📦 使用缓存结果 (10 家公司)
⏭️ 跳过 10 家已存在的公司
✅ 待处理 0 家公司

示例3:翻页搜索更多

用户:继续找更多上海的SaaS公司

执行:
1. 翻页偏移:跳过前10条
2. 搜索新的结果
3. 跳过已存在的公司
4. 返回新公司

输出:
🔍 搜索: 上海 SaaS公司
   翻页偏移: 10
⏭️ 跳过 3 家已存在的公司
✅ 待处理 7 家公司

查询客户示例

示例4:列出所有客户

用户:查看已收集的客户列表

执行:
python scripts/query_customers.py list --limit 20

输出:
📋 客户列表 (共 50 家)

序号  公司名称                          域名                       邮箱                            
────────────────────────────────────────────────────────────────────────────────────────
1     XX科技有限公司                     xx.com                     contact@xx.com, sales@xx.com
2     YY信息技术有限公司                   yy.com                     info@yy.com
...

示例5:按关键词搜索客户

用户:搜索包含"阿里"的客户

执行:
python scripts/query_customers.py search "阿里"

输出:
🔍 搜索结果: 阿里 (共 3 家)

• 阿里巴巴科技有限公司
  邮箱: contact@alibaba.com

• 阿里云智能有限公司
  邮箱: support@aliyun.com

示例6:按邮箱搜索

用户:查找包含"sales"的邮箱

执行:
python scripts/query_customers.py email sales

输出:
📧 邮箱搜索: sales (共 15 家)

• XX科技有限公司
  匹配: sales@xx.com

示例7:查看数据统计

用户:查看已收集的客户数据统计

执行:
python scripts/query_customers.py stats

输出:
📊 数据统计
========================================
总公司数: 50
总邮箱数: 35
搜索次数: 5
有邮箱公司: 30
邮箱覆盖率: 60.0%

示例8:导出数据

用户:导出所有客户数据

执行:
python scripts/query_customers.py export --output customers.json --csv customers.csv

输出:
✅ 已导出 50 条数据到 customers.json
✅ 已导出 50 条数据到 customers.csv

缓存机制

缓存内容

  • 搜索结果缓存(按关键词+地区)
  • 公司信息缓存(按域名)
  • 邮箱缓存(按域名)

缓存有效期

  • 搜索缓存:7天
  • 公司信息:永久
  • 邮箱信息:永久

缓存位置

AutoFindCustomer/
└── cache/
    ├── companies.json    # 公司数据库
    ├── searches.json     # 搜索缓存
    └── emails.json       # 邮箱缓存

命令行参数

找客户命令

# 基本搜索
python scripts/find_customers.py "软件开发" --region "上海" --limit 20

# 不使用缓存
python scripts/find_customers.py "软件开发" --no-cache

# 不跳过已存在的公司
python scripts/find_customers.py "软件开发" --no-skip

# 翻页搜索(获取更多不同结果)
python scripts/find_customers.py "软件开发" --page 10

# 查看缓存统计
python scripts/find_customers.py --stats

# 导出结果
python scripts/find_customers.py "软件开发" --output results.json --csv results.csv

查询客户命令

# 列出客户
python scripts/query_customers.py list --limit 20

# 只显示有邮箱的客户
python scripts/query_customers.py list --has-email

# 只显示无邮箱的客户
python scripts/query_customers.py list --no-email

# JSON格式输出
python scripts/query_customers.py list --json

# 按关键词搜索
python scripts/query_customers.py search "关键词" --region "上海"

# 按邮箱搜索
python scripts/query_customers.py email "sales"

# 查看统计
python scripts/query_customers.py stats

# 导出数据
python scripts/query_customers.py export --output export.json --csv export.csv

输出格式

JSON格式

{
  "query": "上海 软件公司",
  "total_companies": 50,
  "total_emails": 35,
  "email_coverage": "70.0%",
  "results": [
    {
      "name": "XX科技有限公司",
      "domain": "xx.com",
      "url": "https://xx.com",
      "emails": ["contact@xx.com", "sales@xx.com"],
      "description": "专业软件开发服务"
    }
  ]
}

CSV格式

公司名称,域名,邮箱,网址,简介
XX科技有限公司,xx.com,contact@xx.com,https://xx.com,专业软件开发服务
YY信息技术有限公司,yy.com,sales@yy.com,https://yy.com,IT解决方案

职责边界

✅ 负责

  • 搜索潜在客户
  • 提取联系方式
  • 验证邮箱格式
  • 简单查询客户数据
  • 导出客户数据
  • 数据统计

❌ 不负责

  • 发送邮件(由其他Skill处理)
  • 复杂客户管理(标签、分类、跟进状态)
  • 客户备注记录
  • 发送历史追踪
  • 回复状态管理

与其他Skill配合

找到客户后,可以使用其他Skill进行后续操作:

用户:帮我找上海的外贸公司,然后给每家公司发一封开发信

Agent会:
1. 调用 auto-find-customer Skill 找客户
2. 调用 send-email Skill 发邮件

复杂客户管理建议使用专门的CRM工具或独立的customer-manager Skill。

注意事项

  1. 搜索速度受网络影响,建议控制并发
  2. 部分网站可能无法访问,会自动跳过
  3. 邮箱提取成功率约60-70%
  4. 建议搜索后人工复核关键客户
  5. 缓存数据会累积,形成客户资产
  6. 使用 --page 参数可以获取更多不同结果
  7. 简单查询功能在此Skill内,复杂管理建议使用CRM系统

搜索引擎说明

支持的搜索引擎

引擎代理需求地区限制说明
Google✅ 需要中国、伊朗、朝鲜、俄罗斯结果质量最高
DuckDuckGo❌ 无需推荐使用
Bing❌ 无需中国结果质量较好
百度❌ 无需适合中文搜索
Searx❌ 无需开源元搜索引擎

代理设置

如果用户在中国大陆等需要代理的地区,需要设置代理:

# 环境变量方式
export HTTPS_PROXY=http://127.0.0.1:7890
export HTTP_PROXY=http://127.0.0.1:7890

# 或命令行参数
python scripts/search_companies.py "software company" --proxy http://127.0.0.1:7890

地区推荐

  • 中国大陆:使用百度、DuckDuckGo、Searx(无需代理)
  • 海外:可使用所有搜索引擎,Google 效果最佳
  • 俄罗斯:使用 DuckDuckGo、Bing、Searx(Google 被屏蔽)

Files

12 total
Select a file
Select a file to preview.

Comments

Loading comments…