Install
openclaw skills install shwuyechaxunhetongdaoqi查询上海市物业项目合同到期信息,提取招标公告合同期限和中标/评标日期,计算合同到期时间并生成CSV。
openclaw skills install shwuyechaxunhetongdaoqi这个技能用于查询上海市物业项目的合同到期信息,通过分析招标公告、中标公告和评标结果公告,提取合同期限和中标日期,计算合同到期时间。
适用场景:
1. 搜索指定区域的物业项目
2. 分类整理招标公告、中标公告、评标结果公告
3. 下载PDF文件
4. OCR识别PDF内容
5. 提取合同期限和中标日期
6. 计算合同到期时间
7. 生成CSV结果文件
现象:
原因:
解决方案:
# 增加评标结果公告的处理
projects[project_name] = {
'招标公告': [],
'中标公告': [],
'评标结果公告': [] # 新增
}
# 优先级逻辑
if 中标公告存在:
使用中标公告的日期
elif 评标结果公告存在:
使用评标结果公告的日期
效果:
现象:
原因:
解决方案:
# 增加多种日期格式的正则表达式
patterns = [
r'(\d{4})年(\d{1,2})月(\d{1,2})日', # 2024年7月2日
r'(\d{4})-(\d{1,2})-(\d{1,2})', # 2024-07-02
r'(\d{1,2})月(\d{1,2})日', # 7月2日(假设当前年份)
r'(\d{2})年(\d{1,2})月(\d{1,2})日', # 24年7月2日
]
现象:
原因:
解决方案:
# 增加重试机制
for attempt in range(3):
try:
response = requests.get(pdf_url, timeout=30)
if response.status_code == 200:
break
except:
time.sleep(2)
~/.openclaw/workspace/skills/shwuyeyanjiu/scripts/batch_extract_dates.py:初版脚本batch_extract_dates_v2.py:改进版脚本(增加评标结果公告处理)requests # HTTP请求
beautifulsoup4 # HTML解析
pdf2image # PDF转图片
pytesseract # OCR识别
python-dateutil # 日期处理
cd ~/.openclaw/workspace/skills/shwuyeyanjiu/scripts
uv run --with requests --with beautifulsoup4 --with pdf2image --with pytesseract --with python-dateutil python3 batch_extract_dates_v2.py
数据源的重要性
用户反馈的价值
OCR识别的挑战
批量处理的注意事项
# 运行改进版脚本
python3 batch_extract_dates_v2.py
# 结果文件
jingan_contract_dates_v2.csv
项目名称,合同期限,中标日期,合同到期时间,备注
微星彭浦公寓,3,2023-04-21,2026-04-30, (日期来源: 评标结果公告)
市北云盛公寓,3,2023-04-08,2026-04-30, (日期来源: 评标结果公告)
闸北区339街坊北上海物流号地块配套商品房,2,2024-07-02,2026-07-31, (日期来源: 中标公告)
提高OCR识别准确率
增加数据验证
支持更多区域
实时更新
技能创建时间:2026-04-08 创建者:傲小喵 (Ao Xiao Miao) 🐱