# 数据源与采集规范

> 数据采集核心原则：每类数据必须从指定来源获取，禁止凭记忆填写价格、财务数据。

---

## 数据源 A — 实时行情（最高优先级，当天必须最新）

**主力来源（按优先级依次尝试，国内可直接访问）：**

来源 1（优先 fetch，数据最全）：
- 东方财富个股页：`https://quote.eastmoney.com/{交易所代码}{股票代码}.html`
- 沪市前缀 sh，深市前缀 sz
- 示例：贵州茅台 → `https://quote.eastmoney.com/sh600519.html`

来源 2（备选 fetch）：
- 新浪财经：`https://finance.sina.com.cn/realstock/company/{交易所}{代码}/nc.shtml`

来源 3（备选 fetch）：
- 腾讯财经：`https://gu.qq.com/{交易所}{代码}`
- 同花顺：`https://stockpage.10jqka.com.cn/{代码}/`

来源 4（LLM 自主判断搜索）：
- 搜索词：`"{股票名称} {代码} 实时行情 股价 东方财富/新浪财经/同花顺"`

失败兜底：不要卡在此步骤超过90秒，直接跳转备用搜索方案。

**价格数据权威性规则（重要）：**
- 数据源A获取的实时价格（API/行情页提取）是本次分析的**唯一价格基准**
- 后续步骤B/C/D/E等搜索结果中出现的价格（如新闻摘要里的"收盘价"）仅供**辅助参考**，不得用于覆盖或替换数据源A的价格
- 报告中所有"最新价""当前价"字段必须使用数据源A的值

**提取字段：**

| 字段 | 示例值 | 说明 |
|------|--------|------|
| 今日价格 | 8.33 | 大号价格数字 |
| 涨跌幅 | +0.85% | 价格右侧括号内 |
| 昨收 | 8.26 | — |
| 开盘 | 8.26 | — |
| 今日区间 | 8.26-8.36 | — |
| 52周区间 | 8.10-9.28 | — |
| 成交量 | 4.01M | — |
| 3月均量 | 9.42M | 计算量比用 |
| 市值 | 5.31B | — |
| 总股本 | 642.78M | — |
| PE | 17.9 / 亏损 | 亏损时标注 N/A |
| PB | 1.21 | — |
| EV/EBITDA | 7.02 | — |
| ROE | 6.9% | — |
| ROA | 5.5% | — |
| 毛利率 | 32.7% | — |
| EPS | 0.46 | — |
| 每股净资产 | 6.88 | 计算净资产底部用 |
| 股息率 | 2.66% | — |
| 年派息额 | 0.22 | Dividends 区域 |
| RSI(14) | 45.54 | — |
| 技术信号（日/周/月） | 强力卖出 | — |

**备用搜索（fetch 失败时）：**
```
搜索词 1："{股票名称} {代码} 今日收盘 {YYYY年M月D日}"
搜索词 2："{股票名称} {代码} 股价 {YYYY年M月D日} 证券之星"
目标：证券之星/东方财富任一有今日具体价格和量能数据的结果
```

**必须计算的衍生指标：**
```
52周定位% = (今日价 - 52周低) / (52周高 - 52周低) × 100%
  0~20% = 底部区域 | 20~40% = 低位区 | 40~60% = 中位区 | 60~80% = 高位区 | 80~100% = 顶部区域

量比 = 今日成交量 / 3个月日均成交量
  <0.5 = 极度缩量 | 0.5~0.8 = 缩量 | 0.8~1.2 = 正常 | 1.2~2.0 = 温和放量 | >2.0 = 明显放量 | >5.0 = 极度放量

较发行价涨跌% = (今日价 - 发行价) / 发行价 × 100%（如已知发行价）
```

---

## 数据源 B — 资金流向与龙虎榜

```
搜索 B1（资金流向，取最近1~3个交易日）：
  词："{股票名称} {代码} {M月D日} 主力资金"
  来源：证券之星 stock.stockstar.com
  提取：主力/游资/散户净流入或流出、换手率、成交量、成交额

搜索 B2（龙虎榜，涨跌停或高换手日）：
  词："{股票名称} 龙虎榜 {月份}"
  来源：新浪财经
  提取：机构/游资席位净买入或净卖出、上榜原因

搜索 B3（融资融券）：
  词："{股票名称} 融资余额 {月份}"
  提取：融资余额（亿元）、融资净买入额、融资余额/流通市值比
  警戒线：融资余额/流通市值 > 5% = 杠杆风险偏高
```

**换手率解读标准：**
```
< 1%    成交清淡，无主力关注
1~3%    正常低活跃
3~8%    中度活跃，有资金参与
8~15%   高度活跃，短线资金介入
> 15%   极度活跃，警惕高换手+高位的出货组合
```

---

## 数据源 C — 财务数据（最新报告期）

```
搜索 C1（三季报/年报核心摘要，首选）：
  词："{股票名称} {代码} 三季报 营收 净利润 同比 {YYYY年}"
  或："{股票名称} {代码} 年报 营收 净利润 {YYYY年}"

搜索 C2（业绩预告/快报）：
  词："{股票名称} 业绩预告 {YYYY年}"
  词："{股票名称} 2025年度 归母净利润 预计"

搜索 C3（主营业务结构）：
  词："{股票名称} 主营业务 营收结构 占比 {YYYY年}"
```

**必须提取的8个财务字段：**
1. 营业收入（本期/同比%）
2. 归母净利润（本期/同比%）← 最重要
3. 扣非净利润（本期/同比%）
4. 非经常性损益 = 归母净利 - 扣非净利（差值>净利20%需解释原因）
5. 单季度营收和净利润（判断加速/减速趋势）
6. 毛利率（判断议价能力和成本压力）
7. 资产负债率（<40%=安全，40~60%=一般，>60%=偏高）
8. 财务费用（负值=净存款利息，说明账上现金充裕）

---

## 数据源 D — 重大公告与事件（近3个月）

```
D1（合同/订单/中标）："{股票名称} 中标 合同 订单 {YYYY年}"
D2（股东变动）："{股票名称} 大股东 减持 增持 {YYYY年}"
D3（监管处罚/立案）："{股票名称} 处罚 违规 立案 证监局 {YYYY年}"
D4（产能/技术进展）："{股票名称} 产能 投产 复产 技术突破 {YYYY年}"
```

---

## 数据源 E — 行业景气与政策

```
E1（产品价格）：根据公司主业替换关键词
  盐化工 → "元明粉 工业盐 价格 {YYYY年} 最新"
  光纤 → "光纤 G652 价格 涨跌 供需缺口 {YYYY年}"
  白酒 → "飞天茅台 批价 渠道价 {YYYY年}"
  铜/铝材 → "伦铜 铝价 {YYYY年} 最新"
  光伏 → "硅料 组件 价格 {YYYY年}"

E2（行业政策）："{行业关键词} 政策 补贴 规划 {YYYY年}"
E3（供需格局）："{行业关键词} 产能 供给 需求 格局 {YYYY年}"
```

---

## 数据源 F — ST/退市专项（仅ST股执行）

```
F1："{公司名称} ST 处罚决定书 摘帽条件 {YYYY年}"
F2："{公司名称} 年报 追溯调整 财务重述"
F3："{公司名称} 退市 强制退市 重大违法"
```

**关键判断点：**
1. 处罚文书类型：「事先告知书」= 尚未定案；「正式决定书」= 12个月倒计时从此起算
2. 摘帽最短路径：正式决定书 → 满12个月 + 追溯调整年报经审计确认 → 申请撤销风险警示
3. 退市风险判断：重大违法强制退市条件（财务造假金额/净资产>50%，或/营业收入>50%，或连续多年造假）
4. 可转债影响：ST后暂停转股；正股价持续低于转股价70%达30交易日触发回售

---

## 数据源 G — 基础信息（首次分析必做）

```
G1："{股票名称} {代码} 发行价 上市日期 总股本"
G2："{股票名称} 控股股东 实际控制人 持股比例"
G3："{股票名称} 股东户数 {最近日期}"
```

提取：上市日期、IPO发行价、控股股东名称和持股比例、实际控制人类型、最新股东户数及增减。

---

## 数据源 H — 技术面信号

**国内来源（按优先级尝试）：**

```
来源 1：同花顺技术指标
  fetch：https://stockpage.10jqka.com.cn/{代码}/
  或搜索："{股票名称} {代码} MACD KDJ RSI 技术指标"

来源 2：东方财富技术分析
  fetch：https://quote.eastmoney.com/{交易所}{代码}.html

来源 3：LLM 自主搜索
  "{股票名称} {代码} 技术指标 MACD KDJ RSI {YYYY年M月D日}"
```

**提取字段：**
- 各周期信号：30分/1小时/日线/周线/月线（强力买入/买入/中性/卖出/强力卖出）
- RSI(14)：>70超买 | 50~70偏强 | 45~55中性 | 30~45偏弱 | <30超卖
- MACD（DIF/DEA/柱状线）、KDJ（K/D/J值）、BOLL（上轨/中轨/下轨）
