Commit b4b9fef0 by luoqi

fix(manifest): bump default_limit 500k → 2M(全量 dry-run 实测)

13 万患者 dry-run:
  appointment 500,000 ← 截断(实际估 130 万)
  diagnosis   499,068 ← 截断(实际估 100 万)
导致 plan 引擎漏关键事实。Node heap 已 8GB 足够撑住 200 万行。
parent 45bdf986
...@@ -71,8 +71,9 @@ sql_source: ...@@ -71,8 +71,9 @@ sql_source:
password_env: DW_CLICKHOUSE_PASSWORD password_env: DW_CLICKHOUSE_PASSWORD
# 1000 cohort 患者 settlement 总行 ~ 20 万(p50=12/患者,max=11.6 万/异常患者) # 1000 cohort 患者 settlement 总行 ~ 20 万(p50=12/患者,max=11.6 万/异常患者)
# 100k 会截一半数据,关键事实(吴建康 61 行种植结算)被丢失 → scenario 错召回 # 100k 会截一半数据,关键事实(吴建康 61 行种植结算)被丢失 → scenario 错召回
# W3 末 demo 调到 500k,长期(生产)走增量 pull(cursor)替代一次性拉 # 全量(13 万患者)dry-run 实测:appointment / diagnosis 单表 ~100-130 万行
default_limit: 500000 # → 200 万兜底(Node heap 8GB 够),长期(生产)走增量 pull(cursor)替代一次性拉
default_limit: 2000000
# W4 末:DW 增量配置(sync-incremental CLI 用) # W4 末:DW 增量配置(sync-incremental CLI 用)
# 跑全量(cold-import)时本段忽略;跑增量时按 per_query 注入 WHERE # 跑全量(cold-import)时本段忽略;跑增量时按 per_query 注入 WHERE
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment