政策风洞 · 预测精度仪器

这是一台仪器,不是神谕。

我们模拟一群真实的人,只问:一记政策冲击带来的分党派意见分化,能不能被预测?每个发光的点是一位真实的美国受访者,按左右政治倾向着色。

⚗ 仅在堕胎 / Dobbs 上校准验证。「pro-choice 份额」是验证靶(Gallup 量的就是它)。其余议题仅作示意。

校准等级

做什么:在真实 WVS 上预测分党派 pro-choice 份额。怎么做:聚类→种子→冲击→聚合(pwt,95 测试)。能否信:方向 ✓、基线 ✓、差异符号转移 85%,但 MAE 与基线打平 0.037≈0.037 —— 仅限 Dobbs。

1 真实事件 · 2022 Dobbs

最高法院推翻 Roe 之后,真实民调里发生了什么真实数据 · 非模拟

民主党69 → 82+13

独立派44 → 51+7

共和党30 → 32+2

全体49 → 55+6

% 自认 pro-choice · 来源 Gallup Values & Beliefs / Pew(2021 → 2022)· 每 100 人

按下「回放」,下面这台地球会让这 2,596 位真实美国受访者动起来,把这次真实的立场迁移演给你看 —— 头条数字就是上面 Gallup 实测的真值。

2 回放

待命 ·回合 0/4 ·0 人已模拟 ·0:00

受访者反应(真实 WVS 受访者) 0

活动测量区

校准等级

校准:堕胎/Dobbs · 方向 ✓ · 基线 ✓ · 量级:仅区间 · MAE 0.037(= 均匀基线 0.037)

原理与证据 ↓

02 各子群分布

图 2 — 各党立场分布

民主党、独立派、共和党,每一群都横跨从 pro-life 到 pro-choice 的整条光谱。头条数字只数中线(0.5)右侧那块人。一记冲击把所有人往一个方向推,有些人越过中线,头条数字就翻了。

仅区间 · 量级外生(新闻显著度)

虚线是均匀基线。看它始终压在模型线上 —— 强度加权与它不分离(示意)。

子群	基线	模型	模型Δ	Gallup Δ	判定

NOTE

这个画布是一台示意仪器。基线占比是真实 Gallup 数字;点击后的动态是简化的演示,用来建直觉,而非后端。

04 验证账本

通过

方向 ✓ · 基线份额对齐 Gallup ✓ · 差异化符号 out-of-sample 在 2 个独立冲击(移民 + 法院信任)上转移 · 极化差异符号 8/8 · 全折 17/20 = 85%

零结果

强度加权 MAE 0.037

≈

均匀基线 0.037

在分党派绝对 MAE 上,强度加权并不比均匀基线更好。冲击的量级是外生的(由新闻显著度驱动)→ 我们报告一个区间,绝不报一个点。这是我们最引以为傲地如实说出的结果。

方向

✓ 对上

差异符号

✓ 转移(85%)

量级 MAE

✗ 与基线打平

05 它生效的范围

仅在堕胎 / DOBBS 上校准与验证。「pro-choice 份额」是验证靶 —— Gallup 量的正是它。Dobbs 是能找到的最干净的自然实验(一记突发冲击 + 分党派事前/事后真值)。模拟器里其余议题仅作示意。真 LLM 扮演那条路在差异化上仍 NO-GO。