正在解码 97,220 位受访者

政策风洞 · 预测精度仪器

这是一台仪器,不是神谕。

我们模拟一群真实的人,只问:一记政策冲击带来的分党派意见分化,能不能被预测?每个发光的点是一位真实的美国受访者,按左右政治倾向着色。

⚗ 仅在堕胎 / Dobbs 上校准验证。「pro-choice 份额」是验证靶(Gallup 量的就是它)。其余议题仅作示意。

⚡ 同一道盲测,分人群预测比直接问 GPT 准 3 倍(误差 0.030 vs 0.087)· out-of-sample
校准等级
做什么:在真实 WVS 上预测分党派 pro-choice 份额。怎么做:聚类→种子→冲击→聚合(pwt,95 测试)。能否信:方向 ✓、基线 ✓、差异符号转移 85%,但 MAE 与基线打平 0.037≈0.037 —— 仅限 Dobbs。

1 真实事件 · 2022 Dobbs

最高法院推翻 Roe 之后,真实民调里发生了什么真实数据 · 非模拟
民主党6982+13
独立派4451+7
共和党3032+2
全体4955+6
% 自认 pro-choice · 来源 Gallup Values & Beliefs / Pew(2021 → 2022)· 每 100 人

按下「回放」,下面这台地球会让这 2,596 位真实美国受访者动起来,把这次真实的立场迁移演给你看 —— 头条数字就是上面 Gallup 实测的真值。

2 回放

待命 ·回合 0/4 ·0 人已模拟 ·0:00
受访者反应(真实 WVS 受访者) 0
活动测量区
校准等级
校准:堕胎/Dobbs · 方向 ✓ · 基线 ✓ · 量级:仅区间 · MAE 0.037(= 均匀基线 0.037)
原理与证据

图 3 — 大白话判读

运行一次模拟,这里会用大白话告诉你「刚才发生了什么」。

02 各子群分布

图 2 — 各党立场分布

民主党、独立派、共和党,每一群都横跨从 pro-life 到 pro-choice 的整条光谱。头条数字只数中线(0.5)右侧那块人。一记冲击把所有人往一个方向推,有些人越过中线,头条数字就翻了。

仅区间 · 量级外生(新闻显著度)
虚线是均匀基线。看它始终压在模型线上 —— 强度加权与它不分离(示意)。
子群基线模型 模型ΔGallup Δ判定
NOTE
这个画布是一台示意仪器。基线占比是真实 Gallup 数字;点击后的动态是简化的演示,用来建直觉,而非后端。

04 验证账本

它通过了什么 —— 又在哪里打平。

通过

方向 ✓ · 基线份额对齐 Gallup ✓ · 差异化符号 out-of-sample 在 2 个独立冲击(移民 + 法院信任)上转移 · 极化差异符号 8/8 · 全折 17/20 = 85%

零结果
强度加权 MAE 0.037
均匀基线 0.037

在分党派绝对 MAE 上,强度加权并不比均匀基线更好。冲击的量级是外生的(由新闻显著度驱动)→ 我们报告一个区间,绝不报一个点。这是我们最引以为傲地如实说出的结果。

方向
✓ 对上
差异符号
✓ 转移(85%)
量级 MAE
✗ 与基线打平

05 它生效的范围

仅在堕胎 / DOBBS 上校准与验证。「pro-choice 份额」是验证靶 —— Gallup 量的正是它。Dobbs 是能找到的最干净的自然实验(一记突发冲击 + 分党派事前/事后真值)。模拟器里其余议题仅作示意。真 LLM 扮演那条路在差异化上仍 NO-GO。