Post

Auctions and Mechanism Design

⚠️ 本文尚在撰写中,内容未完成,后续会继续补充与修订。

本文是拍卖理论(auction theory)与机制设计(mechanism design)的期末速通笔记:深入浅出,但覆盖所有核心考点,每个定理都给准确陈述、关键定理给出证明、并配小例子。读完并复习后,应足以在期末考中拿到高分。

拍卖入门:模型与四种标准拍卖

本节是整个拍卖理论的地基。我们先回答一个根本问题:拍卖到底要解决什么问题?再建立刻画买家估值的两类价值模型,重点打磨独立私人价值模型 IPV。最后把四种标准拍卖(英式、荷式、一价密封、二价密封)的规则与信息结构讲透,为后续的均衡求解、收益等价定理(Revenue Equivalence Theorem)和最优机制设计(Optimal Mechanism Design)铺路。

一、拍卖要解决什么问题

设想一个卖家(seller,也称拍卖人 auctioneer)手里有一件不可分的物品(indivisible good),面对若干潜在买家(bidder)。卖家面临的核心困境是:

每个买家心里对这件物品都有一个愿意支付的最高金额(即估值 valuation),但卖家看不见这个数字,买家自己也不会主动说真话。

这就是一个信息不对称(information asymmetry)下的资源配置问题。拍卖(auction)本质上是一套博弈规则(game form / mechanism),它规定了“谁可以出价、怎么出价、谁拿走物品、每个人付多少钱”,目的是在卖家无法直接观察买家私有信息的前提下,把物品配置出去并收取价款。

卖家可能有不同目标,常见的两个是:

  • 效率(efficiency):把物品分配给估值最高的人,使社会总福利(social welfare)最大化。
  • 收益(revenue):让卖家自己的期望收入最大化。

这两个目标未必一致(后续最优拍卖一节会看到,为了榨取收益,卖家有时会故意设置保留价 reserve price,从而牺牲一部分效率)。本节先不谈目标的权衡,只把模型和规则定义清楚。

为什么需要“理论”而不只是经验? 因为买家是策略性的(strategic):他们会预测规则带来的后果,反过来操纵自己的出价。比如在“出价最高者赢、付自己出价”的规则下,没有人会傻到出价等于自己的真实估值(那样赢了也赚不到钱),人人都会压低出价。卖家要预判这种博弈均衡(equilibrium)行为,才能正确评估一套规则的好坏。这正是拍卖理论的用武之地。


二、价值模型:私人价值 vs 共同价值

要分析拍卖,第一步是给“买家的估值从哪来”建模。两大极端范式如下。

1. 私人价值模型(private value model)

每个买家 $i$ 对物品有一个估值 $v_i$,这个数字只取决于他自己的偏好,与别人对物品的看法无关。即便买家 $i$ 事后知道了别人的估值,他自己的 $v_i$ 也不会改变。

直观理解:你竞拍一幅画纯粹是为了自己挂在客厅里欣赏,你愿意出多少钱只看你自己有多喜欢它,跟隔壁老王愿意出多少钱毫无关系。这就是私人价值。

2. 共同价值模型(common value model)

物品有一个对所有人都相同的、客观但未知的真实价值 $V$,每个买家只观测到一个关于 $V$ 的私有信号(private signal)$s_i$,并据此估计 $V$。此时别人的信号对我是有信息量的:如果我知道别人的信号,我会修正自己对 $V$ 的判断。

直观理解:竞拍一块海底石油开采权,这块油田里到底有多少油($V$)是一个客观事实,对谁都一样。但没人知道确切储量,每家公司只有自己勘探得到的一份地质报告(信号 $s_i$)。如果你知道别的公司勘探结果都很悲观,你也会下调自己的估计。

共同价值模型会引出著名的赢家诅咒(winner’s curse):赢得拍卖恰恰意味着你是所有人里把价值估得最高的那个,因此很可能高估了真实价值 $V$,赢了反而亏钱。理性买家必须为此预先压低出价。

赢家诅咒(winner’s curse)一句话:在共同价值拍卖中,“我赢了”本身就是一条坏消息(说明我估得过于乐观),理性人必须把这条坏消息提前算进出价里。

3. 一般框架:附属价值(affiliated values)

私人价值与共同价值是两个端点,现实往往介于二者之间。Milgrom 与 Weber(1982)提出的附属价值模型(affiliated values model)统一了二者:每个买家估值可以同时依赖自己的信号和别人的信号,且各信号之间存在正相关(附属 affiliation 是一种比正相关更强的统计性质)。本课程入门阶段不展开附属模型,先把私人价值这个干净的端点彻底吃透。


三、重点:独立私人价值模型 IPV

整个拍卖理论入门的标准工作母机就是独立私人价值模型(independent private values,简称 IPV)。它在私人价值的基础上再加两个干净的假设,使得分析变得可处理。

IPV 的完整假设清单

设有 $n$ 个买家(risk-neutral,风险中性,除非特别说明)。

  1. 私人价值(private value):买家 $i$ 的估值 $v_i$ 只取决于他自己,知道别人的估值不会改变 $v_i$。

  2. 独立(independent):各买家的估值 $v_1, v_2, \ldots, v_n$ 相互统计独立。我的估值高,并不意味着你的估值也倾向于高。

  3. 同分布(identically distributed):每个 $v_i$ 都从同一个分布 $F$ 中抽取,取值在区间 $[\underline{v}, \overline{v}]$ 上,分布函数为 $F(\cdot)$,密度函数为 $f(\cdot)=F’(\cdot)\gt 0$。常用的简化是 $v_i \sim U[0,1]$(区间 $[0,1]$ 上的均匀分布)。

  4. 私有信息(private information):$v_i$ 是买家 $i$ 的私有信息,别人(包括卖家)只知道它服从分布 $F$,看不到具体实现值。

  5. 共同知识(common knowledge):分布 $F$、买家数目 $n$、拍卖规则,这些都是所有人共同知道的。也就是说,“大家都不知道彼此的具体估值,但大家都知道彼此的估值从哪个分布来”是公共知识。

把上面 5 条记牢:“私人 + 独立 + 同分布 + 私有信息 + 分布是公共知识”。IPV 这五个字背后就是这套假设。

为什么独立同分布(i.i.d.)假设如此好用? 因为在 IPV 下,每个买家面对的是一个贝叶斯博弈(Bayesian game):我不知道对手的估值,但我知道它的分布,于是我可以对“对手会怎么出价”做概率期望。独立性保证我自己的估值 $v_i$ 不携带任何关于对手估值的信息,我的策略只需是“我的估值 $v_i$ 到我的出价 $b_i$”的一个函数 $b_i=\beta(v_i)$,分析大大简化。

一个关键的数学工具:序统计量(order statistics)

在 IPV 分析中,反复出现的量是 $n$ 个独立同分布随机变量里的最大值与次大值。把 $v_1, \ldots, v_n$ 从大到小排序,记第 $k$ 大的为 $v_{(k)}$,则:

  • $v_{(1)}$ 是最高估值(决定谁赢、决定效率)。
  • $v_{(2)}$ 是次高估值(在二价拍卖里决定赢家付多少钱)。

例如,$n$ 个 $U[0,1]$ 变量中最大值的期望为 $\dfrac{n}{n+1}$,次大值的期望为 $\dfrac{n-1}{n+1}$。这类公式在后面算卖家期望收益时会直接用上。

小例子(IPV 的味道):两个买家竞拍一件物品,估值都从 $U[0,1]$ 独立抽取。某次实现是 $v_1=0.7,\ v_2=0.4$。这两个数字是各自的私有信息:买家 1 知道自己是 $0.7$ 但不知道买家 2 是 $0.4$,他只知道对手是 $U[0,1]$ 的一个抽样。卖家两个数字都不知道,只知道二者都来自 $U[0,1]$。“谁该拿走物品才有效率”的答案显然是买家 1(估值更高),但在某些拍卖规则下,策略性出价会不会破坏这个效率结果,正是后续要分析的。


四、四种标准拍卖:规则与信息结构

历史上长期使用、且理论上被反复研究的有四种标准拍卖(standard auctions)。“标准”一词的精确含义是:物品总是分配给出价最高的买家(赢家规则相同),它们的区别只在于付款规则信息披露结构(出价过程是公开喊价还是密封)

下面逐一定义。统一记号:$n$ 个买家,买家 $i$ 的估值 $v_i$,出价 $b_i$。

(1)英式拍卖 English auction(公开升价,open ascending)

规则:价格从一个低起点开始公开地、连续地往上抬(可以由拍卖师叫价,也可以由买家轮流加价)。在每一个当前价格上,买家选择“继续留在场内”或“退出”。退出是不可逆的(退了就不能再回来)。当只剩最后一名买家时,拍卖结束。

  • 赢家:最后留在场内的那个买家(也就是愿意接受的价格最高的人,通常即估值最高者)。
  • 付款:赢家支付物品成交时的价格,约等于第二高估值那个买家退出时的价格(最后一个对手一退出,价格就停在那里,赢家无需再往上抬)。

信息结构公开(open)动态(dynamic)。每个买家能实时观察到价格在涨、以及别人何时退出。在私人价值下这些观察不影响自己的策略;但在共同价值下,“别人什么时候退出”会泄露别人的信号,是有信息量的。

英式拍卖的占优策略很直观:一直留在场内,直到价格涨到等于你自己的估值 $v_i$,到点就退出。这样你绝不会以高于估值的价格赢得物品,也绝不会在价格还低于估值时白白退出。结果是估值最高者以“次高估值”的价格赢得物品。

(2)荷式拍卖 Dutch auction(公开降价,open descending)

规则:价格从一个高得没人愿意接受的起点开始,公开地、连续地往下降。第一个喊“我要了(stop)”的买家立即赢得物品,拍卖结束。(名字来源于荷兰的鲜花拍卖市场。)

  • 赢家:第一个叫停的买家。
  • 付款:赢家支付他叫停时的那个价格,也就是他自己心里设定的那个出手价位

信息结构公开但信息贫乏。虽然过程是公开的,但在有人叫停之前,没有任何买家透露任何信息(大家都只是沉默地看着价格下降)。一旦有人叫停,拍卖立刻结束,后面的信息再也无从产生。因此荷式拍卖中买家实际上得不到任何对手的信息。

关键洞察(后面会专门证明):荷式拍卖与一价密封拍卖策略等价(strategically equivalent)。因为在荷式拍卖里,每个买家要做的唯一决策就是“我打算在哪个价位叫停”,这个价位必须在拍卖开始前就在心里定好;而且在叫停之前他得不到任何额外信息。这等同于事先把“叫停价”写进一个密封信封,这正是一价密封拍卖。

(3)一价密封拍卖 first-price sealed-bid auction(FPSB)

规则:每个买家在不知道别人出价的情况下,把自己的出价 $b_i$ 写下来密封提交。卖家拆开所有信封。

  • 赢家:出价最高者,即 $b_{(1)}=\max_i b_i$ 对应的买家。
  • 付款:赢家支付他自己的出价 $b_{(1)}$。输家不付钱。

信息结构密封(sealed)且静态(static)。出价同时提交、互不可见,没有任何动态信息交换。

策略要点:在 FPSB 中,如果你出价等于真实估值 $v_i$,那么即使赢了,“利润 = 估值 - 付款 = $v_i - v_i = 0$”,赢了也白赢。所以理性买家必然压价(bid shading),出价严格低于自己的估值。压多少取决于对手数目和分布,这是后续要解出的贝叶斯纳什均衡(Bayesian Nash equilibrium)。

小例子:两个买家,估值 $U[0,1]$,可以证明对称均衡出价函数是 $\beta(v)=\dfrac{v}{2}$(即各自出真实估值的一半)。若 $v_1=0.7,\ v_2=0.4$,则 $b_1=0.35,\ b_2=0.20$,买家 1 赢,付 $0.35$,利润 $0.7-0.35=0.35$。注意效率仍然成立(估值高者赢),但卖家收到的钱($0.35$)低于次高估值($0.4$)。

(4)二价密封拍卖 second-price sealed-bid auction / Vickrey 拍卖

规则:每个买家密封提交出价 $b_i$,卖家拆开所有信封。

  • 赢家:出价最高者。
  • 付款:赢家支付第二高的出价 $b_{(2)}$,而不是自己的出价。输家不付钱。

信息结构:与 FPSB 相同,密封、静态、出价互不可见。唯一区别是付款规则。

这种“赢家付次高价”的设计由经济学家 William Vickrey(1961,后获诺贝尔经济学奖)提出,因此又称 Vickrey 拍卖。它最迷人的性质是诚实出价是占优策略(这是下一节的核心定理,这里先给出陈述与证明骨架)。

定理(二价拍卖的占优策略):在二价密封拍卖中,无论其他买家如何出价,每个买家出价等于自己的真实估值($b_i=v_i$)是一个弱占优策略(weakly dominant strategy)

证明骨架(直观版,完整证明留待下一节):固定买家 $i$,把所有对手的最高出价记为 $p=\max_{j\neq i} b_j$。注意:买家 $i$ 是否赢、以及赢了付多少,都只取决于他的出价 $b_i$ 是否超过 $p$,而付款额恰好是 $p$,与 $b_i$ 的具体数值无关(这是二价规则的关键)。分两种情况看偏离真实估值是否有利:

  • 若 $v_i \gt p$:诚实出价 $b_i=v_i$ 能赢,利润 $v_i-p\gt 0$。任何 $b_i’\gt p$ 同样赢、同样付 $p$,无差异;任何 $b_i’\lt p$ 会输掉,利润降为 $0$,更差。
  • 若 $v_i \lt p$:诚实出价会输,利润 $0$。若强行抬价 $b_i’\gt p$ 去赢,则要付 $p\gt v_i$,利润 $v_i-p\lt 0$,反而亏损。

两种情况下,诚实出价都不劣于任何偏离,故 $b_i=v_i$ 弱占优。$\blacksquare$

这个结论极其重要:它意味着二价拍卖里买家不需要压价、不需要猜对手、不需要知道分布 $F$,无脑说真话就是最优的。这是一种激励相容(incentive compatible)的“防策略(strategy-proof)”机制。


五、四种拍卖的横向对照与初步联系

把规则放在一张表里对照(统一假设 IPV、风险中性):

拍卖信息结构赢家付款出价是否说真话
英式(升价)公开、动态留到最后者(≈估值最高)次高估值(对手退出价)占优:留到价格=$v_i$
荷式(降价)公开、几乎无信息第一个叫停者自己叫停的价格需压价
一价密封 FPSB密封、静态出价最高者自己的出价 $b_{(1)}$需压价
二价密封 Vickrey密封、静态出价最高者次高出价 $b_{(2)}$占优:$b_i=v_i$

从这张表里已经能读出后续两个关键定理的影子,这里先点破方向(证明在后面章节):

联系一:荷式 ≡ 一价密封(策略等价)。如前所述,荷式拍卖中每个买家唯一要做的决策就是事先定好“叫停价”,且过程中得不到任何对手信息。这与一价密封拍卖中“事先密封一个出价”在策略上完全一致。因此这两种拍卖对任何买家、在任何价值模型下都是策略等价的(这是一个不依赖均衡概念的强等价)。

联系二:英式 ≈ 二价密封(IPV 下结果等价)。在 IPV 下,英式拍卖中“留到价格涨到自己估值”是占优策略,结果是估值最高者以次高估值成交;二价拍卖中“出真实估值”是占优策略,结果也是估值最高者以次高估值成交。两者在 IPV 下产生相同的配置和相同的付款。注意这个等价只在私人价值下成立:到了共同价值模型,英式拍卖的动态信息披露会让它与静态的二价密封拍卖产生本质差异(赢家诅咒的处理方式不同)。

这两条联系把四种拍卖两两配对,为下一步证明收益等价定理(Revenue Equivalence Theorem,四种标准拍卖在 IPV 下给卖家带来相同的期望收益)做好了铺垫。


六、速记 / 考点小结

价值模型

  • 私人价值(private value):估值只取决于自己,知道别人的估值也不改变。典型:买画自己挂客厅。
  • 共同价值(common value):存在对所有人相同的客观价值 $V$,各人只有私有信号 $s_i$。典型:油田开采权。引出赢家诅咒(赢=我估得最高=很可能高估,须提前压价)。
  • 二者中间是 Milgrom-Weber 的附属价值(affiliated values)模型(入门不展开)。

IPV 五要素(必背):私人价值 + 独立(independent)+ 同分布(identically distributed,$v_i\sim F$ 于 $[\underline v,\overline v]$)+ 私有信息 + 分布 $F$ 与规则是公共知识。核心工具是序统计量,重点是最大值 $v_{(1)}$ 与次大值 $v_{(2)}$;$U[0,1]$ 的 $n$ 个变量中 $\mathbb{E}[v_{(1)}]=\frac{n}{n+1}$。

四种标准拍卖(“标准”=物品总是给出价最高者,区别只在付款与信息结构)

  1. 英式(English,升价公开):留到最后者赢,付次高估值;占优策略=留到价格等于自己估值再退出。
  2. 荷式(Dutch,降价公开):第一个叫停者赢,付自己叫停价;需压价;过程几乎不泄露信息。
  3. 一价密封(FPSB):出价最高者赢,付自己出价 $b_{(1)}$;需压价(bid shading),出价 $\lt $ 估值。
  4. 二价密封(Vickrey):出价最高者赢,付次高出价 $b_{(2)}$;诚实出价 $b_i=v_i$ 弱占优(激励相容 / strategy-proof)。

两条联系(考试高频)

  • 荷式 ≡ 一价密封:策略等价,对任何价值模型成立(不依赖均衡)。
  • 英式 ≈ 二价密封:仅在 IPV(私人价值)下结果等价;共同价值下因信息披露不同而分道扬镳。
  • 二者共同指向 收益等价定理(下一节核心)。

最易踩的考点

  • 二价拍卖的占优策略是“出真实估值”,证明关键在于“赢家付的价格 $p=\max_{j\neq i}b_j$ 与自己的出价无关”,分 $v_i\gt p$ 与 $v_i\lt p$ 两种情况论证偏离不利。
  • 一价拍卖出价等于估值会导致零利润,因此必须严格压价;千万别把一价的最优出价误写成 $b_i=v_i$。
  • “标准拍卖”四个字默认赢家是出价最高者,四者只在付款规则和公开/密封上不同。

出价均衡与策略等价

本节是整个拍卖理论的核心。我们要回答一个最朴素也最关键的问题:在不同的拍卖规则下,一个理性的买家到底应该出多少钱?答案会因规则而异,但背后有一条统一的逻辑主线,即每个买家都在权衡“提高赢面”与“降低成交价格”这两个相互冲突的目标。我们将依次分析二价拍卖(second-price auction)、一价密封拍卖(first-price sealed-bid auction),最后揭示四种经典拍卖之间的策略等价(strategic equivalence)关系。

为统一记号,全节都假设独立私人价值(Independent Private Values,简称 IPV)环境:买家 $i$ 对拍卖品有一个私人估值(valuation)$v_i$,它只对自己已知;各买家的估值相互独立,且从同一个分布中抽取(对称情形,symmetric case)。买家 $i$ 出价 $b_i$,其效用(utility)为准线性(quasilinear)形式

\[u_i = \begin{cases} v_i - p & \text{若 } i \text{ 赢得拍卖并支付 } p \\ 0 & \text{若 } i \text{ 未赢} \end{cases}\]

也就是说,买家是风险中性(risk neutral)的,只关心“估值减去实付价格”这个净盈余(surplus)。


一、二价 Vickrey 拍卖:如实报价是弱占优策略

规则回顾。 在二价密封拍卖(也叫 Vickrey 拍卖,Vickrey auction)中,所有买家同时密封提交一个出价;出价最高者赢得物品,但只需支付第二高的出价(second-highest bid)。这个“赢家付次高价”的设计是全节最反直觉、也最精妙的地方。

我们要证明的核心定理是:

定理(如实报价的弱占优性): 在二价拍卖中,无论其他买家如何出价,买家 $i$ 提交自己的真实估值 $b_i = v_i$ 都是一个弱占优策略(weakly dominant strategy)。即对任意自己的其他出价 $b_i’$ 和任意对手出价组合 $b_{-i}$,都有 $u_i(v_i, b_{-i}) \ge u_i(b_i’, b_{-i})$。

这里“弱占优”的“弱”字很重要:如实报价永远不会更差,但在某些情形下可能与别的出价打成平手(payoff 相同),所以是弱占优而非严格占优(strictly dominant)。

证明(逐情形论证)。 关键技巧是:固定对手的出价,记对手中的最高出价为

\[m = \max_{j \ne i} b_j .\]

注意 $m$ 完全不受 $i$ 自己出价的影响。买家 $i$ 能否获胜、以及(若获胜)支付多少,都只取决于他的出价 $b_i$ 与这个 $m$ 的比较。而一旦 $i$ 获胜,他支付的价格恰好就是 $m$(次高价),与他出价的具体数值无关。因此 $i$ 的策略选择实际上只是在“以价格 $m$ 买下”和“不买”之间做取舍。

我们把它和“如实报价 $b_i = v_i$”逐一对比。分两大方向讨论偏离。

情形 A:偏离到高于真值,即 $b_i’ \gt v_i$。

我们考察这个偏离相对于如实报价是否可能带来好处。结果只取决于 $m$ 落在哪个区间。

  • 若 $m \lt v_i$:如实报价时 $i$ 已经获胜,支付 $m$,盈余 $v_i - m \gt 0$。提高出价后仍然获胜,支付仍是 $m$,盈余不变。没有差别。
  • 若 $m \gt b_i’$:两种出价都输,盈余都是 $0$。没有差别。
  • 若 $v_i \lt m \lt b_i’$(这是偏离唯一“起作用”的区间):如实报价时 $i$ 会输(因为 $v_i \lt m$),盈余为 $0$;但抬价后 $b_i’ \gt m$ 使他获胜,支付 $m$,盈余为 $v_i - m$。由于 $m \gt v_i$,这个盈余是负的

结论:抬高报价要么毫无改变,要么让你“赢得一个本不该赢的、价格高于自己估值的物品”,从而蒙受亏损。所以 $b_i’ \gt v_i$ 绝不会优于如实报价。

情形 B:偏离到低于真值,即 $b_i’ \lt v_i$(压价)。

同样按 $m$ 的位置分类:

  • 若 $m \gt v_i$:两种出价都输,盈余都是 $0$。没有差别。
  • 若 $m \lt b_i’$:两种出价都赢,支付都是 $m$,盈余都是 $v_i - m$。没有差别。
  • 若 $b_i’ \lt m \lt v_i$(唯一起作用的区间):如实报价时 $i$ 获胜,支付 $m$,盈余 $v_i - m \gt 0$;但压价后他会输,盈余变成 $0$。由于 $v_i - m \gt 0$,他白白放弃了一笔本可赚到的正盈余。

结论:压低报价要么毫无改变,要么让你“输掉一个本来可以盈利成交的物品”。所以 $b_i’ \lt v_i$ 也绝不会优于如实报价。

综合 A、B 两个方向:任何对真值的偏离,在所有情形下都不会带来更高的效用,且在某些情形下严格更差。因此 $b_i = v_i$ 弱占优。$\blacksquare$

为什么是“弱”占优。 在上面每个方向里都存在“没有差别”的情形(例如 $m$ 离 $v_i$ 很远时,怎么出价结果都一样)。所以如实报价并不严格优于一切偏离,只是从不更差,这正是“弱占优”的含义。

直觉。 二价拍卖把“决定是否赢”与“决定付多少”这两件事解耦(decouple)了:你的出价只决定是否赢,而价格由别人决定。既然你的出价不影响成交价,那么唯一明智的做法就是用它精确地表达“在什么价位以下我愿意买”,这个临界价位恰好就是你的真实估值 $v_i$。报高了会让你在不该买时买(亏损),报低了会让你在该买时错过(损失盈余)。

小例子。 设你的估值 $v_i = 100$。

  • 对手最高出价 $m = 70$:如实报 $100$,你以 $70$ 成交,赚 $30$。若你改报 $80$,依旧以 $70$ 成交,还是赚 $30$,没必要冒险。
  • 对手最高出价 $m = 120$:如实报 $100$,你输,赚 $0$。若你贪心报 $130$ 想赢,则会以 $120$ 成交,亏 $20$。可见抬价害人。

因为如实报价是弱占优策略,二价拍卖被称为是激励相容(incentive compatible)/防策略(strategy-proof)的:每个买家最优地直接吐露真实估值,不需要去揣测别人。这也是 Vickrey 拍卖在机制设计中地位崇高的原因,它把复杂的博弈推理化简为“说真话”。


二、一价密封拍卖:贝叶斯纳什均衡出价函数

规则回顾。 一价密封拍卖中,所有买家同时密封出价,出价最高者赢,并支付自己出的价(first price,赢家付自己报的钱)。

现在如实报价 $b_i = v_i$ 显然是愚蠢的:因为成交价就是你自己报的价,报真值意味着盈余恒为 $0$,赢了也白赢。于是每个买家都会压价(bid shading),报一个低于真值的数。但压多少?压太狠会赢不了,压太轻又赚不到。这是一个真正的博弈:每个人的最优压价幅度依赖于别人的压价行为,没有占优策略,只能求贝叶斯纳什均衡(Bayes-Nash equilibrium,简称 BNE)。

模型设定(对称 IPV 基准案例)。 设有 $n$ 个买家,估值相互独立且都服从 $[0,1]$ 上的均匀分布(uniform distribution)。我们寻找一个对称、单调递增的均衡出价函数(bidding function)$b(\cdot)$,即每个买家都按同一个规则 $b_i = b(v_i)$ 出价,且 $b$ 关于估值递增。

推导(一阶条件法)。 考虑买家 $i$,真实估值为 $v$。假设其余 $n-1$ 个买家都采用均衡策略 $b(\cdot)$,而 $i$ 考虑“假装”自己估值是 $z$,即报价 $b(z)$(这是处理此类问题的标准技巧:把“选出价”转化为“选一个谎报的估值 $z$”)。

第一步,算赢的概率。由于 $b$ 递增,$i$ 报 $b(z)$ 能赢,当且仅当所有对手的报价都更低,即所有对手的估值都小于 $z$。每个对手估值小于 $z$ 的概率为 $z$(均匀分布的 CDF),$n-1$ 个相互独立,故

\[\Pr(\text{赢}) = z^{\,n-1} .\]

第二步,写期望效用。若赢,盈余为 $v - b(z)$;若输,盈余为 $0$。故

\[U(z; v) = z^{\,n-1}\,\bigl(v - b(z)\bigr).\]

第三步,最优性要求。均衡要求当 $i$ 的真值确实是 $v$ 时,最优的谎报就是说真话 $z = v$。对 $z$ 求一阶条件并在 $z = v$ 处取零:

\[\frac{\partial U}{\partial z} = (n-1)\,z^{\,n-2}\bigl(v - b(z)\bigr) - z^{\,n-1}\,b'(z) .\]

令 $z = v$ 并置零:

\[(n-1)\,v^{\,n-2}\bigl(v - b(v)\bigr) - v^{\,n-1}\,b'(v) = 0 .\]

两边同除 $v^{\,n-2}$(对 $v \gt 0$):

\[(n-1)\bigl(v - b(v)\bigr) = v\,b'(v),\]

整理成标准的一阶线性常微分方程(ODE):

\[v\,b'(v) + (n-1)\,b(v) = (n-1)\,v .\]

第四步,解 ODE。注意左边可以凑成全微分:把两边乘以 $v^{\,n-2}$,

\[v^{\,n-1} b'(v) + (n-1) v^{\,n-2} b(v) = (n-1) v^{\,n-1},\]

左边恰是 $\dfrac{d}{dv}\bigl[v^{\,n-1} b(v)\bigr]$。于是

\[\frac{d}{dv}\bigl[v^{\,n-1} b(v)\bigr] = (n-1)\,v^{\,n-1}.\]

两边积分,并用边界条件 $b(0)=0$(估值为 $0$ 的人出价为 $0$)确定积分常数:

\[v^{\,n-1} b(v) = (n-1)\cdot \frac{v^{\,n}}{n} = \frac{n-1}{n}\,v^{\,n}.\]

最终得到那个干净漂亮的结论:

均衡出价函数:

\[b(v) = \frac{n-1}{n}\, v .\]

在对称 IPV、估值 $\sim U[0,1]$ 的一价密封拍卖中,这是唯一的对称、递增贝叶斯纳什均衡。

解读与压价直觉。

  • 每个买家把报价压到真值的 $\dfrac{n-1}{n}$ 倍。压价幅度(shading)正是 $v - b(v) = \dfrac{v}{n}$,等于真值的 $\dfrac1n$。
  • 竞争越激烈,压价越少。 当 $n=2$ 时 $b(v)=\tfrac12 v$,对半砍;当 $n=10$ 时 $b(v)=0.9\,v$,几乎报满;当 $n\to\infty$ 时 $b(v)\to v$,压价消失,竞争把全部盈余榨干给了卖家。直觉很清楚:对手越多,赢的难度越大,你不得不报得更接近真值才有机会赢,压价的“安全空间”被竞争挤没了。
  • 赢面与利润的权衡(the trade-off)。 这是一价拍卖的灵魂。提高出价 $\Rightarrow$ 赢的概率 $z^{n-1}$ 上升(好事),但一旦赢成交价更高、单位利润 $v-b$ 下降(坏事)。最优出价就是让这两股边际力量相等的那一点。在上面的一阶条件里,第一项 $(n-1)z^{n-2}(v-b)$ 正是“多赢一点带来的额外利润”,第二项 $z^{n-1}b’$ 正是“为多赢而多付的成本”,均衡处二者抵消。

小例子。 两个买家($n=2$),均衡为 $b(v)=\tfrac12 v$。

  • 若你的估值 $v=0.8$,你报 $0.4$。
  • 假设对手估值 $0.6$,他报 $0.3$。你以 $0.4 \gt 0.3$ 获胜,支付自己报的 $0.4$,盈余 $0.8-0.4=0.4$。
  • 你没有报真值 $0.8$,因为那样即使赢了盈余也是 $0$;你也没敢只报 $0.1$,因为那样很容易输给对手。报 $\tfrac12 v$ 是在这两种极端之间的最优平衡。

收益等价定理预告(Revenue Equivalence Theorem): 一个惊人的事实是,在对称 IPV、风险中性等标准假设下,一价与二价拍卖给卖家带来的期望收益相同。直观验证:$n=2$、$U[0,1]$ 时,二价拍卖卖家期望收入是次高估值的期望 $=\tfrac13$;一价拍卖卖家期望收入是较高估值经压价后的期望 $=\mathbb{E}[\tfrac12 \max(v_1,v_2)] = \tfrac12\cdot\tfrac23 = \tfrac13$,完全一致。一价拍卖成交价高(报的是较高者)但有压价折扣,二价拍卖成交价低(付次高)但不压价,两种效应恰好抵消。


三、策略等价:四种拍卖的两两对应

经典拍卖有四种:英式(English,公开升价)、荷式(Dutch,公开降价)、一价密封、二价密封。它们看起来形式各异,但在 IPV 下可两两配对成“策略等价”。注意要区分两种强度不同的等价。

(1)英式拍卖 $\equiv$ 二价 Vickrey 拍卖(IPV 下的弱等价 / 结果等价)。

英式拍卖(English auction)即公开喊价、价格逐步攀升,买家不断决定“是否继续留在场内”,直到只剩一人,此人以“最后一个对手退出时的价格”成交。

在 IPV 下,英式拍卖中每个买家的(弱)占优策略是:一直留到价格涨到自己的真实估值 $v_i$ 为止,到点就退出

理由与二价拍卖如出一辙:只要当前价格低于 $v_i$,继续留着至少不亏;一旦价格超过 $v_i$ 还留着,赢了反而要付高于估值的钱。于是估值最高者获胜,而他成交时支付的价格,恰好是估值次高者退出时的价格,也就是次高估值 $\approx$ 次高价。这与二价拍卖的赢家和成交价完全一致。

  • 等价的性质: 两者有相同的占优策略结构、相同的赢家、相同的期望成交价。在私人价值环境下二者结果等价。
  • 微妙之处: 这种等价依赖 IPV。在共同价值(common value)或相关价值(affiliated values)环境下,英式拍卖中买家能从“别人何时退出”里读出信息、动态更新自己的估值(缓解赢家诅咒,winner’s curse),而密封的二价拍卖看不到这些信息。所以严格说英式与二价只是IPV 下的弱(结果)等价,并非任何环境下都等价。

小例子。 三个买家估值 $30, 50, 80$。价格从低往上爬:到 $30$ 第一人退出,到 $50$ 第二人退出,此刻只剩估值 $80$ 者,他以约 $50$ 成交(次高估值)。这与二价密封拍卖结果($80$ 者赢、付次高价 $50$)完全相同。

(2)荷式拍卖 $\equiv$ 一价密封拍卖(策略等价,且更强)。

荷式拍卖(Dutch auction)即价格从高往低降,喊价员从一个高价开始往下喊,第一个喊“我要”的人立即以当前价格成交

考虑一个买家在荷式拍卖中的决策:他唯一要做的,是事先决定“价格降到多少时我出手”。在那之前,他从对手身上学不到任何信息(没有人喊价就意味着价格还没降到任何人愿意接受的点,这只是个无信息的事实)。所以他的全部策略就浓缩成一个数:我的接受价位。而这正是密封一价拍卖里“我密封提交的出价”,谁的接受价位最高,谁先喊停、谁赢,且支付自己设定的那个价。

荷式拍卖与一价密封拍卖是策略等价(strategically equivalent)的:二者的策略空间一一对应(“接受价位” $\leftrightarrow$ “密封出价”),收益结构完全相同,因此具有完全相同的均衡。这种等价比英式 $\equiv$ 二价更强,它不依赖 IPV 假设,因为荷式拍卖在成交前根本不释放任何信息,与密封别无二致。

于是上一节算出的 $b(v)=\tfrac{n-1}{n}v$,对荷式拍卖同样适用:在 $U[0,1]$、$n$ 人时,你应在价格降到 $\tfrac{n-1}{n}v$ 时喊停。

小例子。 两人荷式拍卖,你的估值 $v=0.8$。由策略等价,你的接受价位应设为 $b(0.8)=\tfrac12\times0.8=0.4$。也就是说价格从高往下降、降到 $0.4$ 时你才出手,这与你在一价密封拍卖里密封报 $0.4$ 是同一回事。

两类等价的强弱对比(务必分清)。

配对等价类型是否依赖 IPV核心原因
英式 $\equiv$ 二价弱等价 / 结果等价依赖(仅在私人价值下成立)都让赢家付“次高价”,但英式在公开过程中会泄露信息
荷式 $\equiv$ 一价强等价 / 策略等价不依赖荷式成交前零信息,策略与密封一价一一对应

速记 / 考点小结

核心结论一句话版: 二价/英式让你“说真话”(弱占优),一价/荷式让你“压价” $b(v)=\tfrac{n-1}{n}v$(无占优策略,靠 BNE)。

必背要点(高频考点):

  1. 二价 Vickrey:如实报价 $b_i=v_i$ 是弱占优策略。 证明必须会写:固定对手最高价 $m=\max_{j\ne i}b_j$,分“抬价”与“压价”两方向逐情形讨论,指出偏离要么无差别、要么让你“赢了该输的(亏损)”或“输了该赢的(损失盈余)”。强调是占优(存在 payoff 相同的情形)。关键词:解耦“是否赢”与“付多少”、激励相容、防策略。

  2. 一价密封 BNE 推导四步要会复述:① 赢的概率 $=z^{n-1}$;② 期望效用 $U=z^{n-1}(v-b(z))$;③ 一阶条件在 $z=v$ 处取零,得 ODE $\;v b’ +(n-1)b=(n-1)v$;④ 凑全微分 $\frac{d}{dv}[v^{n-1}b]=(n-1)v^{n-1}$ 积分 + 边界 $b(0)=0$,得 $b(v)=\tfrac{n-1}{n}v$。

  3. 压价 shading 直觉: 提价 $\to$ 赢面 $z^{n-1}\uparrow$(利)但单位利润 $v-b\downarrow$(弊),均衡是二者边际相等点。压价幅度 $=v/n$;$n\uparrow$ 则压价 $\downarrow$,$n\to\infty$ 时 $b(v)\to v$(竞争榨干盈余)。

  4. 策略等价两对,强弱要分清:
    • 英式 $\equiv$ 二价:结果(弱)等价,赢家付次高价;依赖 IPV(英式过程会泄露信息,共同价值下不再等价)。占优策略:留到价格 $=v_i$ 再退。
    • 荷式 $\equiv$ 一价:策略等价(更强),“接受价位 $\leftrightarrow$ 密封出价”一一对应;不依赖 IPV(荷式成交前零信息)。
  5. 收益等价定理(Revenue Equivalence): 标准假设下一价与二价期望收益相同。记住 $n=2,\,U[0,1]$ 的数值对照:二价收入 $=\mathbb{E}[\text{次高}]=\tfrac13$;一价收入 $=\mathbb{E}[\tfrac12\max]=\tfrac13$。一价“成交价高但压价”、二价“不压价但付次高”,两效应抵消。

  6. 极易混淆的陷阱: 二价拍卖赢家付的是“第二高出价”不是自己的出价;一价拍卖赢家付的是“自己的出价”。荷式(降价)对应一价、英式(升价)对应二价,方向千万别记反。

收入等价定理(RET)与赢家诅咒

本节把第一价格、第二价格、英式、荷式四种标准拍卖在统一框架下“算总账”:它们看起来支付规则各异,但只要满足一组条件,给卖家带来的期望收入完全相同。这就是收入等价定理(Revenue Equivalence Theorem,RET)。随后我们转向共同价值环境,解释为何“赢家容易高估”,即赢家诅咒(Winner’s Curse)。


一、铺垫:独立私人价值与标准拍卖

在陈述定理前,先把环境讲清楚,否则定理的条件无从理解。

独立私人价值(Independent Private Values,IPV):每个买家 $i$ 对拍卖品有一个私人估值(valuation)$v_i$,表示“这件东西对我值多少钱”。“私人”指 $v_i$ 只由 $i$ 自己决定,知道别人的估值不会改变我对自己估值的看法;“独立”指各买家的估值相互独立抽取。每个 $v_i$ 独立同分布(independent and identically distributed,i.i.d.)地从同一个累积分布函数(cumulative distribution function,CDF)$F$ 中抽取,定义在区间 $[\underline{v}, \overline{v}]$ 上,密度(density)$f = F’$ 连续且处处为正。买家 $i$ 只知道自己的 $v_i$,但知道分布 $F$ 是公共知识(common knowledge)。

风险中性(risk neutral):买家最大化期望收益(expected payoff)的期望值,不对方差或不确定性额外定价。其效用为 $u_i = v_i - p_i$(中标且付 $p_i$)或 $u_i = 0$(未中标),即标准的拟线性(quasilinear)效用。

对称(symmetric):所有买家面对同一个分布 $F$,且采用同一个(对称)均衡策略(symmetric equilibrium strategy)$\beta(\cdot)$。

四种标准拍卖(standard auctions)回顾:

  • 第一价格密封拍卖(first-price sealed-bid auction,FPSB):出价最高者中标,付自己的出价。
  • 第二价格密封拍卖(second-price sealed-bid auction,SPSB,又称 Vickrey 拍卖):出价最高者中标,付第二高的出价。
  • 英式拍卖(English auction,升价公开拍卖):价格从低往上叫,最后留下者中标,付次高者退出时的价格。策略上等价于第二价格拍卖。
  • 荷式拍卖(Dutch auction,降价公开拍卖):价格从高往下降,第一个喊“我要”者中标,付当时的价格。策略上等价于第一价格拍卖。

关键观察:英式 $\equiv$ 第二价格,荷式 $\equiv$ 第一价格(这里 $\equiv$ 指“策略等价/同构”,即博弈的归约结果一致)。因此四种拍卖本质上只有两个支付家族。RET 的惊人之处在于:这两个家族的期望收入也相等


二、收入等价定理:准确陈述

先给一般版本,再给“四种拍卖”的推论。

定理(收入等价定理,Revenue Equivalence Theorem) 考虑 IPV 环境,买家对称、风险中性,估值 i.i.d. 抽自具有连续正密度的分布 $F$。设有两种拍卖机制,它们存在贝叶斯纳什均衡(Bayesian Nash equilibrium,BNE),且满足: (一)相同的分配规则(allocation rule):在均衡中,物品总是分配给估值最高的买家(即都是有效分配,且分配函数相同); (二)相同的边界支付(boundary payment):估值最低者 $v_i = \underline{v}$ 的买家,其期望支付相同(通常规定为零,即“最差类型”零期望支付); 那么任意买家在任意给定估值 $v$ 下的期望支付(expected payment)相同,从而卖家从两种机制中获得的期望收入(expected revenue)相同

对四种标准拍卖的推论:FPSB、SPSB、英式、荷式都满足条件(一)(物品给最高估值者)与条件(二)(估值为 $\underline{v}$ 的买家中标概率与期望支付均为零)。故:

\[\mathbb{E}[\text{Revenue}_{\text{FPSB}}] = \mathbb{E}[\text{Revenue}_{\text{SPSB}}] = \mathbb{E}[\text{Revenue}_{\text{English}}] = \mathbb{E}[\text{Revenue}_{\text{Dutch}}].\]

直觉:收入不是来自支付规则的“名义”形式,而是来自分配规则。一旦分配方式定了(物品给最高者)、最差类型的支付定了(为零),那么每个类型必须支付多少就被“逼”出来了,因为每个买家都会调整自己的出价,使得无论机制怎么收钱,自己的期望净收益保持一致。FPSB 里你“少交”(只付自己的出价、且会压价),但中标概率与你压价的程度相互抵消;SPSB 里你“如实出价”但只付次高价。两边一加权平均,期望支付正好相等。换句话说,机制只是重新包装了同一笔钱


三、证明骨架:用包络定理推出期望支付

这是本节的核心技术,期末最常考的就是“用包络定理证 RET”。我们分三步。

第 1 步:设定与符号。 在某个给定机制下,考虑对称均衡。固定买家 $i$,当其真实估值为 $v$ 时,定义:

  • $Q(v)$:买家在均衡中的中标概率(interim winning probability),即对其他人估值取期望后,$i$ 中标的概率。
  • $M(v)$:买家的期望支付(interim expected payment)
  • 买家的期望效用(间接效用,interim utility)为
\[U(v) = v \cdot Q(v) - M(v).\]

由于均衡中物品给最高者,且所有买家用同一策略,故 $Q(v) = F(v)^{n-1}$(自己估值为 $v$ 时,其余 $n-1$ 人估值都比自己低的概率),这只依赖分配规则,与支付规则无关。这是 RET 的关键:$Q$ 在所有满足条件(一)的机制里都一样。

第 2 步:激励相容与包络定理(envelope theorem)。 考虑一个真实估值为 $v$ 的买家,他可以“伪装”成另一类型 $\hat{v}$ 去采用 $\hat{v}$ 的均衡行为。激励相容(incentive compatibility,IC)要求他不愿伪装:

\[U(v) = \max_{\hat{v}} \; \big[\, v \cdot Q(\hat{v}) - M(\hat{v}) \,\big].\]

这是一个以 $v$ 为参数的最大化问题,目标函数对参数 $v$ 的偏导是 $\partial/\partial v\,[v\,Q(\hat v)-M(\hat v)] = Q(\hat v)$。由包络定理,在最优 $\hat{v} = v$ 处,

\[U'(v) = \frac{\partial}{\partial v}\big[v \cdot Q(\hat{v}) - M(\hat{v})\big]\Big|_{\hat{v}=v} = Q(v).\]

(直觉:估值微增 $\mathrm{d}v$ 时,由于已经在最优出价上,重新优化出价的“二阶”影响可忽略,效用的增量就等于“多出来的价值乘以中标概率”。)

第 3 步:积分得到期望支付。 对 $U’(v) = Q(v)$ 从 $\underline{v}$ 到 $v$ 积分:

\[U(v) = U(\underline{v}) + \int_{\underline{v}}^{v} Q(t)\, \mathrm{d}t.\]

代入 $U(v) = v\,Q(v) - M(v)$,解出期望支付:

\[\boxed{\,M(v) = v\,Q(v) - U(\underline{v}) - \int_{\underline{v}}^{v} Q(t)\, \mathrm{d}t\,}.\]

结论:$M(v)$ 完全由两样东西决定,分配函数 $Q(\cdot)$(条件一,所有满足条件的机制相同)和边界效用 $U(\underline{v})$(条件二,最差类型的期望支付/效用,通常 $U(\underline{v}) = 0$)。只要这两样相同,$M(v)$ 就相同,对所有 $v$ 都成立。 再对 $v$ 取期望并对 $n$ 个买家求和,即得卖家期望收入相同。证毕(骨架)。

一句话记住证明:分配定了 $\Rightarrow$ $U’=Q$ 定了 $\Rightarrow$ 积分加边界条件 $\Rightarrow$ 期望支付定了 $\Rightarrow$ 收入定了。 支付规则的具体形式从头到尾没进来过。


四、小例子:均匀分布、两个买家,验证 RET

设 $n = 2$,估值 $v_i \overset{\text{i.i.d.}}{\sim} U[0,1]$,即 $F(v) = v$。

第二价格拍卖(SPSB):弱占优策略是如实出价 $\beta(v) = v$。中标者付次高估值。卖家期望收入 = 两个 $U[0,1]$ 中的较小者的期望 $= \mathbb{E}[\min(v_1,v_2)] = \tfrac{1}{3}$。

第一价格拍卖(FPSB):对称均衡出价为 $\beta(v) = \tfrac{n-1}{n}\,v = \tfrac{1}{2}v$(即出价为估值的一半,“压价”)。卖家收入 = 较高估值的一半的期望 $= \tfrac{1}{2}\,\mathbb{E}[\max(v_1,v_2)] = \tfrac{1}{2}\cdot\tfrac{2}{3} = \tfrac{1}{3}$。

两者都等于 $\tfrac{1}{3}$,收入相等,RET 得到验证。注意机制不同:SPSB 里大家如实出价但只付次高价;FPSB 里大家压价到一半但付自己的价。“压价”与“付全价”恰好抵消。

(一般地,$n$ 个 $U[0,1]$ 买家时 FPSB 均衡为 $\beta(v) = \tfrac{n-1}{n}v$,卖家期望收入为 $\tfrac{n-1}{n+1}$,四种拍卖一致。)


五、RET 何时失效(边界条件,易考陷阱)

RET 是一组充分条件下的结论。任一条件被破坏,收入排序就可能改变:

  • 风险厌恶(risk aversion):买家厌恶风险时,FPSB 中买家会更激进地抬价以减少“中标失败”的不确定性,故 $\mathbb{E}[\text{Rev}_{\text{FPSB}}] \gt \mathbb{E}[\text{Rev}_{\text{SPSB}}]$。
  • 价值相关 / 共同价值(correlated or common values):估值正相关时,英式与第二价格拍卖收入更高(参见关联原理 / linkage principle,Milgrom-Weber),RET 不再成立。
  • 不对称买家(asymmetric bidders):分布不同,分配规则不再“总是给最高估值者”或不同机制分配不同,收入可不等。
  • 边界支付不同:例如设了不同的保留价(reserve price)或入场费,改变 $U(\underline v)$,收入随之改变。

速记:RET 站在四根柱子上,IPV、对称、风险中性、相同分配+相同边界支付。 砸掉任意一根,期望收入就可能分出高下。


六、共同价值拍卖与赢家诅咒

前面是私人价值;现在换到另一类环境。

共同价值(common value,CV):物品对所有人有一个相同但事前未知的真实价值 $V$(例如一块油田的实际储量价值、一家公司被收购后的真实价值)。每个买家 $i$ 只看到一个带噪声的私人信号(private signal)$s_i = V + \varepsilon_i$,其中 $\varepsilon_i$ 是均值为零的独立噪声。买家用 $s_i$ 去估计 $V$ 并出价。

赢家诅咒(Winner’s Curse)

在共同价值拍卖中,中标者往往恰是对 $V$ 估计过高的那个人。因为出价随信号递增,信号最大(即 $\varepsilon_i$ 最大、最乐观)的人最可能赢。于是“赢”本身就是一个坏消息:它告诉你,你的信号在所有人里偏高,你很可能高估了 $V$。

用条件期望刻画:天真的买家若按 $\mathbb{E}[V \mid s_i]$ 出价,会忽略“中标”这一事件携带的信息。理性买家应该按

\[\mathbb{E}\big[\,V \;\big|\; s_i,\ \text{且 } s_i \text{ 是最高信号(即我中标)}\,\big]\]

来评估,而这个条件期望严格低于 $\mathbb{E}[V \mid s_i]$,因为“我的信号最高”意味着我大概率偏乐观。

小例子(直观):拍卖一罐硬币,真实金额 $V$ 固定但未知。$n$ 个人各自目测出一个估计 $s_i = V + \varepsilon_i$。若大家都按各自目测值出价,赢家就是目测最大者,他的 $\varepsilon_i$ 几乎肯定为正,于是出价高于 $V$,赢了却亏钱。这正是经典的“赢者亏损”(赢了拍卖、输了钱)。在石油钻探权拍卖中,这种现象有实证记录:中标公司事后利润常低于预期。

理性买家应如何修正出价(向下修正,bid shading)

  1. 意识到中标是坏消息:在估计 $V$ 时,条件化于“我赢了”这一事件,而不仅是自己的信号。
  2. 向下修正(shade your bid):出价应低于 $\mathbb{E}[V\mid s_i]$,修正幅度随竞争者数量 $n$ 增大而增大,人越多,“成为最高信号者”越极端,越要往下压。
  3. 均衡刻画:在对称均衡中,买家的出价函数 $\beta(s_i)$ 应满足“假想自己的信号恰好是最高(与次高并列临界)时,期望价值仍不低于出价”的条件,即基于“临界中标事件”做评估。
  4. 信息越少越要保守:自己信号噪声越大、对手越多,越要加大向下修正。

与私人价值的对照:私人价值里“中标”不改变你对自己估值的看法(估值是私人的,与别人无关),故无赢家诅咒;共同价值里“中标”是关于真实价值的信息,必须据此调整,否则系统性亏损。这也解释了为何在关联价值环境中公开喊价的英式拍卖收入更高,叫价过程公开了他人信息,缓解了赢家诅咒,买家敢出更高的价。


速记 / 考点小结

收入等价定理(RET)

  • 陈述:IPV + 对称 + 风险中性 + 连续正密度分布 + 相同分配规则(物品给最高估值者)+ 相同边界支付(最差类型期望支付相同),则任意机制的期望支付逐类型相等,卖家期望收入相同。四种标准拍卖(FPSB、SPSB、英式、荷式)都满足,故收入相同。
  • 证明骨架:$U(v)=vQ(v)-M(v)$ → IC + 包络定理得 $U’(v)=Q(v)$ → 积分 $U(v)=U(\underline v)+\int_{\underline v}^v Q(t)\,\mathrm dt$ → 解出 $M(v)=vQ(v)-U(\underline v)-\int_{\underline v}^v Q(t)\,\mathrm dt$。其中 $Q(v)=F(v)^{n-1}$ 只依赖分配规则。
  • 关键直觉:收入由“分配规则 + 边界支付”决定,与支付规则的名义形式无关;FPSB 的压价与 SPSB 的付次高价相互抵消。
  • 数值锚点:$n=2$、$U[0,1]$ 时,两种拍卖收入都是 $\tfrac{1}{3}$;FPSB 均衡 $\beta(v)=\tfrac{n-1}{n}v$。
  • 失效条件:风险厌恶(FPSB 收入更高)、价值关联/共同价值(英式、二价更高)、买家不对称、边界支付不同。

赢家诅咒(Winner’s Curse)

  • 环境:共同价值,信号 $s_i = V + \varepsilon_i$。
  • 机制:赢家是信号最高者,最可能高估 $V$;中标本身是“我偏乐观”的坏消息。
  • 应对:按 $\mathbb{E}[V\mid s_i,\text{中标}] \lt \mathbb{E}[V\mid s_i]$ 评估,向下修正出价(bid shading),修正幅度随竞争者数 $n$ 增大。
  • 对照:私人价值无赢家诅咒;公开喊价(英式)通过释放信息缓解诅咒,从而抬高收入。

机制设计框架:从社会选择到激励相容

机制设计(mechanism design)常被称为“逆向博弈论”(reverse game theory)。普通博弈论问:给定规则,玩家会怎么玩?机制设计反过来问:我想要某种结果,应该设计什么规则(机制),使得理性玩家在自利地玩之后,恰好导出我想要的结果?本节先把这套框架的所有“零件”摆清楚,再用显示原理(Revelation Principle)把整个理论收束成一个极其干净的问题,最后讲透激励相容(incentive compatibility)和个体理性(individual rationality)这两类核心约束。


一、基本要素:类型、效用与社会选择函数

参与者与私有类型(private type)。 设有 $n$ 个参与者(agent),记 $i \in N = {1, 2, \dots, n}$。每个参与者 $i$ 拥有一个私有类型 $\theta_i \in \Theta_i$。“私有”意味着 $\theta_i$ 只有 $i$ 自己知道,机制设计者和其他人都看不到。类型刻画了 $i$ 的全部私有信息,例如:

  • 拍卖中,$\theta_i$ 是 $i$ 对物品的估值(valuation),即“这件东西对我值多少钱”;
  • 公共项目决策中,$\theta_i$ 是 $i$ 从项目中获得的收益;
  • 一般地,$\theta_i$ 编码了一切影响 $i$ 偏好、却不为外人所知的信息。

记类型组合(type profile)$\theta = (\theta_1, \dots, \theta_n) \in \Theta = \Theta_1 \times \cdots \times \Theta_n$。沿用博弈论惯例,$\theta_{-i}$ 表示“除 $i$ 之外所有人的类型”,于是 $\theta = (\theta_i, \theta_{-i})$。

直觉:类型就是“参与者脑子里那张别人看不见的小卡片”。机制设计的全部困难,都来自这张卡片是私有的。如果设计者能直接读到所有人的卡片,问题就退化为一个普通的优化问题。

结果空间(outcome space)。 设所有可能的“社会结果”构成集合 $X$。在拍卖里,一个结果就是“物品分给谁”(分配,allocation);在公共决策里,结果是“项目建还是不建”。

准线性效用(quasi-linear utility)。 本课程的核心假设是参与者效用具有准线性形式:效用 $=$ 对结果的估值 $-$ 付出的支付(payment)。形式上,若结果为 $x \in X$,$i$ 向机制支付 $p_i$(货币),则

\[u_i(x, p_i; \theta_i) = v_i(x, \theta_i) - p_i .\]

这里 $v_i(x, \theta_i)$ 是 $i$ 在类型为 $\theta_i$ 时对结果 $x$ 的估值函数(valuation function),单位是货币。准线性的关键含义是:

  • 效用对货币是线性的,没有递减边际效用,也就是说货币可以在参与者之间无损地转移(“transferable utility”,可转移效用);
  • 估值部分与支付部分可加分离,这让我们能把“决定结果”和“决定支付”两件事在分析上拆开。

准线性是把数学做干净的关键假设;正是它使得后面的 VCG 机制等结果成立。现实中当然有风险厌恶、预算约束等违背准线性的情形,但它们属于更进阶的话题。

社会选择函数(social choice function, SCF)。 设计者的目标,是把每一个可能的类型组合映射到一个“想要的结果”。这个映射叫社会选择函数

\[f : \Theta \to X, \qquad \theta \mapsto f(\theta).\]

$f$ 表达了设计者的价值取向。常见目标包括:

  • 效率/福利最大化(allocative efficiency):$f(\theta) \in \arg\max_{x \in X} \sum_{i} v_i(x, \theta_i)$,即选择使社会总估值最大的结果。例如把物品分给估值最高的人。
  • 收入最大化(revenue maximization):选择能让设计者收到最多支付的结果。

注意一个微妙但重要之处:$f$ 是定义在“真实类型” $\theta$ 上的。但设计者看不到真实类型,只能问参与者,而参与者可能撒谎。机制设计的全部张力就在这里:我想在真实 $\theta$ 上实现 $f(\theta)$,但我只能基于参与者的“报告”来行动。


二、机制:一般机制与直接机制

一般机制(general mechanism)。 一个机制规定了“游戏怎么玩”。形式上,一个机制是一个二元组

\[\mathcal{M} = \big( (S_i)_{i \in N},\ g \big),\]

其中:

  • $S_i$ 是参与者 $i$ 的策略空间/消息空间(strategy / message space),即 $i$ 能采取的所有可能行动或可发送的所有消息。注意 $S_i$ 可以和类型空间 $\Theta_i$ 毫无关系,可能是出价、举手、报一个数字、玩一个多轮博弈等任意复杂的形式。
  • $g : S_1 \times \cdots \times S_n \to X \times \mathbb{R}^n$ 是结果函数/规则(outcome rule),把大家选的策略组合 $s = (s_1, \dots, s_n)$ 映射成一个结果 $x$ 加一组支付 $(p_1, \dots, p_n)$。记 $g(s) = \big(x(s), (p_i(s))_i\big)$。

机制 $+$ 参与者的私有类型,共同诱导出一个贝叶斯博弈(Bayesian game):每个 $i$ 根据自己的类型 $\theta_i$ 选一个策略 $s_i(\theta_i) \in S_i$ 来最大化自己的(期望)效用。我们关心的是这个博弈的均衡(占优策略均衡或贝叶斯纳什均衡)。

实现(implementation)。 我们说机制 $\mathcal{M}$ 实现了社会选择函数 $f$,如果存在该博弈的某个均衡 $s^* = (s_1^, \dots, s_n^)$,使得在每个类型组合 $\theta$ 下,均衡产生的结果恰好就是 $f$ 想要的:

\[x\big(s_1^*(\theta_1), \dots, s_n^*(\theta_n)\big) = f(\theta), \qquad \forall \theta \in \Theta.\]

换句话说,“让参与者自利地博弈”和“设计者直接挑结果”在均衡上重合了。

直接机制(direct mechanism / direct revelation mechanism)。 在所有机制中,有一类特别简单:让每个参与者直接报告自己的类型。也就是说策略空间就是类型空间,$S_i = \Theta_i$,参与者发送的消息 $\hat\theta_i$ 是一个“声称的类型”(report,可能真也可能假)。一个直接机制就由社会选择函数本身加上一个支付规则给出:

\[\big(f, (p_i)_i\big), \qquad f : \Theta \to X, \quad p_i : \Theta \to \mathbb{R}.\]

收到报告组合 $\hat\theta = (\hat\theta_1, \dots, \hat\theta_n)$ 后,机制选结果 $f(\hat\theta)$ 并收支付 $p_i(\hat\theta)$。参与者报告类型为 $\hat\theta_i$、而真实类型为 $\theta_i$ 时的效用是

\[u_i(\hat\theta_i, \hat\theta_{-i}; \theta_i) = v_i\big(f(\hat\theta_i, \hat\theta_{-i}), \theta_i\big) - p_i(\hat\theta_i, \hat\theta_{-i}).\]

直觉对比:一般机制像“复杂的多轮拍卖、讨价还价、举手投票”;直接机制像“每个人在一张纸条上写下自己的真实估值,交上去,主持人按既定公式算结果和收费”。直接机制因为消息空间被钉死成类型空间,分析起来干净得多。


三、显示原理:把所有机制压缩成一类

直接机制看似只是一个特例,但显示原理(Revelation Principle)告诉我们:研究直接机制其实毫无损失。这是整个机制设计理论的“减负定理”。

定理(显示原理,占优策略版本)。

若社会选择函数 $f$ 可以被某个一般机制 $\mathcal{M}$ 在占优策略均衡下实现,则 $f$ 也可以被一个讲真话(truthful)的直接机制实现。在该直接机制中,“如实报告真实类型”对每个参与者都是占优策略(dominant strategy)。

(贝叶斯纳什均衡也有完全平行的版本:可被某机制在 BNE 下实现的 $f$,也可被一个“如实报告构成 BNE”的直接机制实现。陈述只需把“占优策略”换成“贝叶斯纳什均衡”。)

证明骨架(构造性证明)。 设 $\mathcal{M} = ((S_i), g)$ 在占优均衡 $s^* = (s_i^)$ 下实现 $f$,即 $s_i^(\theta_i)$ 是 $i$ 在类型 $\theta_i$ 下的占优策略,且 $x(s^*(\theta)) = f(\theta)$。我们构造一个直接机制,办法是把 $\mathcal{M}$ 的“均衡策略”内置进机制里,让机制替参与者代劳:

  1. 在新的直接机制中,参与者 $i$ 只需报告一个类型 $\hat\theta_i$。
  2. 机制收到报告 $\hat\theta = (\hat\theta_1, \dots, \hat\theta_n)$ 后,替每个人模拟其均衡策略,即代入 $s_i^(\hat\theta_i)$,然后运行原机制的规则,输出 $g\big(s_1^(\hat\theta_1), \dots, s_n^*(\hat\theta_n)\big)$。

这相当于在原机制外面套了一个“自动代填器”:你只要告诉我你的类型,我就按你在原博弈里的最优玩法替你玩。

为什么如实报告是占优策略? 反证或直接论证:假设在新直接机制下,$i$ 谎报 $\hat\theta_i \neq \theta_i$ 能获得严格更高的效用。注意机制对谎报 $\hat\theta_i$ 的反应,是替 $i$ 在原机制里执行 $s_i^(\hat\theta_i)$。于是这等价于:在原机制 $\mathcal{M}$ 里,类型为 $\theta_i$ 的 $i$ 选择策略 $s_i^(\hat\theta_i)$ 比选 $s_i^(\theta_i)$ 更好。但这与 $s_i^(\theta_i)$ 是 $i$ 在原机制中(对任意他人行为)的占优策略矛盾。所以谎报无利可图,如实报告是占优策略。又因为机制内部执行的恰是 $s^$,最终结果就是 $x(s^(\theta)) = f(\theta)$,$f$ 被忠实实现。$\blacksquare$

显示原理的意义(务必理解)。

  • 它是一个“无需失去一般性”的归约。 想搞清楚“哪些社会选择函数是可实现的”,只需在所有“讲真话的直接机制”里找,完全不必去枚举那些花里胡哨的复杂机制。这把一个对“所有可能机制”的搜索,压缩成对“满足激励相容约束的 $(f, p)$”的搜索。
  • 它把博弈论问题变成约束优化问题。 一旦只看讲真话的直接机制,“是否可实现”就等价于一组关于 $f$ 和 $p$ 的不等式(即下文的激励相容约束)是否有解。

一句话记住显示原理:“任何机制能办到的事,一个让大家说真话的机制也能办到。” 因此理论上我们可以假装全世界只有讲真话的直接机制。

重要提醒(常见考点陷阱)。 显示原理保证讲真话的直接机制在结果均衡意义上无损,但它保证:

  • 实际运行的计算/通信成本低(替人模拟 $s_i^*$ 可能很贵);
  • 真话均衡是唯一均衡(可能还有其他坏均衡,即“完全实现 full implementation”问题,超出本节);
  • 参与者愿意暴露完整类型(隐私顾虑)。 这些是显示原理的边界,写答案时点到能加分。

四、激励相容:DSIC 与 BIC

有了显示原理,我们就只研究讲真话的直接机制。“讲真话是均衡”这件事正式名称就是激励相容(incentive compatibility, IC):机制设计得让参与者的私利说真话相容,即说真话恰好是对自己最有利(或至少不吃亏)的。根据“对什么样的他人行为都最优”,分成强弱两档。

(1)占优策略激励相容(dominant-strategy incentive compatibility, DSIC)。

直接机制 $(f, p)$ 是 DSIC 的,如果对每个参与者 $i$、每个真实类型 $\theta_i$、每个谎报 $\hat\theta_i$,以及无论他人报告 $\hat\theta_{-i}$ 是什么,如实报告都不劣:

\[v_i\big(f(\theta_i, \hat\theta_{-i}), \theta_i\big) - p_i(\theta_i, \hat\theta_{-i}) \;\ge\; v_i\big(f(\hat\theta_i, \hat\theta_{-i}), \theta_i\big) - p_i(\hat\theta_i, \hat\theta_{-i}), \quad \forall \hat\theta_i,\ \forall \hat\theta_{-i}.\]

关键词是 $\forall \hat\theta_{-i}$:“不管别人报什么、不管别人是诚实还是撒谎,我说真话总是最优的。”这是最强的激励保证。

直觉:DSIC 机制下,参与者不需要对别人的类型有任何信念,也不需要推测别人会怎么报。“反正说真话稳赚不亏”,决策极其简单,对策略性思考能力的要求最低。这种鲁棒性极有吸引力。

经典例子:第二价格拍卖(Vickrey / second-price auction)。出价最高者赢,但只付第二高的出价。可以证明,无论别人怎么出价,如实按估值出价都是占优策略(出高了可能以高于估值的价拿下而亏,出低了可能错失本该盈利的机会)。所以第二价格拍卖是 DSIC 的。

(2)贝叶斯激励相容(Bayesian incentive compatibility, BIC)。

DSIC 要求“对任意他人报告都最优”,这很强,有时强到无法实现某些 $f$。一个更弱的版本只要求“在他人都如实报告且类型服从某共同先验 $\theta_{-i} \sim F_{-i}$ 的前提下,如实报告在期望意义上最优”。形式上,设各人类型独立、有公共先验,直接机制 $(f, p)$ 是 BIC 的,如果对每个 $i$、每个 $\theta_i$、每个谎报 $\hat\theta_i$:

\[\mathbb{E}_{\theta_{-i}}\Big[ v_i\big(f(\theta_i, \theta_{-i}), \theta_i\big) - p_i(\theta_i, \theta_{-i}) \Big] \;\ge\; \mathbb{E}_{\theta_{-i}}\Big[ v_i\big(f(\hat\theta_i, \theta_{-i}), \theta_i\big) - p_i(\hat\theta_i, \theta_{-i}) \Big], \quad \forall \hat\theta_i.\]

这里期望对他人真实类型 $\theta_{-i}$(按先验)取,且假定他人说真话。也就是说,“如实报告”构成一个贝叶斯纳什均衡(Bayesian Nash equilibrium)。

直觉:BIC 下,“说真话最优”只在平均意义、且别人也都说真话的前提下成立。参与者需要知道先验分布、需要相信别人也诚实,才敢放心说真话。这是一种更脆弱、但要求更宽松的保证。

DSIC 与 BIC 的关系(核心考点)。

\[\textbf{DSIC} \implies \textbf{BIC}.\]

证明一句话:若对每一个 $\theta_{-i}$ 逐点不等式都成立(DSIC),那么两边对 $\theta_{-i}$ 取期望后不等式当然仍成立(BIC)。反之不成立:BIC 是更大的一类,存在 BIC 但非 DSIC 的机制(典型如最优收入拍卖中的某些机制)。

维度DSIC(占优策略)BIC(贝叶斯)
对他人行为的要求任意 $\hat\theta_{-i}$ 都最优仅“他人诚实 + 先验”下期望最优
是否需要先验分布不需要需要公共先验
鲁棒性强(detail-free)弱(依赖信念与分布)
可实现的 $f$ 范围较窄较宽
均衡概念占优策略均衡贝叶斯纳什均衡

记忆口诀:DSIC 强、限制紧、能做的事少但稳;BIC 弱、限制松、能做的事多但娇气。


五、个体理性:参与约束

激励相容解决“既然来了,会不会说真话”;但还有更前一步的问题:参与者凭什么愿意来?如果参加机制反而让我比不参加更糟(例如被强行收一笔钱、或被迫接受一个我讨厌的结果还倒贴),理性的我就会拒绝参与。这就是个体理性(individual rationality, IR),也叫参与约束(participation constraint)。

设参与者 $i$ 不参与时的效用为其保留效用(reservation utility)$\bar u_i$,常被标准化为 $0$(“不参与就什么都不得不失”)。IR 要求参与(并说真话)带来的效用不低于保留效用:

  • 占优策略下的(事后)IR(ex-post IR):对每个 $\theta$, \(v_i\big(f(\theta), \theta_i\big) - p_i(\theta) \;\ge\; \bar u_i \;(=0), \qquad \forall \theta.\) 即无论类型组合如何实现,事后都没人后悔参加。

  • 期望意义下的 IR(interim IR):在 $i$ 已知自己类型 $\theta_i$、但对他人取期望时, \(\mathbb{E}_{\theta_{-i}}\Big[ v_i\big(f(\theta_i, \theta_{-i}), \theta_i\big) - p_i(\theta_i, \theta_{-i}) \Big] \;\ge\; \bar u_i, \qquad \forall \theta_i.\) 即每种“我自己的类型”下,事前期望都值得参加。

(还有更弱的 ex-ante IR:连自己类型都还没实现时的期望非负。强弱关系为 ex-post IR $\Rightarrow$ interim IR $\Rightarrow$ ex-ante IR。)

直觉:IC 管“进门之后说不说真话”,IR 管“愿不愿意进门”。一个机制要真正能跑起来,两个约束必须同时满足:参与者既愿意来(IR),来了又愿意说真话(IC)。把支付收得太狠会违反 IR(没人来),把激励设计错了会违反 IC(来了也撒谎)。机制设计就是在 IC、IR 这两道约束之内,去优化设计者的目标(效率或收入)。

一个把全部要素串起来的小例子。 卖一件物品给两个买家,估值 $\theta_1, \theta_2$ 私有。设计者想要效率:$f$ 把物品分给估值高的人。用第二价格拍卖(直接机制:让两人报估值 $\hat\theta_1, \hat\theta_2$,高者得,付对方的报价)。

  • IC(DSIC):如实报估值是占优策略 → 满足 DSIC,从而也满足 BIC。
  • IR:赢家付的是较低的那个报价 $\le$ 自己的估值,效用 $\ge 0$;输家不付钱、效用 $=0$。所以满足 ex-post IR。
  • 实现的 $f$:均衡下物品确实分给真实估值更高者,效率目标达成。

这个例子里,社会选择函数(效率分配)、直接机制(第二价格拍卖)、显示原理(一个讲真话的直接机制就够了)、DSIC、IR 五件事全部在场,是理解整套框架的最佳缩影。


速记 / 考点小结

  • 五大要素:私有类型 $\theta_i \in \Theta_i$;准线性效用 $u_i = v_i(x,\theta_i) - p_i$(估值减支付,效用对货币线性、可转移);社会选择函数 $f:\Theta \to X$(设计者的目标,常见为效率或收入);机制 $\mathcal M = ((S_i), g)$;直接机制 $(f, p)$(消息空间 $=$ 类型空间,$S_i = \Theta_i$)。
  • 核心张力:设计者想在真实 $\theta$ 上实现 $f(\theta)$,但只能基于参与者报告行动,报告可能是假的。
  • 显示原理(Revelation Principle):凡可被某机制(在占优均衡 / BNE 下)实现的 $f$,都可由一个讲真话的直接机制实现。证明思路:把原机制的均衡策略 $s_i^*$ 内置进机制替参与者代劳,谎报等于在原机制选非占优策略,矛盾。意义:只研究满足 IC 的 $(f,p)$ 即可,无需失去一般性,把博弈问题变成约束优化。
  • DSIC:对任意 $\hat\theta_{-i}$,如实报告都最优 → 最强、不依赖先验、detail-free。例:第二价格拍卖。
  • BIC:仅在他人诚实 + 公共先验下、期望意义最优(如实报告构成 BNE)→ 较弱、依赖分布。
  • 关系:$\text{DSIC} \Rightarrow \text{BIC}$(逐点不等式取期望即得);反之不真。DSIC 可实现的 $f$ 更窄,BIC 更宽。
  • 个体理性 IR / 参与约束:参与且说真话的效用 $\ge$ 保留效用(通常归一化为 $0$)。强弱:ex-post $\Rightarrow$ interim $\Rightarrow$ ex-ante。
  • 设计的本质:在 IC(来了说真话)与 IR(愿意来)两道约束下,最大化设计者目标(效率或收入)。
  • 易错点:显示原理不保证唯一均衡(full implementation 另说)、不保证计算/通信便宜、不保证隐私;DSIC 与 BIC 不要写反方向蕴含。

VCG 机制

本节我们详细讲解机制设计中最重要的一个正面结果:VCG 机制(Vickrey-Clarke-Groves mechanism)。它是目前已知的能在非常一般的环境下同时做到“占优策略真实”(dominant-strategy incentive compatible, DSIC)与“经济有效”(efficient, 即最大化社会总福利)的核心构造。理解 VCG,相当于理解了拍卖理论与机制设计里“激励对齐”的最深层逻辑。

我们的讲解顺序是:先搭好环境与记号;再讲一般的 Groves 机制如何用“支付=他人福利”对齐激励;然后引入 Clarke pivot 支付(克拉克支点支付)这一最常用的具体实现;接着指出二价拍卖(Vickrey auction)只是它的特例;最后讲应用与局限。


一、环境与记号(quasi-linear setting)

我们工作在准线性效用环境(quasi-linear environment)。这是 VCG 成立的标准舞台,请务必记牢。

设有 $n$ 个 agent(智能体/参与者),记集合为 $N={1,2,\dots,n}$。机制需要从一个结果集合(outcome set / alternative set) $A$ 中选出一个结果 $a\in A$。这里 $A$ 可以是“把物品分配给谁”、“是否修一座桥”、“组合拍卖中所有物品的一种分配方案”等等。

每个 agent $i$ 有一个类型(type) $\theta_i$,它决定了 $i$ 对每个结果的偏好。关键地,$i$ 对结果 $a$ 的偏好由一个估值函数(valuation function)给出:

\[v_i(a,\theta_i)\in\mathbb{R}.\]

为方便,常简写为 $v_i(a)$,并把 agent $i$ 上报(声明)的估值记为 $\hat v_i$,真实估值记为 $v_i$。

机制由两部分组成:

  • 配置规则/分配规则(allocation rule) $f:\;\hat v\mapsto a\in A$,根据上报决定结果;
  • 支付规则(payment rule) $p_i:\;\hat v\mapsto \mathbb{R}$,决定每个 agent 要支付多少。

agent $i$ 的准线性效用(quasi-linear utility)定义为“自己从结果中得到的价值减去支付”:

\[u_i \;=\; v_i\big(f(\hat v),\theta_i\big)\;-\;p_i(\hat v).\]

准线性这个词的含义就是:效用对货币(钱)是线性的,且价值与货币可以直接相加减。这一点是 VCG 全部魔法的前提。

我们还需要两个核心定义。

定义 1.1(经济有效 / efficiency). 一个分配规则 $f$ 是有效的(efficient),如果它总是选出使社会总福利(social welfare)最大的结果:

\[f(v)\;\in\;\arg\max_{a\in A}\;\sum_{i\in N} v_i(a).\]

也就是说,有效就是“把蛋糕做到最大”,先不管怎么分蛋糕、谁付钱。

定义 1.2(占优策略真实 / DSIC). 机制是 DSIC(也叫 strategyproof, 抗策略操纵)的,如果对每个 agent $i$、对任意自己的真实估值 $v_i$、对其他人任意的上报 $\hat v_{-i}$,如实上报 $\hat v_i=v_i$ 都是(弱)最优的:

\[v_i\big(f(v_i,\hat v_{-i})\big)-p_i(v_i,\hat v_{-i})\;\ge\;v_i\big(f(\hat v_i,\hat v_{-i})\big)-p_i(\hat v_i,\hat v_{-i})\quad\forall \hat v_i.\]

DSIC 比贝叶斯纳什激励相容(BIC)强得多:它不要求 agent 知道别人的分布、也不要求别人理性,“说真话”是无条件最优的。这正是 VCG 的卖点。


二、Groves 机制:用“他人福利”对齐激励

VCG 的核心思想由 Groves(1973)给出。它的设计哲学可以用一句话概括:

让每个 agent 的私人效用与社会总福利完全一致,于是个人最优自动等于社会最优。

怎么做到?关键在于支付规则的设计。

定义 2.1(Groves 机制). Groves 机制由如下两条规则构成。

(1) 分配规则取有效分配

\[f(\hat v)\;\in\;\arg\max_{a\in A}\;\sum_{j\in N}\hat v_j(a).\]

(2) 支付规则为

\[p_i(\hat v)\;=\;h_i(\hat v_{-i})\;-\;\sum_{j\neq i}\hat v_j\big(f(\hat v)\big),\]

其中 $h_i$ 是任意一个只依赖于其他人上报 $\hat v_{-i}$、与 $i$ 自己上报无关的函数。

把它代回效用,agent $i$ 的效用变成:

\[u_i \;=\; \hat v_i\big(f(\hat v)\big)\;-\;p_i \;=\;\underbrace{v_i\big(f(\hat v)\big)+\sum_{j\neq i}\hat v_j\big(f(\hat v)\big)}_{\text{选出 }a\text{ 时的总福利(用 }\hat v\text{ 算)}}\;-\;h_i(\hat v_{-i}).\]

注意 $h_i$ 与 $i$ 的上报无关,是个“常数项”。所以 agent $i$ 想最大化自己效用,就等价于想让机制选出的 $a$ 使

\[v_i(a)+\sum_{j\neq i}\hat v_j(a)\]

最大。而机制实际选的是让 $\sum_j \hat v_j(a)$ 最大的 $a$。当 $i$ 如实上报 $\hat v_i=v_i$ 时,机制最大化的目标恰好就是 $i$ 想最大化的目标,两者完全重合。于是说真话最优。这就是下面这条核心定理。

定理 2.2(Groves 定理). 任意 Groves 机制都是 DSIC 且有效的。

证明骨架. 固定其他人的上报 $\hat v_{-i}$。设 $i$ 的真实估值为 $v_i$。当 $i$ 上报 $\hat v_i$ 时,机制选出结果 $a^*=f(\hat v_i,\hat v_{-i})$,$i$ 的真实效用为

\[u_i(\hat v_i)\;=\;v_i(a^*)-p_i \;=\;v_i(a^*)+\sum_{j\neq i}\hat v_j(a^*)\;-\;h_i(\hat v_{-i}).\]

由于 $h_i(\hat v_{-i})$ 与 $\hat v_i$ 无关,$i$ 选择上报来最大化 $u_i$ 就等价于选择上报使

\[W(a^*)\;:=\;v_i(a^*)+\sum_{j\neq i}\hat v_j(a^*)\]

最大。现在若 $i$ 如实上报 $\hat v_i=v_i$,机制会选 $a^*=\arg\max_a\big(v_i(a)+\sum_{j\neq i}\hat v_j(a)\big)=\arg\max_a W(a)$,即直接把 $W$ 顶到全局最大。任何其他上报至多让机制选出一个使 $W$ 不更大的结果。故如实上报弱占优。有效性则由分配规则 (1) 直接保证(机制在真实上报下最大化 $\sum_j v_j$)。$\blacksquare$

直觉小结:支付里的 $-\sum_{j\neq i}\hat v_j(f(\hat v))$ 这一项,是把“别人因为这个结果获得的总价值”加进了 $i$ 的腰包(注意是负支付即收益)。这样一来,$i$ 在乎别人的死活了,他内部化(internalize)了自己的决策对全社会的影响,私人激励与社会目标对齐。$h_i$ 这一项不影响激励,只用来“平移”支付水平、调节机制的收入与个体理性。


三、Clarke pivot 支付:付“外部性”

Groves 机制留下了自由参数 $h_i$。Clarke(1971)给出了一个特别自然、应用最广的选择,得到的就是狭义的 VCG 机制(很多教材直接把“VCG”等同于“Groves + Clarke pivot”)。

定义 3.1(Clarke pivot 支付 / 克拉克支点支付).

\[h_i(\hat v_{-i})\;=\;\max_{a\in A}\;\sum_{j\neq i}\hat v_j(a).\]

含义是:$h_i$ 等于“假设 $i$ 不存在时,剩下 $n-1$ 个人能达到的最大总福利”。代入 Groves 支付公式得到 Clarke 支付

\[\boxed{\;p_i(\hat v)\;=\;\underbrace{\max_{a}\sum_{j\neq i}\hat v_j(a)}_{\text{没有 }i\text{ 时别人能拿到的最优福利}}\;-\;\underbrace{\sum_{j\neq i}\hat v_j\big(f(\hat v)\big)}_{\text{有 }i\text{ 时别人实际拿到的福利}}\;}\]

解读(极其重要的考点):

\[p_i\;=\;\Big(\text{别人在没有 }i\text{ 的世界里的最优福利}\Big)\;-\;\Big(\text{别人在有 }i\text{ 的世界里实际得到的福利}\Big).\]

这正是 $i$ 的存在给其他所有人造成的福利损失,即 $i$ 施加于社会的外部性(externality)

一句话记忆:在 VCG 里,每个 agent 支付的金额,恰好等于“因为我在场、并占用了某些资源,导致其他人少得到的那部分福利”。你付的是你对别人的伤害(你的拥挤外部性)。

由这个解读立刻得到两条重要性质。

性质 3.2(个体理性 / individual rationality, IR). 在很一般的条件下(每个 agent 的估值非负、加入一个 agent 不会减少其他可选结果,即“无负外部性”成立时),Clarke pivot 支付给出事后个体理性:每个 agent 的效用 $u_i\ge 0$,即没人会因为参与而吃亏。原因是:$p_i$ 至多等于 $i$ 给最优结果带来的边际贡献,所以 $u_i=v_i(f)-p_i\ge 0$。

性质 3.3(无正向转移 / no positive transfer). 在上述条件下 $p_i\ge 0$,即机制只向 agent 收钱、不会倒贴钱(这是因为外部性损失非负)。

性质 3.4(弱预算平衡 / weak budget balance). 收上来的总支付 $\sum_i p_i\ge 0$,机制不亏钱。但请注意,VCG 一般不是强预算平衡(收支恰好相抵),这正是后面要讲的局限之一。

一个具体小例子(单物品拍卖). 一件物品,三个买家估值 $v_1=10,\;v_2=8,\;v_3=5$。

  • 有效分配:把物品给估值最高的买家 1。
  • 算买家 1 的支付:没有买家 1 时,别人最优福利 $=\max(8,5)=8$(给买家 2);有买家 1 时,别人实际得到 $0$(物品归 1,2 和 3 都没拿到)。所以 $p_1=8-0=8$。
  • 买家 2、3 没拿到东西,他们的存在没有改变“物品给 1”这个结果,对别人外部性为 0,故 $p_2=p_3=0$。
  • 结论:物品给买家 1,付 8。这恰好是第二高价! 买家 1 的效用 $=10-8=2\ge0$。

这个例子直接引出下一节。


四、二价拍卖是 VCG 的特例

Vickrey 拍卖(第二价格密封拍卖, second-price sealed-bid auction):所有人密封出价,最高价者获胜,但只支付第二高的出价。Vickrey(1961)证明了它是 DSIC 的(真实出价是占优策略)。

命题 4.1. 单物品 Vickrey 第二价格拍卖正是把 VCG(Groves + Clarke pivot)应用到“单一不可分物品分配”这一特殊结果集合上的结果。

证明. 结果集合 $A={$把物品给某个 $i$,或不分配$}$。有效分配把物品给估值最高者,设为赢家 $w$。对赢家 $w$,Clarke 支付:

  • 没有 $w$ 时别人最优福利 $=$ 剩下买家里的最高估值,即第二高出价 $v_{(2)}$;
  • 有 $w$ 时别人实际福利 $=0$(物品归 $w$)。

故 $p_w=v_{(2)}-0=v_{(2)}$,正是第二高价。对所有输家 $i$,去掉他不改变“物品归 $w$”,外部性为 $0$,故 $p_i=0$。这与第二价格拍卖完全一致。$\blacksquare$

历史与命名梳理:Vickrey(1961)发现二价拍卖的真实性;Clarke(1971)把它推广到公共物品并给出 pivot 支付;Groves(1973)给出最一般的支付族。三者合称 VCG。所以二价拍卖是 VCG 时间最早、最简单的“祖先特例”。


五、应用

(1) 组合拍卖(combinatorial auctions). 这是 VCG 最重要的应用,也是 Vickrey 拍卖最自然的推广。有一组物品 $G={g_1,\dots,g_m}$ 出售,每个买家对物品的子集(bundle)有估值 $v_i(S),\;S\subseteq G$,允许互补(complements, 整套才值钱,如一双鞋)与替代(substitutes)。

  • 结果集合 $A=$ 所有把物品分给买家的分配方案。
  • 有效分配求解赢家确定问题(winner determination problem, WDP):$\max\sum_i v_i(S_i)$ 使各 $S_i$ 互不相交。
  • 每个赢家按 Clarke 支付:他拿走的物品本可以给别人创造的价值(即他造成的外部性)。

VCG 让买家可以安全地、真实地表达对捆绑包的复杂偏好,无需担心被操纵。这在频谱拍卖、广告位拍卖、物流路由分配等场景被广泛讨论。

(2) 公共物品(public goods). 经典问题:是否修一座桥,造价为 $C$。每个居民 $i$ 对修桥的私人价值是 $v_i$(真实但私人)。社会有效决策:当 $\sum_i v_i\ge C$ 时修,否则不修。难点是居民有动机谎报(搭便车 free-riding:少报以少付钱;或想要桥的人多报)。

VCG(这里就是经典的 Clarke 税, Clarke tax)让每个居民付他对决策的“枢轴外部性”:只有当 $i$ 是关键人物(pivotal),即“有他这个决策才成立、没他就翻盘”时,他才付一笔正的税,金额等于他改变结果给别人造成的福利落差;非关键人物付 0。这样人人如实上报自己的价值是占优策略,于是修桥决策达到社会有效。这是机制设计史上一个里程碑:它打破了“公共物品必然因搭便车而供给不足”的悲观直觉(至少在激励层面解决了真实显示问题)。


六、VCG 的局限

VCG 在理论上极其漂亮,但在实践中有几个严重问题,这些是考试高频“批判性分析”考点。

(1) 收入可能很低甚至为零(low / zero revenue). VCG 不为卖方收入优化,它只保证有效与真实。当竞争不充分时,收入可能远低于物品的社会价值,甚至为 0。

  • 经典例子(组合拍卖中的低收入):两个物品 ${a,b}$,买家 1 只想要整套 ${a,b}$、估值 100,买家 2 只想要 $a$、估值 100,买家 3 只想要 $b$、估值 100。有效分配是 $a\to$ 买家 2、$b\to$ 买家 3(总福利 200 > 100)。算买家 2 的 VCG 支付:没有他时,最优是把整套给买家 1(福利 100),别人此时得 100;有他时别人(1 和 3)实际得 100(买家 3 拿 $b$)。$p_2=100-100=0$。同理 $p_3=0$。总收入为 0,尽管社会价值高达 200。 卖家颗粒无收。
  • 这违背了卖方追求收入最大化(revenue maximization, 见 Myerson 最优拍卖理论)的目标。VCG 有效但“不赚钱”。

(2) 不是强预算平衡(not budget-balanced). 在公共物品场景,VCG 收上来的 Clarke 税通常少于项目成本,或多于成本而无法在不破坏激励的前提下退还。Green-Laffont 不可能性定理(Green & Laffont, 1979)表明:在一般环境中,不存在同时满足有效、DSIC 与预算平衡的机制。要预算平衡只能牺牲有效或真实。这是结构性的不可能,不是设计不力。

(3) 易受合谋(collusion)与虚假身份/虚假名(false-name / sybil / shill bidding)攻击.

  • 合谋:一组买家可以串通改变各自出价,在不影响“谁赢”的前提下压低支付(因为支付只取决于别人的出价)。在低收入例子里,买家 2 和 3 本质上就在“配合”对方压低彼此的支付。
  • 虚假身份攻击(false-name bidding, Yokoo 等人提出):一个买家用多个假身份参与,制造虚假竞争或虚假外部性结构来降低自己的支付、甚至改变分配。VCG 不是 false-name proof 的,这是它区别于普通策略操纵的独有脆弱性,因为网络环境中开马甲几乎零成本。

(4) 赢家确定是 NP 难的计算问题(computational intractability).

  • 在组合拍卖中,求有效分配(WDP)是 NP 难的(可由加权集合包装 weighted set packing 归约得到)。
  • 更糟的是:VCG 的真实性依赖于精确求出最优分配。如果用近似算法替代精确解,Groves 定理的证明就垮了,agent 可以通过谎报来“操纵近似算法走向对自己有利的次优解”,真实性被破坏
  • 因此“VCG + 近似算法”一般不再 DSIC。要在计算可行的同时保持真实,需要专门设计的“单调近似 + 临界支付”等机制(如 Lehmann-O’Callaghan-Shoham 的贪心机制),这已超出朴素 VCG 的范围。

一句话总结局限:VCG 真而有效,却可能不赚钱、不预算平衡、怕合谋与马甲、且赢家确定计算上不可行。理论的明珠,落地的荆棘。


速记 / 考点小结

核心公式(务必背下)

  • 环境:准线性效用 $u_i=v_i(f(\hat v))-p_i(\hat v)$。
  • Groves 分配:$f(\hat v)\in\arg\max_a\sum_j\hat v_j(a)$(有效)。
  • Groves 支付:$p_i=h_i(\hat v_{-i})-\sum_{j\neq i}\hat v_j(f(\hat v))$,$h_i$ 与 $i$ 自己上报无关。
  • Clarke pivot:$h_i=\max_a\sum_{j\neq i}\hat v_j(a)$,于是 \(p_i=\max_a\sum_{j\neq i}\hat v_j(a)-\sum_{j\neq i}\hat v_j(f(\hat v))=i\text{ 对别人的外部性}.\)

三句话抓住本质

  1. 支付=他人福利的负项让每个 agent 内部化社会影响 ⇒ DSIC + efficient(Groves 定理)。
  2. Clarke 支付 = 你的存在让别人少得的福利(外部性) ⇒ 自动得到 IR、$p_i\ge 0$、弱预算平衡。
  3. 二价 Vickrey 拍卖 = 单物品上的 VCG,赢家付第二高价(即他对别人的外部性)。

证明要点:Groves 真实性 ⇐ $h_i$ 与 $\hat v_i$ 无关 ⇒ agent 最大化的目标 $v_i(a)+\sum_{j\neq i}\hat v_j(a)$ 与机制目标在说真话时重合。

四大局限(背口诀:低、平、谋、难)

  • 收入(甚至为 0,竞争不足时);
  • 非强预算衡(Green-Laffont 不可能定理);
  • 怕合与虚假身份(非 false-name proof);
  • 赢家确定 NP ,且近似会破坏真实性。

易错点提醒:(a) VCG 保证有效,但保证收入最大(那是 Myerson 最优拍卖);(b) 真实性必须用精确最优分配,近似即失效;(c) 输家通常付 0(对结果无外部性);(d) $h_i$ 是自由参数,只有 Clarke 这个选取才给出“付外部性”的漂亮解释和 IR 性质。

最优机制(Myerson)与两条不可能性定理

本节是机制设计理论的高峰之一。我们先解决一个“建设性”的问题:在所有可行的机制里,卖方收入最大的拍卖长什么样(Myerson 最优拍卖);再面对两个“破坏性”的事实:在两类重要场景中,我们想要的若干好性质根本不可能同时满足(Gibbard-Satterthwaite 定理与 Myerson-Satterthwaite 定理)。一正一反,恰好刻画了机制设计能做什么、不能做什么。

阅读前的约定:本节默认买方的私有信息是其估值(valuation) $v_i$,每个买家的估值独立地从某个分布中抽取,这叫独立私有价值(independent private values, IPV) 环境。我们关心的机制都满足两条最低要求:激励相容(incentive compatibility, IC),即诚实报告是最优的;个体理性(individual rationality, IR),即参与不会使期望效用为负。


一、Myerson 最优拍卖:从引理到虚拟价值

1.1 设置与目标

考虑单物品拍卖,有 $n$ 个买家。买家 $i$ 的估值 $v_i$ 独立地从区间 $[\underline{v}_i,\,\bar{v}_i]$ 上抽取,其累积分布函数(cumulative distribution function, CDF) 为 $F_i$,概率密度函数(probability density function, PDF) 为 $f_i$。记估值向量 $v=(v_1,\dots,v_n)$,并用 $v_{-i}$ 表示去掉 $i$ 后的其余分量。

一个(直接)机制由两部分组成:

  • 分配规则(allocation rule) $x_i(v)\in[0,1]$,表示在报告 $v$ 时把物品分配给 $i$ 的概率(可行性要求 $\sum_i x_i(v)\le 1$)。
  • 支付规则(payment rule) $p_i(v)$,表示 $i$ 需支付的金额。

买家 $i$ 的效用是准线性的:$u_i = v_i\, x_i - p_i$。卖方(设计者)想最大化期望总收入 $\mathbb{E}!\left[\sum_i p_i(v)\right]$,约束是 IC 与 IR。

核心难点:收入是支付决定的,但支付又被 IC 约束牢牢绑住,不能随便定。Myerson 的贡献就是先把“支付”用“分配”表达出来,从而把一个二维优化(同时设计 $x$ 和 $p$)降为只关于分配规则 $x$ 的一维优化。

1.2 Myerson 引理(Myerson’s Lemma)

为聚焦,先固定其他买家的报告 $v_{-i}$,从买家 $i$ 的视角看。定义 $i$ 在自身估值为 $v_i$、诚实报告时的期望中标概率期望支付(对 $v_{-i}$ 取期望)为

\[\bar{x}_i(v_i)=\mathbb{E}_{v_{-i}}[x_i(v_i,v_{-i})], \qquad \bar{p}_i(v_i)=\mathbb{E}_{v_{-i}}[p_i(v_i,v_{-i})].\]

买家 $i$ 谎报为 $z$(实际估值 $v_i$)时的期望效用是 $v_i\,\bar{x}_i(z)-\bar{p}_i(z)$。

Myerson 引理: 一个机制满足 IC(贝叶斯激励相容)当且仅当

  1. 单调性(monotonicity): $\bar{x}_i(v_i)$ 关于 $v_i$ 单调不减;
  2. 支付公式(payment identity): 期望支付由分配规则唯一确定, \(\gt \bar{p}_i(v_i)=\bar{p}_i(\underline{v}_i)+v_i\,\bar{x}_i(v_i)-\int_{\underline{v}_i}^{v_i}\bar{x}_i(t)\,dt . \gt\) 配合 IR,最优地取 $\bar{p}_i(\underline{v}_i)=0$(最低类型零支付),则 \(\gt \bar{p}_i(v_i)=v_i\,\bar{x}_i(v_i)-\int_{\underline{v}_i}^{v_i}\bar{x}_i(t)\,dt . \gt\)

证明骨架(必看)。 令 $U_i(v_i)=\max_z\big[v_i\,\bar{x}_i(z)-\bar{p}_i(z)\big]$ 为 $i$ 的均衡期望效用。在 IC 下最优的 $z=v_i$,故 $U_i(v_i)=v_i\,\bar{x}_i(v_i)-\bar{p}_i(v_i)$。

第一步(包络定理 / envelope theorem)。$U_i$ 是若干关于 $v_i$ 的线性函数的上确界(取 $z$ 时函数为 $v_i\,\bar{x}_i(z)-\bar{p}_i(z)$,斜率是 $\bar{x}_i(z)$),故 $U_i$ 是凸函数,几乎处处可导,且

\[U_i'(v_i)=\bar{x}_i(v_i).\]

直觉:估值高一点点带来的额外效用,正比于“你拿到东西的概率”。由此积分

\[U_i(v_i)=U_i(\underline{v}_i)+\int_{\underline{v}_i}^{v_i}\bar{x}_i(t)\,dt .\]

第二步(解出支付)。把 $U_i(v_i)=v_i\,\bar{x}_i(v_i)-\bar{p}_i(v_i)$ 代入上式即得支付公式。又因 $U_i$ 凸 $\Rightarrow U_i’=\bar{x}_i$ 不减,这正是单调性。反向(单调 + 支付公式 $\Rightarrow$ IC)可由凸性逐点验证谎报不获利。$\blacksquare$

这条引理的威力在于:一旦确定了单调的分配规则,支付就被“锁死”了,没有自由度。所以最大化收入只剩选 $x$ 这一件事。

1.3 把收入改写成“虚拟价值”

现在对 $\bar{p}_i(v_i)$ 再对 $v_i$ 取期望,得到来自 $i$ 的期望收入。关键一步是对那个积分项做分部积分(integration by parts)

\[\mathbb{E}_{v_i}[\bar{p}_i(v_i)] =\mathbb{E}_{v_i}\!\left[\Big(v_i-\frac{1-F_i(v_i)}{f_i(v_i)}\Big)\bar{x}_i(v_i)\right].\]

于是定义买家 $i$ 的虚拟价值(virtual value / virtual valuation)

\[\boxed{\;\varphi_i(v_i)=v_i-\frac{1-F_i(v_i)}{f_i(v_i)}\;}\]

把所有买家加总,得到 Myerson 的核心恒等式:

\[\textbf{期望总收入}=\mathbb{E}_{v}\!\left[\sum_{i} \varphi_i(v_i)\,x_i(v)\right].\]

惊人之处: 期望收入完全等于期望的“虚拟价值之和”(按分配加权),里面根本没有出现支付。这把一个收入最大化问题,变成了一个看起来像“虚拟福利最大化”的问题。

虚拟价值的解读:$v_i$ 是真实价值,$\dfrac{1-F_i(v_i)}{f_i(v_i)}$ 是信息租金(information rent) 的代价。一个买家估值越高,卖方越要给他留出谎报为低估值的“租金”,虚拟价值就是扣除这部分租金后卖方实际能拿到的“净值”。注意 $\varphi_i$ 可以为负(当 $v_i$ 较低时),表示把物品给他反而拉低收入。

1.4 最优拍卖 = 按虚拟价值分配 + 最优保留价

为了最大化 $\mathbb{E}[\sum_i \varphi_i(v_i)x_i(v)]$,逐点(对每个 $v$)地选 $x$:

Myerson 最优拍卖(regular 情形): 把物品分配给虚拟价值最高且为正的那个买家;若所有虚拟价值都为负,则不卖(卖方留货)。即 \(\gt i^\*(v)=\arg\max_i \varphi_i(v_i),\quad \text{当且仅当}\ \varphi_{i^\*}(v_{i^\*})\ge 0\ \text{时才分配}. \gt\) 支付由 Myerson 支付公式确定(等价于“在虚拟价值空间里的二价拍卖”)。

这里需要一个技术条件:分布是 regular(正则) 的,即 $\varphi_i(\cdot)$ 单调不减,从而上述分配自动满足单调性、合法(满足 IC)。若不 regular,需对 $\varphi_i$ 做 “熨平”(ironing) 处理,把非单调段替换为常数后再分配,结论形式不变。

两个重要特例帮助记忆:

  • 对称情形(买家同分布 $F_i\equiv F$): 虚拟价值是同一个增函数,“虚拟价值最高”等价于“真实估值最高”,所以最优拍卖就是带保留价的第二价格拍卖(second-price auction with reserve)保留价(reserve price) $r^*$ 由 $\varphi(r^*)=0$,即 \(r^\*-\frac{1-F(r^\*)}{f(r^\*)}=0\) 决定。值得强调:在对称情形下,最优保留价 $r^*$ 与买家数量 $n$ 无关
  • 非对称情形: 因为是按虚拟价值而非真实估值排序,估值较低的弱买家也可能中标(只要其虚拟价值更高)。这就是最优拍卖对弱者的“歧视性补贴”,与社会有效拍卖(总把货给估值最高者)形成鲜明对比。

1.5 单买家定价的直观例子(最能讲清虚拟价值与保留价)

设只有一个买家,估值 $v\sim \text{Uniform}[0,1]$,即 $F(v)=v$,$f(v)=1$。卖方此时就是个垄断定价者:挂出价格 $r$,买家在 $v\ge r$ 时购买。期望收入

\[R(r)=r\cdot \Pr(v\ge r)=r(1-r).\]

求导 $R’(r)=1-2r=0\Rightarrow r^*=1/2$,最优期望收入 $R(1/2)=1/4$。

再用 Myerson 框架验证:虚拟价值

\[\varphi(v)=v-\frac{1-F(v)}{f(v)}=v-(1-v)=2v-1.\]

“只有虚拟价值非负才分配” $\Leftrightarrow 2v-1\ge 0 \Leftrightarrow v\ge 1/2$。所以保留价恰是 $r^*=1/2$,与直接微分完全一致。

这个例子点出最优机制的精髓:为了多赚钱,卖方宁可以正概率不成交(这里有 $1/2$ 的概率卖不出去),用“门槛”换“单价”。社会有效率要求只要 $v\gt 0$(这里成本为 $0$)就该成交,可见收入最优与社会有效率天然冲突,这正好引出第二部分的不可能性。

速记 / 考点(第一部分)

  • Myerson 引理 = 单调性 + 支付公式;IC $\Leftrightarrow$ $\bar{x}_i$ 不减,且 $\bar{p}_i(v_i)=v_i\bar{x}_i(v_i)-\int_{\underline v_i}^{v_i}\bar{x}_i(t)dt$。会背、会用包络定理 $U_i’=\bar{x}_i$ 推。
  • 虚拟价值 $\varphi_i(v)=v-\dfrac{1-F(v)}{f(v)}$;期望收入 $=\mathbb{E}[\sum_i\varphi_i x_i]$(无支付项)。
  • 最优拍卖 = 把货给虚拟价值最高且 $\ge 0$ 的人;regular 不满足要 ironing。
  • 对称 $\Rightarrow$ 带保留价的二价拍卖,$r^*$ 由 $\varphi(r^*)=0$ 给出,且 $r^*$ 与 $n$ 无关。
  • 均匀 $[0,1]$ 单买家:$\varphi=2v-1$,$r^*=1/2$,收入 $1/4$(必考小例)。
  • 一句话:Myerson = 在“虚拟价值空间”里做有效(VCG/二价)拍卖

二、不可能性定理之一:Gibbard-Satterthwaite 定理

第一部分的机制都靠金钱转移(money / transfers) 来对齐激励。一个自然的问题是:如果没有钱(纯投票 / 社会选择),还能不能设计出诚实占优的好机制?Gibbard-Satterthwaite 定理给出近乎绝望的回答。

2.1 设置

有 $n$ 个选民,候选结果集合 $A$($\mid A\mid =m$)。每个选民 $i$ 对 $A$ 有一个严格偏好序(strict preference / linear order) $\succ_i$。社会选择函数(social choice function, SCF) $g$ 把每个偏好组合映为一个胜出结果:$g:\mathcal{P}^n\to A$,这里 $\mathcal{P}$ 是 $A$ 上所有严格偏好序的集合(定义域不受限 / unrestricted domain,即允许任意偏好)。

几个性质:

  • 防策略操纵 / 占优策略激励相容(strategy-proof, SP): 任何选民无论别人怎么报,诚实报告都是(弱)最优的,谎报无法得到自己更偏好的结果。
  • 满射 / 公民主权(onto / surjective): 每个候选结果都可能在某种偏好下胜出(排除“无论怎么投都选 $a$”这种摆设)。
  • 独裁(dictatorship): 存在某个固定选民 $d$,使 $g$ 永远输出 $d$ 最偏好的那个结果,完全无视其他人。

2.2 定理陈述

Gibbard-Satterthwaite 定理: 若候选结果至少有三个($\mid A\mid \ge 3$)、定义域不受限、且 SCF 满射,则 \(\gt g \text{ 防策略操纵(strategy-proof)}\ \Longleftrightarrow\ g \text{ 是独裁的(dictatorship)}. \gt\) 即:在无金钱、结果 $\ge 3$、偏好不受限时,唯一既满射又防策略操纵的社会选择函数就是独裁

注意三个前提缺一不可:

  • $\mid A\mid \ge 3$: 只有两个候选时,简单多数表决就既满射又防操纵(且非独裁),定理失效。两候选是个特例,正是因为它“无操纵空间”。
  • 不受限定义域: 若偏好被限制(例如单峰偏好 / single-peaked),则中位数选民机制(median voter) 等非独裁的防操纵规则存在,定理被绕过。这是逃离不可能性的主要出口。
  • 满射: 排除常值函数这种平凡反例。

2.3 直觉与证明骨架

直觉:丰富(不受限)的偏好域意味着选民总能通过谎报来“改变结果对自己的相对位置”,除非规则本质上只听某一个人的话。结果越多、偏好越自由,操纵的缝隙越多,唯一堵死所有缝隙的办法就是把决定权全交给一个人。

证明骨架(与 Arrow 不可能性定理 / Arrow’s impossibility theorem 的等价路线):

  1. 从 SP 推出单调性(Maskin monotonicity): 防策略操纵的 SCF 满足一种局部单调性:若把胜出结果 $a$ 在某人偏好中“往上提”而不改变与他者的相对序,$a$ 仍胜出。
  2. 构造一个社会福利函数(social welfare function): 用 $g$ 在各种“二元限制”下的选择来定义一个对全序的排序,证明它满足 Arrow 的一致性(unanimity / Pareto)无关方案独立性(independence of irrelevant alternatives, IIA)。$\mid A\mid \ge 3$ 在这里是关键,因为 IIA 与传递性只有在三个及以上选项时才相互冲突。
  3. 套用 Arrow 定理: 满足 unanimity + IIA 且结果 $\ge 3$ 的社会福利函数必有独裁者;把这个独裁者翻译回 $g$,即得 $g$ 独裁。$\blacksquare$

一句记忆:G-S 之于“投票(无钱)”,正如 Arrow 之于“偏好聚合”,二者本质同源。

2.4 意义

  • 它解释了为什么现实投票规则(多数决、波达计数 Borda、即时复选 IRV 等)全都可被策略性投票操纵,这不是设计水平问题,而是数学上的必然。
  • 它反衬出金钱转移的价值:正因为 VCG / Myerson 这类机制能用支付来“买”诚实,机制设计在拍卖等有钱场景里才能既防操纵又非独裁。钱是逃离 G-S 的最重要工具。
  • 它把研究引向受限定义域(单峰偏好、可转让效用等),那里才有非平凡的防操纵机制。

速记 / 考点(G-S)

  • 陈述要点:$\mid A\mid \ge 3$ + 不受限定义域 + 满射 + strategy-proof $\Rightarrow$ 独裁
  • 三前提的反例:两候选(多数决可行)、单峰偏好(中位数机制)、满射(排除常值)。
  • 与 Arrow 等价;证明经 Maskin 单调性 + IIA + unanimity。
  • 寓意:无金钱场景,防操纵几乎等于独裁;钱(转移支付)是破局关键

三、不可能性定理之二:Myerson-Satterthwaite 定理

G-S 说的是“没钱”的世界。下面回到“有钱”的世界,但换成双边交易(bilateral trade):一个卖家、一个买家,双方都有私有信息。Myerson-Satterthwaite 定理告诉我们,即便允许金钱转移,也无法把所有好性质一次集齐。

3.1 设置

一个卖家持有一件物品,成本(即卖家估值)$c\sim G$,密度 $g$,支撑于 $[\underline{c},\bar{c}]$;一个买家估值 $v\sim F$,密度 $f$,支撑于 $[\underline{v},\bar{v}]$。两者独立。物品该不该易手?社会有效率(efficiency)要求:当且仅当 $v\ge c$ 时成交(高估值方拥有物品)。

我们希望机制同时满足四条性质:

  • (事后/事前)有效率(efficiency): 交易发生当且仅当 $v\ge c$,绝不错失任何有利可图的交易,也不做亏本交易。
  • 贝叶斯激励相容(Bayesian incentive compatibility, BIC): 双方都诚实报告自己的私有估值。
  • 个体理性(individual rationality, IR): 双方的(期望)参与效用非负,即都自愿参与。
  • 预算平衡(budget balance, BB): 买家付的钱恰好等于卖家收的钱,没有外部第三方贴钱(更强的是事后预算平衡,弱一点是事前 $\mathbb{E}[\text{净转移}]\le 0$)。

3.2 定理陈述

Myerson-Satterthwaite 定理: 在上述双边交易中,只要买卖双方估值区间有重叠且各自有不确定性(即交易是否有效率本身是不确定的,$\Pr(v\gt c)\in(0,1)$ 且 $\Pr(v\lt c)\gt 0$),就不存在任何贝叶斯机制能够同时满足 \(\gt \textbf{有效率} + \textbf{BIC} + \textbf{IR(双边)} + \textbf{预算平衡}. \gt\) 四者中至多只能要三个。

3.3 直觉

每一方都想“虚张声势”:买家想压低报价以少付钱,卖家想抬高要价以多收钱。为了让双方诚实(BIC + IR),机制必须给双方各自留下信息租金:买家少付一点、卖家多收一点。可在有效率要求下,物品的“社会价值”是固定的 $v-c$,它不足以同时支付买卖双方的租金,于是要么机制亏钱(违反预算平衡,需第三方补贴),要么牺牲某些有效率交易(在 $v$ 略大于 $c$ 时不成交),要么逼某一方亏本参与(违反 IR)。双边的私有信息使租金“双向叠加”,把有效率盈余榨干,这是症结。

对照 VCG:在拍卖里,VCG 机制能实现有效率 + 占优诚实 + IR,但它通常不预算平衡(需要外部资助或会有盈余/赤字)。Myerson-Satterthwaite 正是把“VCG 不平衡”这一现象在双边交易里上升为不可能定理:有了双边私有信息,有效率与预算平衡的矛盾无法调和。

3.4 证明骨架(用 Myerson 支付公式做)

把对买卖双方各自用一遍 Myerson 引理的支付公式,可以推出一个干净的不等式。定义交易概率 $x(v,c)\in[0,1]$。对买家用虚拟价值 $\varphi^B(v)=v-\frac{1-F(v)}{f(v)}$,对卖家用其“虚拟成本”$\varphi^S(c)=c+\frac{G(c)}{g(c)}$。可以证明:任何 BIC + IR 机制的期望预算盈余满足

\[\mathbb{E}[\text{卖家收入}-\text{买家支出}] = \mathbb{E}\big[(\varphi^B(v)-\varphi^S(c))\,x(v,c)\big] - \big(\text{两方在最坏类型处的租金}\big),\]

更标准地,可导出预算平衡的期望盈余 $\le \mathbb{E}\big[(v-c)x\big]$ 减去信息租金项,整理后得到经典结论:

\[\mathbb{E}\Big[\big(\varphi^B(v)-\varphi^S(c)\big)\,x(v,c)\Big]\ \ge\ 0 \quad\text{是 BB+IR 的必要条件}.\]

有效率要求 $x=\mathbf{1}{v\ge c}$。把这个有效率分配代入上式,由于在 $v$ 略大于 $c$ 的区域 $\varphi^B(v)-\varphi^S(c)\lt 0$(虚拟价值低于真实价值、虚拟成本高于真实成本,二者各被信息租金拉开),积分严格为负,与必要条件矛盾。矛盾即证:有效率分配无法满足 BB + IR + BIC。 $\blacksquare$

(要点在于 $\varphi^B(v)\le v$、$\varphi^S(c)\ge c$,所以即便 $v\ge c$ 也可能 $\varphi^B(v)\lt \varphi^S(c)$;这个“虚拟价值的缝隙”正是不可能性的根源。)

3.5 一个让人记住的小例子

设 $v,c$ 都独立服从 $\text{Uniform}[0,1]$。有效率交易区域是 ${v\ge c}$,期望有效率盈余 $\mathbb{E}[(v-c)^+]=\frac{1}{6}\gt 0$,确实有大量互利交易。但 Myerson-Satterthwaite 告诉我们:没有任何 BIC+IR+BB 机制能把这些交易全部实现。

最优的“次优”机制(Chatterjee-Samuelson 的双重拍卖 / double auction:买卖双方各报价,价差为正时按中点成交)只在 $v\ge c+\frac14$ 时成交,因此牺牲了 $0\le v-c\lt \frac14$ 这一带的有利可图交易。这条“$\frac14$ 间隙”是双边私有信息造成效率损失的经典数字,值得记住。

3.6 意义

  • 它为“市场失灵”提供了信息经济学的微观基础:即使买卖双方都知道存在互利空间,私有信息也会阻碍有效率交易,这与 Coase 定理(无交易成本时总能达到有效率)形成对照,私有信息就是一种根本性的交易成本
  • 它界定了机制设计的根本边界:在双边交易里,必须在有效率、自愿参与、预算自足之间做权衡,常见做法是放弃完全有效率(容忍少量交易不成)以换取 BB + IR(如双重拍卖)。
  • 与 VCG 配合理解:单边私有信息(拍卖)可以有效率 + 诚实,但代价是非预算平衡;双边私有信息(交易)连这个代价都救不回来,有效率与预算平衡彻底不可兼得。

速记 / 考点(M-S)

  • 陈述:双边交易、双方私有估值、支撑重叠且有不确定 $\Rightarrow$ 有效率 + BIC + IR + 预算平衡 四者不可兼得(至多三)。
  • 直觉:双向信息租金叠加,榨干 $v-c$ 的有效率盈余。
  • 证明工具:买家虚拟价值 $\varphi^B=v-\frac{1-F}{f}$,卖家虚拟成本 $\varphi^S=c+\frac{G}{g}$;BB+IR 需要 $\mathbb{E}[(\varphi^B-\varphi^S)x]\ge0$,而有效率 $x=\mathbf 1{v\ge c}$ 使其为负,矛盾。
  • 经典例子:$v,c\sim U[0,1]$,最优双重拍卖只在 $v\ge c+\frac14$ 成交,存在 $\frac14$ 效率间隙
  • 与 VCG 对照:VCG 牺牲预算平衡换有效率;M-S 说双边交易连这都做不到

四、本节总览:一正两反,三句话串起来

结果场景一句话
Myerson 最优拍卖单边私有信息、有钱收入最大化 = 在虚拟价值空间做有效拍卖 + 设保留价(建设性的“能做到”)
Gibbard-Satterthwaite无钱、纯投票、$\ge3$ 结果防操纵的社会选择函数只能是独裁(无钱时的“做不到”)
Myerson-Satterthwaite双边私有信息、有钱有效率 + 诚实 + 自愿 + 预算平衡不可兼得(双边时的“做不到”)

贯穿主线(最重要的考试金句)

  • 虚拟价值是统一钥匙:Myerson 用它构造最优拍卖,Myerson-Satterthwaite 用它证明不可能;前者最大化 $\mathbb{E}[\sum\varphi_i x_i]$,后者用 $\varphi^B\lt v$、$\varphi^S\gt c$ 的“缝隙”导出矛盾。
  • 金钱转移决定可能性边界:无钱(G-S)几乎只能独裁;单边有钱(VCG/Myerson)可有效率且诚实但失预算平衡;双边有钱(M-S)连有效率+预算平衡都救不回来。
  • 效率与其它目标天生有张力:最优拍卖为收入牺牲效率(保留价导致不成交),双边交易为诚实+平衡牺牲效率($\frac14$ 间隙),其根源都是私有信息要求支付信息租金
This post is licensed under CC BY 4.0 by the author.