Quant 面试题库:Brainteaser、概率与交易思维

这份清单面向 Jump Trading、Optiver、Jane Street、IMC、SIG、Akuna 等量化交易公司常见的面试能力要求:快算、概率直觉、期望值、博弈、交易定价、统计判断和清晰表达。

注意:本文不是公司内部原题合集,而是基于公开面经、公司公开准备资料、经典概率题和交易训练题整理出的题型地图。真正面试时,面试官更看重你的推理过程、边界条件、口头表达和修正错误的能力。

使用方法

  • 第一遍:只看题目,限时口算或白板推导。
  • 第二遍:点击“解答”检查思路,不要一开始就背答案。
  • 第三遍:把每题改一个参数,确认自己不是只记住了特例。
  • 面试表达顺序:先复述题意,再列变量,然后给出核心公式或递推,最后检查极端情况。

标记说明:

  • 基础:必须熟练,通常可以在 1-3 分钟内解决。
  • 中等:需要建模,通常需要 5-10 分钟。
  • 困难:容易有陷阱,适合做深度训练。
  • 重点:文末给出较完整解答,其余题给提示或关键思路。

题目目录


一、Mental Math 与估算

MM-001 复利心算

难度:基础|标签:心算、近似|解答

不使用计算器,估算 1.011001.01^{100}0.991000.99^{100}1.05201.05^{20}。要求说明你用了什么近似。

MM-002 快速赔率换算

难度:基础|标签:赔率、概率|解答

某事件 fair probability 是 37%。如果用 decimal odds 报价,fair odds 是多少?如果盘口给 2.80,期望收益是正还是负?

MM-003 Fermi 估算

难度:基础|标签:估算、拆解|解答

估算美国每天消耗多少杯咖啡。你不需要知道真实数字,但要给出可解释的拆分。

MM-004 交易速度题

难度:中等|标签:心算、百分比|解答

一个资产先上涨 12.5%,再下跌 20%,最后上涨 10%。最终价格相对初始价格变动多少?

MM-005 平方根估算

难度:基础|标签:近似、波动率|解答

不使用计算器,估算 252\sqrt{252}365\sqrt{365}10\sqrt{10}。这些数在波动率年化中为什么常见?


二、概率基础与条件概率

P-001 三枚硬币

难度:基础|标签:条件概率、样本空间|解答

你抛三枚公平硬币。已知至少有一枚是正面,求三枚都是正面的概率。

P-002 两个孩子问题

难度:中等|标签:条件概率、信息结构|解答

一个家庭有两个孩子。已知至少一个是女孩,两个都是女孩的概率是多少?如果改成“你随机遇到其中一个孩子,她是女孩”,答案是否改变?

P-003 Monty Hall

难度:基础|标签:Bayes、信息更新|解答

三扇门后有一辆车和两只羊。你先选一扇门,主持人打开一扇有羊的门。你应该换门吗?胜率是多少?

P-004 假阳性检测

难度:重点|标签:Bayes、base rate|解答

某病在人群中的患病率是 1%。检测灵敏度 99%,特异度 95%。一个人检测阳性,他真正患病的概率是多少?

P-005 两个独立检测

难度:重点|标签:条件独立、Bayes|解答

沿用 P-004。现在同一个人做两种条件独立的检测,二者灵敏度都是 99%,特异度都是 95%。如果两次都阳性,患病概率是多少?

P-006 抽牌条件概率

难度:中等|标签:条件概率、组合|解答

从标准 52 张牌中抽 2 张。已知至少一张是 A,求两张都是 A 的概率。如果已知其中一张是黑桃 A,答案如何变化?

P-007 独立但不直观

难度:中等|标签:独立性、反例|解答

构造两个随机变量 X,YX,Y,它们不相关,即 Cov(X,Y)=0\operatorname{Cov}(X,Y)=0,但并不独立。


三、期望、方差与最优停止

EV-001 第一次正面

难度:基础|标签:几何分布、期望|解答

不断抛公平硬币,直到第一次出现正面为止。期望抛掷次数是多少?

EV-002 连续两个正面

难度:重点|标签:递推、状态机|解答

不断抛公平硬币,直到第一次出现连续两个正面 HH。期望抛掷次数是多少?

EV-003 骰子直到 6

难度:基础|标签:几何分布|解答

不断掷公平六面骰,直到第一次出现 6。期望掷骰次数是多少?方差是多少?

EV-004 骰子最大值

难度:重点|标签:期望、尾和公式|解答

掷 3 个公平六面骰,记最大值为 MM。求 E[M]E[M]

EV-005 选一次还是重抽

难度:重点|标签:最优停止、阈值策略|解答

你从 [0,1][0,1] 均匀分布中抽一个数。你可以接受它,也可以放弃并重新抽一次,但第二次必须接受。最优策略和期望收益是多少?

EV-006 圣彼得堡悖论

难度:中等|标签:期望、风险偏好|解答

公平硬币一直抛到第一次正面。如果第 nn 次才出现正面,你获得 2n2^n 元。这个游戏期望收益是多少?你愿意付无限价格参加吗?

EV-007 Coupon Collector

难度:重点|标签:期望线性性、调和数|解答

nn 种等概率优惠券,每次随机获得一种。集齐所有优惠券的期望次数是多少?

EV-008 抛硬币赌博

难度:中等|标签:EV、止损、鞅直觉|解答

你有 10 元,每次公平硬币,正面赢 1 元,反面输 1 元。到 20 元停止盈利,到 0 元破产。到达 20 元的概率是多少?期望游戏轮数是多少?


四、组合计数

C-001 生日悖论

难度:重点|标签:组合、近似|解答

一个房间里至少多少人时,存在两人生日相同的概率超过 50%?给出近似推导。

C-002 同花概率

难度:基础|标签:扑克牌、组合|解答

5 张扑克牌中恰好同花的概率是多少?这里“同花”指 5 张同一花色,不排除顺子。

C-003 无相邻选择

难度:中等|标签:组合、隔板法|解答

从 1 到 20 中选 5 个数,要求任意两个都不相邻。共有多少种选法?

C-004 错排

难度:中等|标签:容斥、错排|解答

有 8 个人随机拿 8 顶帽子。没有任何人拿到自己帽子的概率是多少?

C-005 抽球无放回

难度:中等|标签:超几何分布|解答

袋中有 7 个红球、5 个蓝球、4 个绿球。无放回抽 6 个,恰好 3 红、2 蓝、1 绿的概率是多少?


五、随机过程与 Markov Chain

RW-001 Gambler’s Ruin 概率

难度:重点|标签:随机游走、边界条件|解答

你有 ii 元,目标是到 NN 元,每轮以概率 pp 赢 1 元,以概率 q=1pq=1-p 输 1 元。到达 NN 前不破产的概率是多少?分别考虑 p=1/2p=1/2p1/2p\ne 1/2

RW-002 随机游走回到原点

难度:中等|标签:随机游走、递归性|解答

在整数线上从 0 出发,每步等概率向左或向右走。最终是否会回到 0?在二维、三维情形会怎样?

RW-003 三状态天气链

难度:中等|标签:Markov Chain、平稳分布|解答

天气只有晴、阴、雨三种状态,转移矩阵为

P=(0.70.20.10.30.40.30.20.30.5).P= \begin{pmatrix} 0.7&0.2&0.1\\ 0.3&0.4&0.3\\ 0.2&0.3&0.5 \end{pmatrix}.

长期来看三种天气各占多少比例?

RW-004 抛硬币模式等待时间

难度:困难|标签:pattern matching、状态机|解答

公平硬币中,第一次出现模式 HTH 的期望等待时间是多少?和 HHH 相比哪个更长?

RW-005 吸收链

难度:中等|标签:吸收状态、递推|解答

一只粒子在状态 0,1,2,3 上移动,0 和 3 是吸收态。从 1 出发,每步等概率向左右移动。到达 3 而不是 0 的概率是多少?期望吸收时间是多少?


六、博弈与策略

G-001 石头剪刀布混合策略

难度:基础|标签:Nash、混合策略|解答

为什么标准石头剪刀布的均衡策略是三种手势各出 1/31/3?如果赢得 2 分、平局 0 分、输掉 1 分,均衡是否变化?

G-002 二价拍卖

难度:重点|标签:拍卖、激励相容|解答

在 sealed-bid second-price auction 中,为什么诚实报价是弱占优策略?

G-003 Dollar Auction

难度:中等|标签:博弈、沉没成本|解答

拍卖 1 美元,最高价者获得 1 美元,但最高价和第二高价都要支付自己的出价。为什么这个游戏容易导致非理性升级?

G-004 猜均值的 2/3

难度:中等|标签:迭代删除、level-k|解答

一群人各自选择 0 到 100 的一个数,最接近所有人平均数的 2/32/3 者获胜。完全理性共同知识下均衡是多少?现实实验中为什么常不是这个数?

G-005 信息不完全交易

难度:困难|标签:adverse selection、市场微观结构|解答

你是 market maker,客户要向你买入或卖出一项资产。你不知道客户是否有信息优势。为什么 bid-ask spread 必须覆盖 adverse selection 风险?


七、Brainteaser 与逻辑题

B-001 100 个囚犯和灯泡

难度:重点|标签:逻辑、协议设计|解答

100 个囚犯被单独随机带入一个房间,房间里有一个灯泡,初始状态未知。囚犯入房时可以开关灯,也可以保持不变。某个囚犯可以宣布“所有人都至少进过房间一次”,如果正确全员释放,错误全员失败。囚犯事先能商量策略。如何保证最终正确宣布?

B-002 十二球称重

难度:困难|标签:信息论、三分搜索|解答

12 个球中有一个重量异常,不知道偏重还是偏轻。只有一架天平,最多称 3 次。如何找出异常球并判断轻重?

B-003 海盗分金币

难度:中等|标签:逆向归纳|解答

5 个理性海盗按资历从高到低分 100 枚金币。最高资历者提案,若至少半数同意则执行,否则他被扔下船,剩下的人继续。海盗先保命,再最大化金币,再偏好把别人扔下船。第一个海盗如何分配?

B-004 蓝眼睛岛民

难度:困难|标签:共同知识、归纳|解答

岛上有若干蓝眼睛人,他们能看到别人眼睛颜色但不知道自己颜色。外来者公开说:“岛上至少有一个蓝眼睛人。”为什么这句话可能改变所有人的行为?

B-005 三个开关和一盏灯

难度:基础|标签:物理信息、实验设计|解答

门外有三个开关,门内有一盏灯。你只能进房间一次,如何判断哪个开关控制灯?


八、Market Making 与交易直觉

MK-001 Fair Price 与 spread

难度:重点|标签:market making、EV|解答

某事件有 60% 概率发生,发生时合约支付 1,不发生支付 0。fair price 是多少?如果你要同时报 bid 和 ask,为什么不能都报 0.60?

MK-002 库存风险

难度:中等|标签:inventory、risk|解答

你连续给客户报价,发现自己一直在买入同一个资产,库存越来越大。即使 fair value 不变,你应该如何调整 bid 和 ask?

MK-003 Kelly Criterion

难度:重点|标签:Kelly、增长率|解答

你有一个下注机会:以概率 55% 赢,赢时获得下注额的 1 倍,输时损失下注额。为了最大化长期 log wealth,应该下注财富的多少比例?

MK-004 二元合约反推概率

难度:基础|标签:implied probability|解答

一个二元合约价格是 0.37,到期支付 0 或 1。如果忽略利率和风险溢价,市场隐含概率是多少?为什么真实概率不一定等于它?

MK-005 订单流信息

难度:困难|标签:Bayes、order flow|解答

你认为某资产 fair value 是 100,并报价 99.8 / 100.2。一个客户立刻 hit 你的 bid,向你卖出大量资产。你是否应该更新 fair value?为什么?

MK-006 相关资产定价

难度:中等|标签:相关性、hedge|解答

资产 A 和 B 高度正相关。你持有大量 A 的多头库存。客户现在想向你买 B。你在 B 上的报价应该如何受 A 库存影响?


九、统计与数据直觉

S-001 置信区间

难度:基础|标签:统计推断|解答

你观察到 100 次独立交易信号,其中 57 次盈利。如何粗略判断这个信号是否显著优于 50%?

S-002 多重检验

难度:重点|标签:selection bias、p-hacking|解答

你测试了 1000 个交易信号,其中 20 个在历史数据上 p-value 小于 0.01。你应该兴奋吗?为什么?

S-003 回归到均值

难度:基础|标签:统计直觉|解答

某交易员今年收益排名前 1%。明年你是否应预期他仍然排名前 1%?为什么?

S-004 A/B Test 停止规则

难度:中等|标签:实验设计、optional stopping|解答

你每天看一次 A/B test 结果,只要 p-value 小于 0.05 就停止并宣布成功。这个流程有什么问题?

S-005 相关不等于因果

难度:基础|标签:因果、confounding|解答

你发现某股票在新闻数量多的日子波动更高。能否说新闻导致波动?还需要考虑什么?


十、编程与模拟

CODE-001 Monte Carlo 验证 Monty Hall

难度:基础|标签:simulation、sanity check|解答

写伪代码模拟 Monty Hall,验证换门胜率约为 2/32/3

CODE-002 按权重采样

难度:中等|标签:sampling、prefix sum|解答

给定权重数组 w1,,wnw_1,\ldots,w_n,设计一个函数按概率 wi/jwjw_i / \sum_j w_j 返回索引 ii

CODE-003 Reservoir Sampling

难度:中等|标签:streaming、sampling|解答

数据流长度未知,只能保存一个元素。如何等概率地从所有已经看到的元素中抽取一个?

CODE-004 洗牌算法

难度:基础|标签:Fisher-Yates、公平性|解答

如何实现公平随机洗牌?为什么“对每个位置随机交换任意位置”如果写错,可能不是均匀分布?

CODE-005 模拟 Coupon Collector

难度:中等|标签:simulation、EV|解答

写伪代码估计 n=100n=100 时集齐所有优惠券所需次数的均值,并和理论值比较。


解答区

一、Mental Math 与估算答案

MM-001 解答:复利心算

核心近似是 (1+x)nenx(1+x)^n \approx e^{nx},当 xx 较小时很好用。

  • 1.01100e12.7181.01^{100} \approx e^1 \approx 2.718。更精细地说,ln(1.01)0.00995\ln(1.01)\approx 0.00995,所以约 e0.9952.70e^{0.995}\approx 2.70
  • 0.99100e10.3680.99^{100} \approx e^{-1} \approx 0.368。更精细约 0.3660.366
  • 1.0520e12.7181.05^{20} \approx e^1 \approx 2.718,但因为 ln(1.05)0.0488\ln(1.05)\approx 0.0488,所以约 e0.9762.65e^{0.976}\approx 2.65

面试重点不是记住答案,而是能说出 log approximation,并知道什么时候误差会变大。

返回题目

MM-002 解答:快速赔率换算

Decimal fair odds 是概率的倒数:1/0.372.701/0.37 \approx 2.70。如果盘口给 2.80,则每下注 1 的期望净收益为

0.37×1.800.63×1=0.036.0.37\times 1.80 - 0.63\times 1 = 0.036.

所以是正期望,约 3.6% edge。也可以用 2.80×0.371=0.0362.80\times 0.37 - 1 = 0.036 直接算总回报 EV。

返回题目

MM-003 解答:Fermi 估算

一种可解释拆分:

  • 美国人口约 3.3 亿。
  • 假设成年人占 75%,约 2.5 亿。
  • 假设 60% 成年人喝咖啡,约 1.5 亿人。
  • 平均每个喝咖啡者每天 1.5-2 杯。

估算结果约 2.25-3 亿杯/天。Fermi 题的评分重点是拆分是否合理、数量级是否稳定、能否解释最大不确定性来自哪里。

返回题目

MM-004 解答:交易速度题

价格乘数是

1.125×0.8×1.1=0.9×1.1=0.99.1.125 \times 0.8 \times 1.1 = 0.9 \times 1.1 = 0.99.

最终下跌 1%。注意涨跌百分比不能直接相加。

返回题目

MM-005 解答:平方根估算

  • 252\sqrt{252} 约在 15.8 到 15.9,因为 162=25616^2=256
  • 365\sqrt{365} 约 19.1,因为 192=36119^2=361
  • 103.16\sqrt{10}\approx 3.16

日波动率年化常用 σannualσdaily252\sigma_{\text{annual}}\approx \sigma_{\text{daily}}\sqrt{252},其中 252 近似一年交易日数;365 用于自然日尺度;平方根来自独立收益方差随时间线性累加。

返回题目

二、概率基础与条件概率答案

P-001 解答:三枚硬币

至少一枚正面排除了 TTT,剩余 7 个等概率结果。三枚都是正面只有 HHH 一个结果,所以概率是 1/71/7

返回题目

P-002 解答:两个孩子问题

若只知道“至少一个是女孩”,样本空间是 GG、GB、BG,答案是 1/31/3

若“随机遇到其中一个孩子,她是女孩”,信息生成方式不同。可以把孩子个体作为样本,见到女孩后另一个孩子仍有 1/21/2 概率是女孩,所以答案是 1/21/2。这题重点是信息如何被观察到。

返回题目

P-003 解答:Monty Hall

应该换门。初选中车概率是 1/31/3,初选中羊概率是 2/32/3。主持人知道车的位置并打开羊门后,若你初选错,换门必胜;若初选对,换门失败。因此换门胜率 2/32/3

返回题目

P-004 解答:假阳性检测

用 Bayes:

P(D+)=P(+D)P(D)P(+D)P(D)+P(+Dˉ)P(Dˉ).P(D\mid +)=\frac{P(+\mid D)P(D)}{P(+\mid D)P(D)+P(+\mid \bar D)P(\bar D)}.

代入:

0.99×0.010.99×0.01+0.05×0.99=0.00990.059416.7%.\frac{0.99\times 0.01}{0.99\times 0.01+0.05\times 0.99} =\frac{0.0099}{0.0594} \approx 16.7\%.

检测看起来很准,但低 base rate 会让假阳性占阳性样本的大部分。

返回题目

P-005 解答:两个独立检测

条件独立意味着:

P(++D)=0.992,P(++Dˉ)=0.052.P(++\mid D)=0.99^2,\quad P(++\mid \bar D)=0.05^2.

所以

P(D++)=0.992×0.010.992×0.01+0.052×0.99.P(D\mid ++)= \frac{0.99^2\times 0.01}{0.99^2\times 0.01+0.05^2\times 0.99}.

分子 0.0098010.009801,分母约 0.01227650.0122765,结果约 79.8%79.8\%

关键陷阱:两个检测只有在给定真实患病状态后独立,不能直接说两个阳性事件无条件独立。

返回题目

P-006 解答:抽牌条件概率

已知至少一张 A:

P(两张 A至少一张 A)=(42)(522)(482)=6198=133.P(\text{两张 A}\mid \text{至少一张 A}) =\frac{\binom{4}{2}}{\binom{52}{2}-\binom{48}{2}} =\frac{6}{198}=\frac{1}{33}.

已知其中一张是黑桃 A,则另一张从剩余 51 张里抽,是 A 的概率为 3/51=1/173/51=1/17

返回题目

P-007 解答:独立但不直观

XX{1,0,1}\{-1,0,1\} 上均匀分布,令 Y=X2Y=X^2。则

E[X]=0,E[XY]=E[X3]=0,E[X]=0,\quad E[XY]=E[X^3]=0,

所以 Cov(X,Y)=0\operatorname{Cov}(X,Y)=0。但 YY 完全由 XX 决定,显然不独立。例如 P(Y=0X=0)=1P(Y=0\mid X=0)=1,但 P(Y=0)=1/3P(Y=0)=1/3

返回题目

三、期望、方差与最优停止答案

EV-001 解答:第一次正面

这是参数 p=1/2p=1/2 的几何分布,期望 1/p=21/p=2

返回题目

EV-002 解答:连续两个正面

E0E_0 为当前没有连续前缀时的期望等待时间,E1E_1 为刚看到一个 H 后的期望等待时间。

E0E_0

E0=1+12E1+12E0.E_0=1+\frac12 E_1+\frac12 E_0.

E1E_1:下一次若 H 则结束,若 T 则回到 E0E_0

E1=1+120+12E0.E_1=1+\frac12\cdot 0+\frac12 E_0.

第一式化为 E0=2+E1E_0=2+E_1。代入第二式:

E0=2+1+12E0,E_0=2+1+\frac12E_0,

所以 E0=6E_0=6

返回题目

EV-003 解答:骰子直到 6

几何分布参数 p=1/6p=1/6。期望 1/p=61/p=6,方差 (1p)/p2=(5/6)/(1/36)=30(1-p)/p^2=(5/6)/(1/36)=30

返回题目

EV-004 解答:骰子最大值

用尾和公式:

E[M]=k=16P(Mk)=k=16(1P(Mk1)).E[M]=\sum_{k=1}^6 P(M\ge k) =\sum_{k=1}^6 \left(1-P(M\le k-1)\right).

对 3 个骰子,P(Mm)=(m/6)3P(M\le m)=(m/6)^3。因此

E[M]=k=16(1(k16)3)=603+13++53216.E[M]=\sum_{k=1}^6 \left(1-\left(\frac{k-1}{6}\right)^3\right) =6-\frac{0^3+1^3+\cdots+5^3}{216}.

03++53=2250^3+\cdots+5^3=225,所以

E[M]=6225216=10712164.958.E[M]=6-\frac{225}{216}=\frac{1071}{216}\approx 4.958.

返回题目

EV-005 解答:选一次还是重抽

第二次必须接受,期望是 1/21/2。所以第一次抽到 xx 时,如果 x1/2x\ge 1/2 接受,否则重抽。

最优期望:

E[max(X,1/2)]=01/212dx+1/21xdx=14+38=58.E[\max(X,1/2)] = \int_0^{1/2}\frac12 dx+\int_{1/2}^1 x dx =\frac14+\frac{3}{8}=\frac58.

返回题目

EV-006 解答:圣彼得堡悖论

期望收益:

n=1P(N=n)2n=n=112n2n=n=11=.\sum_{n=1}^{\infty}P(N=n)2^n =\sum_{n=1}^{\infty}\frac{1}{2^n}2^n =\sum_{n=1}^{\infty}1=\infty.

但真实支付意愿不会无限,因为财富有限、边际效用递减、赌场资金有限、风险约束存在。面试中应区分数学期望和可交易价格。

返回题目

EV-007 解答:Coupon Collector

已经收集到 kk 种时,获得新种类的概率是 (nk)/n(n-k)/n,等待新种类的期望是 n/(nk)n/(n-k)。总期望:

k=0n1nnk=nj=1n1j=nHn.\sum_{k=0}^{n-1}\frac{n}{n-k} =n\sum_{j=1}^{n}\frac1j =nH_n.

近似 n(logn+γ)n(\log n+\gamma)

返回题目

EV-008 解答:抛硬币赌博

公平随机游走从 10 到达 20 前不碰 0 的概率是 10/20=1/210/20=1/2

公平情形的期望吸收时间为 i(Ni)i(N-i)。这里 i=10,N=20i=10,N=20,所以期望轮数 100100

返回题目

四、组合计数答案

C-001 解答:生日悖论

没有两人同生日的概率约为

k=0m1(1k365)exp(m(m1)2365).\prod_{k=0}^{m-1}\left(1-\frac{k}{365}\right) \approx \exp\left(-\frac{m(m-1)}{2\cdot365}\right).

令重复概率超过 50%,即无重复概率小于 50%:

exp(m(m1)730)<0.5.\exp\left(-\frac{m(m-1)}{730}\right)<0.5.

所以 m(m1)>730ln2506m(m-1)>730\ln2\approx506m=23m=23。经典答案是 23 人。

返回题目

C-002 解答:同花概率

总手牌数 (525)\binom{52}{5}。同花手牌:先选花色 4 种,再从该花色 13 张中选 5 张:

4(135)(525).\frac{4\binom{13}{5}}{\binom{52}{5}}.

返回题目

C-003 解答:无相邻选择

1,,201,\ldots,2055 个不相邻数。设原选择为 a1<<a5a_1<\cdots<a_5,令 bi=ai(i1)b_i=a_i-(i-1)。则 1b1<<b5161\le b_1<\cdots<b_5\le 16。答案是

(165).\binom{16}{5}.

返回题目

C-004 解答:错排

错排数

!8=8!k=08(1)kk!.!8=8!\sum_{k=0}^{8}\frac{(-1)^k}{k!}.

概率是 !8/8!!8/8!,约为 1/e36.8%1/e\approx 36.8\%。精确值可按上式计算。

返回题目

C-005 解答:抽球无放回

超几何分布:

(73)(52)(41)(166).\frac{\binom73\binom52\binom41}{\binom{16}{6}}.

返回题目

五、随机过程与 Markov Chain 答案

RW-001 解答:Gambler’s Ruin 概率

uiu_i 是从 ii 出发先到 NN 而不是 0 的概率。边界 u0=0,uN=1u_0=0,u_N=1,递推:

ui=pui+1+qui1.u_i=pu_{i+1}+qu_{i-1}.

p=q=1/2p=q=1/2,解是线性的:

ui=iN.u_i=\frac{i}{N}.

pqp\ne q,通解为

ui=A+B(qp)i.u_i=A+B\left(\frac{q}{p}\right)^i.

代入边界得

ui=1(q/p)i1(q/p)N.u_i=\frac{1-(q/p)^i}{1-(q/p)^N}.

返回题目

RW-002 解答:随机游走回到原点

一维简单对称随机游走以概率 1 最终回到原点,二维也以概率 1 回到原点;三维及以上不是,回到原点的概率小于 1。这是随机游走 recurrence/transience 的经典结论。面试通常不要求证明,但要知道维度会改变结论。

返回题目

RW-003 解答:三状态天气链

求平稳分布 π\pi,满足 πP=π\pi P=\piπ1+π2+π3=1\pi_1+\pi_2+\pi_3=1。实战中可列线性方程或用数值方法。此题核心是知道长期比例不是逐行平均,而是左特征向量。

一个快速数值解约为:

π(0.4565,0.2826,0.2609).\pi\approx(0.4565,0.2826,0.2609).

返回题目

RW-004 解答:抛硬币模式等待时间

HTH 的期望等待时间是 10,HHH 的期望等待时间是 14。直觉上,HHH 有更强的自重叠结构,失败后可能留下部分前缀,但某些失败会让等待更久;严谨做法是建状态机。

对 HTH,设状态 0 表示没有匹配前缀,状态 1 表示已匹配 H,状态 2 表示已匹配 HT:

E0=1+12E1+12E0,E_0=1+\frac12E_1+\frac12E_0, E1=1+12E1+12E2,E_1=1+\frac12E_1+\frac12E_2, E2=1+120+12E0.E_2=1+\frac12\cdot0+\frac12E_0.

解得 E0=10E_0=10

返回题目

RW-005 解答:吸收链

到达 3 的概率从 1 出发是 1/31/3,这是公平 gambler’s ruin 的 i/Ni/N

期望吸收时间从 ii 出发为 i(Ni)i(N-i),这里 N=3,i=1N=3,i=1,所以是 2 步。也可列递推:

t1=1+12t2,t2=1+12t1,t_1=1+\frac12t_2,\quad t_2=1+\frac12t_1,

解得 t1=t2=2t_1=t_2=2

返回题目

六、博弈与策略答案

G-001 解答:石头剪刀布混合策略

标准情形中,如果你三种手势不是各 1/31/3,对手可以增加克制你高频手势的策略。均衡要求对手面对你的混合策略时,出任意纯策略的期望收益相同,因此三者概率相等。

如果赢 2、输 -1、平 0,仍然是对称零和结构,均衡仍为各 1/31/3

返回题目

G-002 解答:二价拍卖

设你的真实价值为 vv,最高其他报价为 mm。二价拍卖中,若你赢,支付 mm,不是自己的报价。

  • m<vm<v,你想赢;诚实报 vv 会赢。报低到低于 mm 会错误地输掉正收益机会。
  • m>vm>v,你想输;诚实报 vv 会输。报高到高于 mm 会错误地赢下负收益交易。
  • m=vm=v,赢输都无差异。

所以诚实报价是弱占优策略。

返回题目

G-003 解答:Dollar Auction

第二高价也要付款,使得落后者面临“再加一点可能减少损失”的局部激励。例如你已出 0.95 美元,对手出 0.96 美元;如果放弃,你损失 0.95;如果出 0.97 并赢,你净赚 0.03。双方不断用局部理性选择推动总出价超过 1 美元。

返回题目

G-004 解答:猜均值的 2/3

完全理性共同知识下,任何高于 66.6766.67 的数不可能赢,迭代删除后任何高于 44.4444.44 的数也不可能赢,继续下去唯一极限是 0。

现实中常出现 20-35 一带,因为参与者不是无限层级理性,而是 level-k 推理:我想别人会猜 50,所以我猜 33;我想别人会猜 33,所以我猜 22。

返回题目

G-005 解答:信息不完全交易

客户可能因为流动性需求交易,也可能因为掌握信息交易。如果 informed trader 只在价格对他有利时交易,market maker 成交后的条件期望会变差:

  • 客户打你的 ask 买入,可能说明真实价值高于你估计。
  • 客户 hit 你的 bid 卖出,可能说明真实价值低于你估计。

Spread 需要覆盖库存风险、运营成本和 adverse selection。否则你会在无信息客户身上小赚,在有信息客户身上大亏。

返回题目

七、Brainteaser 与逻辑题答案

B-001 解答:100 个囚犯和灯泡

指定一个囚犯做计数者,其他 99 人每人只在自己第一次看到灯灭时把灯打开一次。计数者每次看到灯亮,就把灯关掉并计数加 1。当计数达到 99 时,计数者知道其他每个人至少进过一次,于是宣布。

如果初始灯泡未知,需要处理初始为亮的情况。一种稳妥策略是让非计数者每人开灯两次,计数者数到 2×992\times99 后宣布;初始状态最多造成一次额外亮灯,不会导致误判。也可以设计预热阶段消除初始状态。

返回题目

B-002 解答:十二球称重

完整决策树很长,核心原则是每次称重有三种结果:左重、右重、平衡。3 次最多区分 33=273^3=27 种结果。异常球有 12×2=2412\times2=24 种可能,所以信息量刚够。

经典策略是把球编号 1-12:

  1. 第一次称 1,2,3,4 对 5,6,7,8。
  2. 若平衡,异常在 9-12;用第二、三次与已知正常球比较即可。
  3. 若不平衡,异常在 1-8,且方向有约束;第二次重新组合部分可疑球与正常球,使三种结果尽量均分。

面试中若要求完整方案,需要画三层决策树。更重要的是先说明信息论下界,再给出分组策略,不要盲试。

返回题目

B-003 解答:海盗分金币

逆向归纳:

  • 1 人时,他拿 100。
  • 2 人时,资历高者自己投赞成即可通过,拿 100,另一个 0。
  • 3 人时,需要 2 票。第 3 人在 2 人局会拿 0,所以给他 1,自己 99。
  • 4 人时,需要 2 票。第 2 人在 3 人局会拿 0,所以给他 1,自己 99。
  • 5 人时,需要 3 票。第 3、5 人在 4 人局会拿 0,所以各给 1,自己拿 98。

所以分配为:最高资历者 98,第三和第五各 1,其他 0。不同题设若“半数”是否包含自己、平票规则不同,答案会变。

返回题目

B-004 解答:蓝眼睛岛民

外来者的话把“至少有一个蓝眼睛人”变成共同知识。若有 1 个蓝眼睛人,他看不到其他蓝眼睛人,听到公告后当天知道自己是蓝眼睛并离开。若有 2 个,他们各自看到 1 个;第一天没人离开后,他们知道不是 1 个,于是第二天离开。归纳可得,若有 nn 个蓝眼睛人,他们会在第 nn 天一起离开。

核心不是新事实,而是共同知识层级发生变化。

返回题目

B-005 解答:三个开关和一盏灯

打开开关 A 一段时间后关掉,打开开关 B,然后进房间:

  • 灯亮:B 控制。
  • 灯灭但灯泡热:A 控制。
  • 灯灭且灯泡冷:C 控制。

返回题目

八、Market Making 与交易直觉答案

MK-001 解答:Fair Price 与 spread

二元合约 fair price 是期望支付:

0.6×1+0.4×0=0.60.0.6\times1+0.4\times0=0.60.

不能 bid 和 ask 都报 0.60,因为成交有成本和风险:订单流可能有信息、库存会波动、你需要补偿资本占用。合理报价可能是 0.58 / 0.62,具体宽度取决于风险和竞争。

返回题目

MK-002 解答:库存风险

如果库存越来越大,继续买入会增加风险。即使 fair value 不变,也应该降低 bid,让自己不那么愿意买;同时可能降低 ask,让卖出更容易发生,从而减库存。报价中心可以向下偏移,spread 也可能变宽。

返回题目

MK-003 解答:Kelly Criterion

偶数赔率下注,赢概率 p=0.55p=0.55,输概率 q=0.45q=0.45。Kelly 比例:

f=pq=0.10.f^*=p-q=0.10.

也可从最大化

g(f)=plog(1+f)+qlog(1f)g(f)=p\log(1+f)+q\log(1-f)

求导得到 f=pqf=p-q。实际交易常用 fractional Kelly,因为估计误差和尾部风险会让 full Kelly 过激。

返回题目

MK-004 解答:二元合约反推概率

忽略利率和风险溢价时,价格 0.37 对应隐含概率 37%。但真实概率可能不同,因为价格还包含风险溢价、流动性、交易成本、市场参与者风险偏好和供需压力。

返回题目

MK-005 解答:订单流信息

应该考虑更新。客户愿意大量卖给你,说明在“成交发生”这个条件下,资产真实价值可能低于你原估计。更新幅度取决于你对客户信息优势、交易规模、市场流动性和对冲能力的判断。市场微观结构里,成交本身就是信息。

返回题目

MK-006 解答:相关资产定价

如果你已经多 A,而 B 与 A 高度正相关,那么卖出 B 会减少一部分共同风险,买入 B 会增加相关风险。因此客户要买 B 时,你卖 B 给客户可能有助于对冲 A 多头,报价可以更积极;反方向交易则需要更保守。重点是按组合风险而不是单资产孤立定价。

返回题目

九、统计与数据直觉答案

S-001 解答:置信区间

在零假设 p=0.5p=0.5 下,100 次中盈利次数的标准差是

np(1p)=25=5.\sqrt{np(1-p)}=\sqrt{25}=5.

57 次盈利比 50 高 7,约 1.4 个标准差。双侧看并不显著,单侧也只是边缘。粗略结论:证据不足,需要更多样本。

返回题目

S-002 解答:多重检验

在 1000 个完全无效的信号中,p-value 小于 0.01 的期望数量就是 10 个。观察到 20 个不一定惊人,尤其如果还有数据清洗、参数选择、重复回测等隐性多重检验。需要 out-of-sample、交叉验证、控制 FDR 或 Bonferroni 之类修正。

返回题目

S-003 解答:回归到均值

不应简单预期继续前 1%。极端表现通常混合了能力和运气,下一期运气项大概率不会同样极端,所以表现会向长期均值回归。需要区分 skill 和 noise。

返回题目

S-004 解答:A/B Test 停止规则

反复查看并在显著时停止会增加假阳性率。经典 p-value 假设固定样本量或预设停止规则;optional stopping 改变了检验分布。应预注册样本量,或使用 sequential testing / alpha spending 方法。

返回题目

S-005 解答:相关不等于因果

不能直接说新闻导致波动。可能是波动导致新闻增加,也可能有第三因素同时导致新闻和波动,例如财报、宏观事件、监管公告。需要事件研究、时间顺序、控制变量或自然实验来支持因果判断。

返回题目

十、编程与模拟答案

CODE-001 解答:Monte Carlo 验证 Monty Hall

伪代码:

wins = 0
repeat N times:
  car = random choice from {0,1,2}
  first = random choice from {0,1,2}
  host = random door that is not car and not first
  switch = the remaining unopened door not equal first and not equal host
  if switch == car:
    wins += 1
return wins / N

NN 很大时结果应接近 2/32/3

返回题目

CODE-002 解答:按权重采样

预处理 prefix sums:si=jiwjs_i=\sum_{j\le i}w_j。生成 uU(0,sn)u\sim U(0,s_n),用二分找到第一个 sius_i\ge u 的索引。预处理 O(n)O(n),每次采样 O(logn)O(\log n)。如果要大量采样,可以考虑 alias method 做到 O(1)O(1) 采样。

返回题目

CODE-003 解答:Reservoir Sampling

看到第 kk 个元素时,以概率 1/k1/k 用它替换当前样本。归纳可证每个元素在处理完 nn 个元素后保留概率都是 1/n1/n

返回题目

CODE-004 解答:洗牌算法

Fisher-Yates:

for i from n-1 down to 1:
  j = random integer from 0 to i
  swap a[i], a[j]

每个排列出现概率都是

1n1n111=1n!.\frac1n\cdot\frac1{n-1}\cdots\frac11=\frac1{n!}.

常见错误是每一步都从 00n1n-1 随机交换,这样会产生 nnn^n 条随机路径,而 n!n! 通常不能整除 nnn^n,所以排列概率不均匀。

返回题目

CODE-005 解答:模拟 Coupon Collector

伪代码:

total = 0
repeat trials times:
  seen = empty set
  count = 0
  while size(seen) < n:
    seen.add(random integer from 1 to n)
    count += 1
  total += count
return total / trials

理论期望是 nHnnH_n。当 n=100n=100 时,H100log100+γ+1/(2n)5.187H_{100}\approx \log 100+\gamma+1/(2n)\approx5.187,所以期望约 519 次。

返回题目


继续训练建议

如果时间有限,优先刷这些题:

  1. P-004、P-005:Bayes 和 base rate。
  2. EV-002、EV-004、EV-005、EV-007:期望递推和最优停止。
  3. RW-001、RW-004:随机过程建状态。
  4. G-002、G-005:博弈与信息不对称。
  5. MK-001、MK-003、MK-005:交易定价和订单流。
  6. S-002、S-004:统计陷阱。

公开资料入口