Quant 面试题库:Brainteaser、概率与交易思维
面向顶尖量化交易公司面试准备的题型清单,覆盖心算、概率、期望、随机过程、博弈、Market Making、统计和编程模拟。
Quant 面试题库:Brainteaser、概率与交易思维
这份清单面向 Jump Trading、Optiver、Jane Street、IMC、SIG、Akuna 等量化交易公司常见的面试能力要求:快算、概率直觉、期望值、博弈、交易定价、统计判断和清晰表达。
注意:本文不是公司内部原题合集,而是基于公开面经、公司公开准备资料、经典概率题和交易训练题整理出的题型地图。真正面试时,面试官更看重你的推理过程、边界条件、口头表达和修正错误的能力。
使用方法
- 第一遍:只看题目,限时口算或白板推导。
- 第二遍:点击“解答”检查思路,不要一开始就背答案。
- 第三遍:把每题改一个参数,确认自己不是只记住了特例。
- 面试表达顺序:先复述题意,再列变量,然后给出核心公式或递推,最后检查极端情况。
标记说明:
- 基础:必须熟练,通常可以在 1-3 分钟内解决。
- 中等:需要建模,通常需要 5-10 分钟。
- 困难:容易有陷阱,适合做深度训练。
- 重点:文末给出较完整解答,其余题给提示或关键思路。
题目目录
- 一、Mental Math 与估算
- 二、概率基础与条件概率
- 三、期望、方差与最优停止
- 四、组合计数
- 五、随机过程与 Markov Chain
- 六、博弈与策略
- 七、Brainteaser 与逻辑题
- 八、Market Making 与交易直觉
- 九、统计与数据直觉
- 十、编程与模拟
- 解答区
一、Mental Math 与估算
MM-001 复利心算
难度:基础|标签:心算、近似|解答
不使用计算器,估算 、 和 。要求说明你用了什么近似。
MM-002 快速赔率换算
难度:基础|标签:赔率、概率|解答
某事件 fair probability 是 37%。如果用 decimal odds 报价,fair odds 是多少?如果盘口给 2.80,期望收益是正还是负?
MM-003 Fermi 估算
难度:基础|标签:估算、拆解|解答
估算美国每天消耗多少杯咖啡。你不需要知道真实数字,但要给出可解释的拆分。
MM-004 交易速度题
难度:中等|标签:心算、百分比|解答
一个资产先上涨 12.5%,再下跌 20%,最后上涨 10%。最终价格相对初始价格变动多少?
MM-005 平方根估算
难度:基础|标签:近似、波动率|解答
不使用计算器,估算 、 和 。这些数在波动率年化中为什么常见?
二、概率基础与条件概率
P-001 三枚硬币
难度:基础|标签:条件概率、样本空间|解答
你抛三枚公平硬币。已知至少有一枚是正面,求三枚都是正面的概率。
P-002 两个孩子问题
难度:中等|标签:条件概率、信息结构|解答
一个家庭有两个孩子。已知至少一个是女孩,两个都是女孩的概率是多少?如果改成“你随机遇到其中一个孩子,她是女孩”,答案是否改变?
P-003 Monty Hall
难度:基础|标签:Bayes、信息更新|解答
三扇门后有一辆车和两只羊。你先选一扇门,主持人打开一扇有羊的门。你应该换门吗?胜率是多少?
P-004 假阳性检测
难度:重点|标签:Bayes、base rate|解答
某病在人群中的患病率是 1%。检测灵敏度 99%,特异度 95%。一个人检测阳性,他真正患病的概率是多少?
P-005 两个独立检测
难度:重点|标签:条件独立、Bayes|解答
沿用 P-004。现在同一个人做两种条件独立的检测,二者灵敏度都是 99%,特异度都是 95%。如果两次都阳性,患病概率是多少?
P-006 抽牌条件概率
难度:中等|标签:条件概率、组合|解答
从标准 52 张牌中抽 2 张。已知至少一张是 A,求两张都是 A 的概率。如果已知其中一张是黑桃 A,答案如何变化?
P-007 独立但不直观
难度:中等|标签:独立性、反例|解答
构造两个随机变量 ,它们不相关,即 ,但并不独立。
三、期望、方差与最优停止
EV-001 第一次正面
难度:基础|标签:几何分布、期望|解答
不断抛公平硬币,直到第一次出现正面为止。期望抛掷次数是多少?
EV-002 连续两个正面
难度:重点|标签:递推、状态机|解答
不断抛公平硬币,直到第一次出现连续两个正面 HH。期望抛掷次数是多少?
EV-003 骰子直到 6
难度:基础|标签:几何分布|解答
不断掷公平六面骰,直到第一次出现 6。期望掷骰次数是多少?方差是多少?
EV-004 骰子最大值
难度:重点|标签:期望、尾和公式|解答
掷 3 个公平六面骰,记最大值为 。求 。
EV-005 选一次还是重抽
难度:重点|标签:最优停止、阈值策略|解答
你从 均匀分布中抽一个数。你可以接受它,也可以放弃并重新抽一次,但第二次必须接受。最优策略和期望收益是多少?
EV-006 圣彼得堡悖论
难度:中等|标签:期望、风险偏好|解答
公平硬币一直抛到第一次正面。如果第 次才出现正面,你获得 元。这个游戏期望收益是多少?你愿意付无限价格参加吗?
EV-007 Coupon Collector
难度:重点|标签:期望线性性、调和数|解答
有 种等概率优惠券,每次随机获得一种。集齐所有优惠券的期望次数是多少?
EV-008 抛硬币赌博
难度:中等|标签:EV、止损、鞅直觉|解答
你有 10 元,每次公平硬币,正面赢 1 元,反面输 1 元。到 20 元停止盈利,到 0 元破产。到达 20 元的概率是多少?期望游戏轮数是多少?
四、组合计数
C-001 生日悖论
难度:重点|标签:组合、近似|解答
一个房间里至少多少人时,存在两人生日相同的概率超过 50%?给出近似推导。
C-002 同花概率
难度:基础|标签:扑克牌、组合|解答
5 张扑克牌中恰好同花的概率是多少?这里“同花”指 5 张同一花色,不排除顺子。
C-003 无相邻选择
难度:中等|标签:组合、隔板法|解答
从 1 到 20 中选 5 个数,要求任意两个都不相邻。共有多少种选法?
C-004 错排
难度:中等|标签:容斥、错排|解答
有 8 个人随机拿 8 顶帽子。没有任何人拿到自己帽子的概率是多少?
C-005 抽球无放回
难度:中等|标签:超几何分布|解答
袋中有 7 个红球、5 个蓝球、4 个绿球。无放回抽 6 个,恰好 3 红、2 蓝、1 绿的概率是多少?
五、随机过程与 Markov Chain
RW-001 Gambler’s Ruin 概率
难度:重点|标签:随机游走、边界条件|解答
你有 元,目标是到 元,每轮以概率 赢 1 元,以概率 输 1 元。到达 前不破产的概率是多少?分别考虑 和 。
RW-002 随机游走回到原点
难度:中等|标签:随机游走、递归性|解答
在整数线上从 0 出发,每步等概率向左或向右走。最终是否会回到 0?在二维、三维情形会怎样?
RW-003 三状态天气链
难度:中等|标签:Markov Chain、平稳分布|解答
天气只有晴、阴、雨三种状态,转移矩阵为
长期来看三种天气各占多少比例?
RW-004 抛硬币模式等待时间
难度:困难|标签:pattern matching、状态机|解答
公平硬币中,第一次出现模式 HTH 的期望等待时间是多少?和 HHH 相比哪个更长?
RW-005 吸收链
难度:中等|标签:吸收状态、递推|解答
一只粒子在状态 0,1,2,3 上移动,0 和 3 是吸收态。从 1 出发,每步等概率向左右移动。到达 3 而不是 0 的概率是多少?期望吸收时间是多少?
六、博弈与策略
G-001 石头剪刀布混合策略
难度:基础|标签:Nash、混合策略|解答
为什么标准石头剪刀布的均衡策略是三种手势各出 ?如果赢得 2 分、平局 0 分、输掉 1 分,均衡是否变化?
G-002 二价拍卖
难度:重点|标签:拍卖、激励相容|解答
在 sealed-bid second-price auction 中,为什么诚实报价是弱占优策略?
G-003 Dollar Auction
难度:中等|标签:博弈、沉没成本|解答
拍卖 1 美元,最高价者获得 1 美元,但最高价和第二高价都要支付自己的出价。为什么这个游戏容易导致非理性升级?
G-004 猜均值的 2/3
难度:中等|标签:迭代删除、level-k|解答
一群人各自选择 0 到 100 的一个数,最接近所有人平均数的 者获胜。完全理性共同知识下均衡是多少?现实实验中为什么常不是这个数?
G-005 信息不完全交易
难度:困难|标签:adverse selection、市场微观结构|解答
你是 market maker,客户要向你买入或卖出一项资产。你不知道客户是否有信息优势。为什么 bid-ask spread 必须覆盖 adverse selection 风险?
七、Brainteaser 与逻辑题
B-001 100 个囚犯和灯泡
难度:重点|标签:逻辑、协议设计|解答
100 个囚犯被单独随机带入一个房间,房间里有一个灯泡,初始状态未知。囚犯入房时可以开关灯,也可以保持不变。某个囚犯可以宣布“所有人都至少进过房间一次”,如果正确全员释放,错误全员失败。囚犯事先能商量策略。如何保证最终正确宣布?
B-002 十二球称重
难度:困难|标签:信息论、三分搜索|解答
12 个球中有一个重量异常,不知道偏重还是偏轻。只有一架天平,最多称 3 次。如何找出异常球并判断轻重?
B-003 海盗分金币
难度:中等|标签:逆向归纳|解答
5 个理性海盗按资历从高到低分 100 枚金币。最高资历者提案,若至少半数同意则执行,否则他被扔下船,剩下的人继续。海盗先保命,再最大化金币,再偏好把别人扔下船。第一个海盗如何分配?
B-004 蓝眼睛岛民
难度:困难|标签:共同知识、归纳|解答
岛上有若干蓝眼睛人,他们能看到别人眼睛颜色但不知道自己颜色。外来者公开说:“岛上至少有一个蓝眼睛人。”为什么这句话可能改变所有人的行为?
B-005 三个开关和一盏灯
难度:基础|标签:物理信息、实验设计|解答
门外有三个开关,门内有一盏灯。你只能进房间一次,如何判断哪个开关控制灯?
八、Market Making 与交易直觉
MK-001 Fair Price 与 spread
难度:重点|标签:market making、EV|解答
某事件有 60% 概率发生,发生时合约支付 1,不发生支付 0。fair price 是多少?如果你要同时报 bid 和 ask,为什么不能都报 0.60?
MK-002 库存风险
难度:中等|标签:inventory、risk|解答
你连续给客户报价,发现自己一直在买入同一个资产,库存越来越大。即使 fair value 不变,你应该如何调整 bid 和 ask?
MK-003 Kelly Criterion
难度:重点|标签:Kelly、增长率|解答
你有一个下注机会:以概率 55% 赢,赢时获得下注额的 1 倍,输时损失下注额。为了最大化长期 log wealth,应该下注财富的多少比例?
MK-004 二元合约反推概率
难度:基础|标签:implied probability|解答
一个二元合约价格是 0.37,到期支付 0 或 1。如果忽略利率和风险溢价,市场隐含概率是多少?为什么真实概率不一定等于它?
MK-005 订单流信息
难度:困难|标签:Bayes、order flow|解答
你认为某资产 fair value 是 100,并报价 99.8 / 100.2。一个客户立刻 hit 你的 bid,向你卖出大量资产。你是否应该更新 fair value?为什么?
MK-006 相关资产定价
难度:中等|标签:相关性、hedge|解答
资产 A 和 B 高度正相关。你持有大量 A 的多头库存。客户现在想向你买 B。你在 B 上的报价应该如何受 A 库存影响?
九、统计与数据直觉
S-001 置信区间
难度:基础|标签:统计推断|解答
你观察到 100 次独立交易信号,其中 57 次盈利。如何粗略判断这个信号是否显著优于 50%?
S-002 多重检验
难度:重点|标签:selection bias、p-hacking|解答
你测试了 1000 个交易信号,其中 20 个在历史数据上 p-value 小于 0.01。你应该兴奋吗?为什么?
S-003 回归到均值
难度:基础|标签:统计直觉|解答
某交易员今年收益排名前 1%。明年你是否应预期他仍然排名前 1%?为什么?
S-004 A/B Test 停止规则
难度:中等|标签:实验设计、optional stopping|解答
你每天看一次 A/B test 结果,只要 p-value 小于 0.05 就停止并宣布成功。这个流程有什么问题?
S-005 相关不等于因果
难度:基础|标签:因果、confounding|解答
你发现某股票在新闻数量多的日子波动更高。能否说新闻导致波动?还需要考虑什么?
十、编程与模拟
CODE-001 Monte Carlo 验证 Monty Hall
难度:基础|标签:simulation、sanity check|解答
写伪代码模拟 Monty Hall,验证换门胜率约为 。
CODE-002 按权重采样
难度:中等|标签:sampling、prefix sum|解答
给定权重数组 ,设计一个函数按概率 返回索引 。
CODE-003 Reservoir Sampling
难度:中等|标签:streaming、sampling|解答
数据流长度未知,只能保存一个元素。如何等概率地从所有已经看到的元素中抽取一个?
CODE-004 洗牌算法
难度:基础|标签:Fisher-Yates、公平性|解答
如何实现公平随机洗牌?为什么“对每个位置随机交换任意位置”如果写错,可能不是均匀分布?
CODE-005 模拟 Coupon Collector
难度:中等|标签:simulation、EV|解答
写伪代码估计 时集齐所有优惠券所需次数的均值,并和理论值比较。
解答区
一、Mental Math 与估算答案
MM-001 解答:复利心算
核心近似是 ,当 较小时很好用。
- 。更精细地说,,所以约 。
- 。更精细约 。
- ,但因为 ,所以约 。
面试重点不是记住答案,而是能说出 log approximation,并知道什么时候误差会变大。
MM-002 解答:快速赔率换算
Decimal fair odds 是概率的倒数:。如果盘口给 2.80,则每下注 1 的期望净收益为
所以是正期望,约 3.6% edge。也可以用 直接算总回报 EV。
MM-003 解答:Fermi 估算
一种可解释拆分:
- 美国人口约 3.3 亿。
- 假设成年人占 75%,约 2.5 亿。
- 假设 60% 成年人喝咖啡,约 1.5 亿人。
- 平均每个喝咖啡者每天 1.5-2 杯。
估算结果约 2.25-3 亿杯/天。Fermi 题的评分重点是拆分是否合理、数量级是否稳定、能否解释最大不确定性来自哪里。
MM-004 解答:交易速度题
价格乘数是
最终下跌 1%。注意涨跌百分比不能直接相加。
MM-005 解答:平方根估算
- 约在 15.8 到 15.9,因为 。
- 约 19.1,因为 。
- 。
日波动率年化常用 ,其中 252 近似一年交易日数;365 用于自然日尺度;平方根来自独立收益方差随时间线性累加。
二、概率基础与条件概率答案
P-001 解答:三枚硬币
至少一枚正面排除了 TTT,剩余 7 个等概率结果。三枚都是正面只有 HHH 一个结果,所以概率是 。
P-002 解答:两个孩子问题
若只知道“至少一个是女孩”,样本空间是 GG、GB、BG,答案是 。
若“随机遇到其中一个孩子,她是女孩”,信息生成方式不同。可以把孩子个体作为样本,见到女孩后另一个孩子仍有 概率是女孩,所以答案是 。这题重点是信息如何被观察到。
P-003 解答:Monty Hall
应该换门。初选中车概率是 ,初选中羊概率是 。主持人知道车的位置并打开羊门后,若你初选错,换门必胜;若初选对,换门失败。因此换门胜率 。
P-004 解答:假阳性检测
用 Bayes:
代入:
检测看起来很准,但低 base rate 会让假阳性占阳性样本的大部分。
P-005 解答:两个独立检测
条件独立意味着:
所以
分子 ,分母约 ,结果约 。
关键陷阱:两个检测只有在给定真实患病状态后独立,不能直接说两个阳性事件无条件独立。
P-006 解答:抽牌条件概率
已知至少一张 A:
已知其中一张是黑桃 A,则另一张从剩余 51 张里抽,是 A 的概率为 。
P-007 解答:独立但不直观
令 在 上均匀分布,令 。则
所以 。但 完全由 决定,显然不独立。例如 ,但 。
三、期望、方差与最优停止答案
EV-001 解答:第一次正面
这是参数 的几何分布,期望 。
EV-002 解答:连续两个正面
设 为当前没有连续前缀时的期望等待时间, 为刚看到一个 H 后的期望等待时间。
从 :
从 :下一次若 H 则结束,若 T 则回到 :
第一式化为 。代入第二式:
所以 。
EV-003 解答:骰子直到 6
几何分布参数 。期望 ,方差 。
EV-004 解答:骰子最大值
用尾和公式:
对 3 个骰子,。因此
,所以
EV-005 解答:选一次还是重抽
第二次必须接受,期望是 。所以第一次抽到 时,如果 接受,否则重抽。
最优期望:
EV-006 解答:圣彼得堡悖论
期望收益:
但真实支付意愿不会无限,因为财富有限、边际效用递减、赌场资金有限、风险约束存在。面试中应区分数学期望和可交易价格。
EV-007 解答:Coupon Collector
已经收集到 种时,获得新种类的概率是 ,等待新种类的期望是 。总期望:
近似 。
EV-008 解答:抛硬币赌博
公平随机游走从 10 到达 20 前不碰 0 的概率是 。
公平情形的期望吸收时间为 。这里 ,所以期望轮数 。
四、组合计数答案
C-001 解答:生日悖论
没有两人同生日的概率约为
令重复概率超过 50%,即无重复概率小于 50%:
所以 ,。经典答案是 23 人。
C-002 解答:同花概率
总手牌数 。同花手牌:先选花色 4 种,再从该花色 13 张中选 5 张:
C-003 解答:无相邻选择
从 选 个不相邻数。设原选择为 ,令 。则 。答案是
C-004 解答:错排
错排数
概率是 ,约为 。精确值可按上式计算。
C-005 解答:抽球无放回
超几何分布:
五、随机过程与 Markov Chain 答案
RW-001 解答:Gambler’s Ruin 概率
设 是从 出发先到 而不是 0 的概率。边界 ,递推:
若 ,解是线性的:
若 ,通解为
代入边界得
RW-002 解答:随机游走回到原点
一维简单对称随机游走以概率 1 最终回到原点,二维也以概率 1 回到原点;三维及以上不是,回到原点的概率小于 1。这是随机游走 recurrence/transience 的经典结论。面试通常不要求证明,但要知道维度会改变结论。
RW-003 解答:三状态天气链
求平稳分布 ,满足 且 。实战中可列线性方程或用数值方法。此题核心是知道长期比例不是逐行平均,而是左特征向量。
一个快速数值解约为:
RW-004 解答:抛硬币模式等待时间
HTH 的期望等待时间是 10,HHH 的期望等待时间是 14。直觉上,HHH 有更强的自重叠结构,失败后可能留下部分前缀,但某些失败会让等待更久;严谨做法是建状态机。
对 HTH,设状态 0 表示没有匹配前缀,状态 1 表示已匹配 H,状态 2 表示已匹配 HT:
解得 。
RW-005 解答:吸收链
到达 3 的概率从 1 出发是 ,这是公平 gambler’s ruin 的 。
期望吸收时间从 出发为 ,这里 ,所以是 2 步。也可列递推:
解得 。
六、博弈与策略答案
G-001 解答:石头剪刀布混合策略
标准情形中,如果你三种手势不是各 ,对手可以增加克制你高频手势的策略。均衡要求对手面对你的混合策略时,出任意纯策略的期望收益相同,因此三者概率相等。
如果赢 2、输 -1、平 0,仍然是对称零和结构,均衡仍为各 。
G-002 解答:二价拍卖
设你的真实价值为 ,最高其他报价为 。二价拍卖中,若你赢,支付 ,不是自己的报价。
- 若 ,你想赢;诚实报 会赢。报低到低于 会错误地输掉正收益机会。
- 若 ,你想输;诚实报 会输。报高到高于 会错误地赢下负收益交易。
- 若 ,赢输都无差异。
所以诚实报价是弱占优策略。
G-003 解答:Dollar Auction
第二高价也要付款,使得落后者面临“再加一点可能减少损失”的局部激励。例如你已出 0.95 美元,对手出 0.96 美元;如果放弃,你损失 0.95;如果出 0.97 并赢,你净赚 0.03。双方不断用局部理性选择推动总出价超过 1 美元。
G-004 解答:猜均值的 2/3
完全理性共同知识下,任何高于 的数不可能赢,迭代删除后任何高于 的数也不可能赢,继续下去唯一极限是 0。
现实中常出现 20-35 一带,因为参与者不是无限层级理性,而是 level-k 推理:我想别人会猜 50,所以我猜 33;我想别人会猜 33,所以我猜 22。
G-005 解答:信息不完全交易
客户可能因为流动性需求交易,也可能因为掌握信息交易。如果 informed trader 只在价格对他有利时交易,market maker 成交后的条件期望会变差:
- 客户打你的 ask 买入,可能说明真实价值高于你估计。
- 客户 hit 你的 bid 卖出,可能说明真实价值低于你估计。
Spread 需要覆盖库存风险、运营成本和 adverse selection。否则你会在无信息客户身上小赚,在有信息客户身上大亏。
七、Brainteaser 与逻辑题答案
B-001 解答:100 个囚犯和灯泡
指定一个囚犯做计数者,其他 99 人每人只在自己第一次看到灯灭时把灯打开一次。计数者每次看到灯亮,就把灯关掉并计数加 1。当计数达到 99 时,计数者知道其他每个人至少进过一次,于是宣布。
如果初始灯泡未知,需要处理初始为亮的情况。一种稳妥策略是让非计数者每人开灯两次,计数者数到 后宣布;初始状态最多造成一次额外亮灯,不会导致误判。也可以设计预热阶段消除初始状态。
B-002 解答:十二球称重
完整决策树很长,核心原则是每次称重有三种结果:左重、右重、平衡。3 次最多区分 种结果。异常球有 种可能,所以信息量刚够。
经典策略是把球编号 1-12:
- 第一次称 1,2,3,4 对 5,6,7,8。
- 若平衡,异常在 9-12;用第二、三次与已知正常球比较即可。
- 若不平衡,异常在 1-8,且方向有约束;第二次重新组合部分可疑球与正常球,使三种结果尽量均分。
面试中若要求完整方案,需要画三层决策树。更重要的是先说明信息论下界,再给出分组策略,不要盲试。
B-003 解答:海盗分金币
逆向归纳:
- 1 人时,他拿 100。
- 2 人时,资历高者自己投赞成即可通过,拿 100,另一个 0。
- 3 人时,需要 2 票。第 3 人在 2 人局会拿 0,所以给他 1,自己 99。
- 4 人时,需要 2 票。第 2 人在 3 人局会拿 0,所以给他 1,自己 99。
- 5 人时,需要 3 票。第 3、5 人在 4 人局会拿 0,所以各给 1,自己拿 98。
所以分配为:最高资历者 98,第三和第五各 1,其他 0。不同题设若“半数”是否包含自己、平票规则不同,答案会变。
B-004 解答:蓝眼睛岛民
外来者的话把“至少有一个蓝眼睛人”变成共同知识。若有 1 个蓝眼睛人,他看不到其他蓝眼睛人,听到公告后当天知道自己是蓝眼睛并离开。若有 2 个,他们各自看到 1 个;第一天没人离开后,他们知道不是 1 个,于是第二天离开。归纳可得,若有 个蓝眼睛人,他们会在第 天一起离开。
核心不是新事实,而是共同知识层级发生变化。
B-005 解答:三个开关和一盏灯
打开开关 A 一段时间后关掉,打开开关 B,然后进房间:
- 灯亮:B 控制。
- 灯灭但灯泡热:A 控制。
- 灯灭且灯泡冷:C 控制。
八、Market Making 与交易直觉答案
MK-001 解答:Fair Price 与 spread
二元合约 fair price 是期望支付:
不能 bid 和 ask 都报 0.60,因为成交有成本和风险:订单流可能有信息、库存会波动、你需要补偿资本占用。合理报价可能是 0.58 / 0.62,具体宽度取决于风险和竞争。
MK-002 解答:库存风险
如果库存越来越大,继续买入会增加风险。即使 fair value 不变,也应该降低 bid,让自己不那么愿意买;同时可能降低 ask,让卖出更容易发生,从而减库存。报价中心可以向下偏移,spread 也可能变宽。
MK-003 解答:Kelly Criterion
偶数赔率下注,赢概率 ,输概率 。Kelly 比例:
也可从最大化
求导得到 。实际交易常用 fractional Kelly,因为估计误差和尾部风险会让 full Kelly 过激。
MK-004 解答:二元合约反推概率
忽略利率和风险溢价时,价格 0.37 对应隐含概率 37%。但真实概率可能不同,因为价格还包含风险溢价、流动性、交易成本、市场参与者风险偏好和供需压力。
MK-005 解答:订单流信息
应该考虑更新。客户愿意大量卖给你,说明在“成交发生”这个条件下,资产真实价值可能低于你原估计。更新幅度取决于你对客户信息优势、交易规模、市场流动性和对冲能力的判断。市场微观结构里,成交本身就是信息。
MK-006 解答:相关资产定价
如果你已经多 A,而 B 与 A 高度正相关,那么卖出 B 会减少一部分共同风险,买入 B 会增加相关风险。因此客户要买 B 时,你卖 B 给客户可能有助于对冲 A 多头,报价可以更积极;反方向交易则需要更保守。重点是按组合风险而不是单资产孤立定价。
九、统计与数据直觉答案
S-001 解答:置信区间
在零假设 下,100 次中盈利次数的标准差是
57 次盈利比 50 高 7,约 1.4 个标准差。双侧看并不显著,单侧也只是边缘。粗略结论:证据不足,需要更多样本。
S-002 解答:多重检验
在 1000 个完全无效的信号中,p-value 小于 0.01 的期望数量就是 10 个。观察到 20 个不一定惊人,尤其如果还有数据清洗、参数选择、重复回测等隐性多重检验。需要 out-of-sample、交叉验证、控制 FDR 或 Bonferroni 之类修正。
S-003 解答:回归到均值
不应简单预期继续前 1%。极端表现通常混合了能力和运气,下一期运气项大概率不会同样极端,所以表现会向长期均值回归。需要区分 skill 和 noise。
S-004 解答:A/B Test 停止规则
反复查看并在显著时停止会增加假阳性率。经典 p-value 假设固定样本量或预设停止规则;optional stopping 改变了检验分布。应预注册样本量,或使用 sequential testing / alpha spending 方法。
S-005 解答:相关不等于因果
不能直接说新闻导致波动。可能是波动导致新闻增加,也可能有第三因素同时导致新闻和波动,例如财报、宏观事件、监管公告。需要事件研究、时间顺序、控制变量或自然实验来支持因果判断。
十、编程与模拟答案
CODE-001 解答:Monte Carlo 验证 Monty Hall
伪代码:
wins = 0
repeat N times:
car = random choice from {0,1,2}
first = random choice from {0,1,2}
host = random door that is not car and not first
switch = the remaining unopened door not equal first and not equal host
if switch == car:
wins += 1
return wins / N
当 很大时结果应接近 。
CODE-002 解答:按权重采样
预处理 prefix sums:。生成 ,用二分找到第一个 的索引。预处理 ,每次采样 。如果要大量采样,可以考虑 alias method 做到 采样。
CODE-003 解答:Reservoir Sampling
看到第 个元素时,以概率 用它替换当前样本。归纳可证每个元素在处理完 个元素后保留概率都是 。
CODE-004 解答:洗牌算法
Fisher-Yates:
for i from n-1 down to 1:
j = random integer from 0 to i
swap a[i], a[j]
每个排列出现概率都是
常见错误是每一步都从 到 随机交换,这样会产生 条随机路径,而 通常不能整除 ,所以排列概率不均匀。
CODE-005 解答:模拟 Coupon Collector
伪代码:
total = 0
repeat trials times:
seen = empty set
count = 0
while size(seen) < n:
seen.add(random integer from 1 to n)
count += 1
total += count
return total / trials
理论期望是 。当 时,,所以期望约 519 次。
继续训练建议
如果时间有限,优先刷这些题:
- P-004、P-005:Bayes 和 base rate。
- EV-002、EV-004、EV-005、EV-007:期望递推和最优停止。
- RW-001、RW-004:随机过程建状态。
- G-002、G-005:博弈与信息不对称。
- MK-001、MK-003、MK-005:交易定价和订单流。
- S-002、S-004:统计陷阱。