跳转至

本周要闻回顾

  • 高频交易费率或将提升 10 倍
  • 巴黎奥运开幕,奥运概念板块新鲜出炉
  • 广东私募自查,量化交易、基金规模是否达标成是重点
  • 纳斯达克大跌 3.64%,日经指数创 2021 年 10 月来最长连跌记录

下周重要日历

  • 下周“降息”大潮开启
  • 全球股市迎来超级央行周
  • 本周将有三支...

本周精选

  • 圣杯依然闪耀!基于短时 RSI 的均值回归策略
  • 看得到,吃不到!7 年 2500 倍的多空策略
  • 量化投资顶刊有哪些(一)?

本周要闻回顾

  • 财联社消息,监管起草了高频交易买卖费用从当前每笔 0.1 元提升至 1 元。有量化私募交易人士表示,手续费超过 5 倍以上,当下策略就没有超额了,从而达到限制高频量化的目的。当前对高频交易的认定是,每秒超过 300 笔或者全天申报及撤单不超过 2 万笔。
  • 巴黎奥运会开幕,与此相关的设施器材、配套设备、体育营销、文化衍生品等领域,均有 A 股企业参赛,包括中集集团、舒华体育、艾比森、洲明科技、元隆雅图等多家上市公司。东方财富、同花顺等顺势推出奥运概念股。
  • 21 财经消息,广东证监局组织辖内私募基金开展自查:私募基金管理机构在宣传推介、资金募集、投资运作等业务环节是否合规,是否存在基金产品逾期,是否开展量化交易,是否存在异地经营情形等,量化交易、基金规模是否达标成自查重点。
  • 7 月 25 日,纳斯达克 100 指数下跌 3%,创下自 2022 年 12 月以来最大跌幅。日经指数本周继续下跌 5.9%,连跌 8 个交易日,创 2021 年 10 月来最长连跌记录。不过,美股周五全线上涨,道指更是周线 4 连涨。
  • 北向资金持续卖出。近 2 周以来累计已减持 307 亿元,月内净卖额达 288 亿元。
  • 央行罕见加场MLF操作 稳定月末流动性。7月25日,中国人民银行在月末时点新增一次中期借贷便利(MLF)操作,中标利率为2.3%,较前次下降20个基点。
  • 证监会研究谋划进一步全面深化资本市场改革开放的一揽子举措。吴清开展专题座谈会,与 10 家在华外资机构、QFII 代表深入交流,听取意见建议。

信息来源:财联社等,通过 Tushare.pro 接口综合汇编。


下周重要日历

  • 多家银行下周起降息。7月26日招商银行、平安银行调整了人民币存款挂牌利率表,最高下调幅度为30个基点。广发银行也将在下周下调银行存款。广发银行对记者表示,下周银行存款下调的幅度会与四大行调整幅度保持一致。除了存款之外,大额存单也在下周同步下调。
  • 下周全球投资者将迎来超级周。首先,三大央行将公布利率决议。美联储将在周三召开议息会议。此外,几大科技巨头如微软、META、苹果等都将在这一周发布财报。
  • 7月31日(周三)统计局将发布PMI指数。前值读数为49.5。8月1日,财新发布制造业PMI。

信息来源:财联社等,通过 Tushare.pro 接口综合汇编。

基于短时 RSI 的均值回归

这篇文章发表于周二公众号上。获得超过 4000 次阅读。

策略概要

所有人应该都已经熟悉 RSI 指标了。我们常用的 RSI 指标是基于 6,12 和 24 周期计算出来的。

\[ RS = \frac{\text{SMMA}(U,n)}{\text{SMMA}(D,n)} \]
\[ RSI = 100\cdot\frac{\text{SMMA}(U,n)}{\text{SMMA}(U,n) + \text{SMMA}(D,n)} = 100 - { 100 \over {1 + RS} } \]

但是 Larry Connors 认为,2 周期的 RSI 可以更好的反映市场趋势,很可能是技术指标中的圣杯。他把这个观点发表在 2008 年出版的《华尔街的顶级交易员》一书中。在此后的 Connor's RSI 指标中,streak 的 RSI 正是使用 2 周期来计算的。

基于这样的 RSI,Connors 给出了以下均值回归策略:

  1. 标普 500 指数超过 200 日均线;
  2. 标普 500 指数的 2 周期 RSI 低于 5;
  3. 信号发出时,按收盘价买入;
  4. 当标普 500 高于 5 日均线时卖出。

用交易员的话来讲,这是一个在牛市(指数大于 200 日均线)短线回调(RSI 低于 5)时的买入策略。

因子检验

首先 quantitativo 进行了单因子检验。检验方法是对对所有 2 天 RSI 收于 5 以下的标的进行买入并持有 5 天,再计算收益。

75%

这个统计包含了超过 21000 个标的,超过 250 万次事件(标普 500 收于 200 天均线之上)。测试中的亮点:

  1. 当任何给定股票的 2 天 RSI 低于 5 并在牛市中持有 5 天时,买入其平均回报率为 3.3%;
  2. 其中 60% 的事件获得正回报,每笔交易的预期回报为 9.8%;
  3. 40%的交易是负面的,每笔交易的预期回报率为-6.6%;
  4. 分布呈正偏。

quantitativo 还统计了反过来的情形,即如果我们在每只标的的 2 天 RSI 收于 5 以上时买入每只股票,并在牛市中持有 5 天的数据。我们将得到:


  1. 当任何给定股票的 2 天 RSI 高于 5 时,买入其预期回报率为 0.3%;
  2. 交易转为正值的可能性为 52%,预期回报率为 5.5%;
  3. 交易转为负值的可能性为 48%,预期回报率为 -5.1%。

quantitativo 还对两次测试是否属于同一分布进行了假设检验,结果 p 值远低于 0.05,证明两个分布显著不同。因此,第一次测试中的因子是存在 Alpha 的。

策略回测

接下来 quantitativo 进行了策略回测。这里策略设计如下:

  1. 使用 SPY 作为测试标的。
  2. 当以下条件满足时,在下一次开盘时买入 SPY:
  3. 标普指数的 RSI(2) 收于 5 之下
  4. SPY 高于 200 日均线
  5. 退出条件
  6. 当 SPY 收盘价高于前一天高点,则在下一次开盘时退出。
  7. 如果 SPY 收盘价低于 200 日均线

可以看出,回测策略与 Connor 提出的策略略有不同。为什么要进行这样的差异化?

这里的差异化,其实就是回测与实盘的差异。Connor 给出的策略更理想化,而 quantitativo 的验证策略则更加接近实盘。这是我们做策略时一定要考虑的。

首先,尽管我们可以用标普 500 来回测,但在实盘中,更切合实际的方法是购买对应的 ETF。这里的 SPY 就是以标普 500 为标的的 ETF。


第二,Connor 的策略是以收盘价买入。如果你的回测系统不够精确的话,最好是以次日开盘价买入。当然,如果你的回测系统和行情数据精确到分钟级,那么在国内,也可以利用集合竞价前一分钟的收盘价计算信号,再以集合竞价买入。

退出条件的差异,可以看成是 quantitativo 对原策略的一个优化。不过,我并没有看出来这个优化的意义。它的背后似乎并不存在任何交易上的原理支撑。看起来,这更像是 quantitativo 通过数据做出的过拟合。

Question

quantitativo 在本次实验中,使用了长达 25 年的数据进行测试。如果经过这么长的时间回测,数据表现仍然很好,是否就可以说不存在过拟合?我很想知道你们怎么看。

那么,quantitativo 的实验结果又是如何呢?

在 SPY 上的测试简直就是灾难。在整个回测期(25 年)中,使用 SPY 交易此策略提供了 67% 的回报。主要原因是交易次数太少,仅执行了 157 笔交易。

75%


接着 quantitativo 改用了纳斯达克 100 指数 ETF(QQQ)和三倍杠杆纳斯达克 100ETF(TQQQ)。结果表明,在 TQQQ 上表现不错(见前图):

夏普比率分别达到了 2.3(QQQ)和 1.92(TQQQ),对指数标的而言,是相当不错的指标(特别是与 A 股对比)。

改进策略:增加因子

在前一次实验的基础上,quantitativo 增加了资产组合。

他们把资金分成十份 (10 slots),用于购买前一天 RSI 收于 5 以下的标的;如果 universe 中有 10 支以上的标的触发了入场信号,将按市值进行排序,优先考虑市值较小的股票。退出条件改为收盘价低于标的 200 日均线。

此外,他们还限制只交易流动性较好的标的: 1. 只交易过去 3 个月内完全没有停牌的标的 2. 如果标的过去 3 个月日均成交量中位数不足资金份额的 20 倍,则不纳入

75%


Tip

实际上,在这里 quantitativo 已经引入了另一个因子,小市值因子,只不过它的权重比较低--是在 RSI 触发之后才应用权重因子。

这次的结果很不错,整体年回报率达到 17.8%,是基准的 3 倍。但也存在问题,即所有这些都是在前 8-9 年实现的。该策略在 2008 年后停止执行,并从那时起输给基准。

原因何在?通过分析 25 年回测期间进行的 11,380 笔交易,quantitativo 发现了很多退市。这种幼稚方法的问题在于,该策略优先考虑小盘股(在通过流动性过滤器后),它们退市的概率为 +70%。

第二次改进:降低退市风险

75%

quantitativo 再次改进了策略,这次的改进是将 universe 限制在只交易大型和超大盘股,这些股票的退市概率较低(分别为 35%和 9%)。


这一次效果非常明显。策略的年化回报达到了 23.9%,是同期基准的 4 倍,夏普达到 1.23%,最大回撤为 32%,几乎只有标普的一半。但是,之前就存在的一个问题,交易次数过于频繁仍然存在。现在一年仍然会交易 461 次。

第三次改进:减少 slots

之前的实验使用了 10 个 slots,这可能是导致交易次数过多的主要原因。于是,quantitativo 将同时持有的标的数减少到 2 支。

现在,交易笔数由 461 次/年下降到 90 笔/年。并且实现 30.3%的年回报率,是基准的 5 倍。

结论

这篇文章介绍了一个基于短时 RSI 的均值回归策略,并在最后,给出了年化达 30.3%的一个实现(未考虑滑点和交易手续费)。

这个策略的内核是短时 RSI,尽管这个指标发明以来已经超过 45 年,但回测结果表明,只要你研究一件事足够深入,就很可能取得成功。

Quote

It's not that I'm so smart; it's just that I stay with problems longer. -- Albert Einstein

这个方案已经值回你的阅读时间,但更为重要的是,我们讨论了策略发现的一般流程和优化角度。


我们再梳理一次,作为本篇的结束语:

  1. RSI 代表着潮汐和回归,其背后是人性,因此它永远不会过时。
  2. 多因子策略也可以以某个因子为主,在交易过程中,以限制条件的方式引入其它因子。
  3. 文中给出了判断标的流动性强弱的方法,你也可以将其作为一个因子。
  4. 研发策略的步骤往往从单因子检验开始,再编写简单回测,然后根据回测结果一步步优化。
  5. 在优化过程中,quantitativo 先是使用 ETF,然后改用了 10 个 slots,最终回到 2 个 slots 的方案。

看到吃不到!7 年涨了 2500 倍

这一周我们继续探索 Alphalens 因子分析框架的使用。因子与收益之间的关系很少是线性的,但Alphalens本身就是一个线性分析框架,以揭示因子与收益之间的线性关系见长。它支持的三种分析方法是:

  • Regression (回归法)
  • IC/Rank-IC (相关系数、秩相关)
  • Tiered Regression (分层回溯)

都是基于线性回归或者准线性(相对于svm、nn等而言)。因此,如何让Alphalens在因子检验中,能够真正揭露出因子与收益之间的关系,是一个比较有技巧的活儿。

我们在7月26日发表的视频号中,探索了如何运用 plot_quantile_statistics_table 和 mean period wise return by Factor quantile图来抽丝剥茧,重构因子,最终完美地揭示因子与收益之间的线性关系。

这里我们也对视频内容进行一个摘要。

在实验中,我们先是使用了400个ticker,1000天的数据。在实验方向确定后,我们扩大到2000个ticker, 2000天的数据,以排除偶然性。


我们要探索的因子是6期的RSI。作为因子,一般要求因子值越大,收益越高;但RSI恰好是反向的,一般认为,RSI越大,就越需要减仓。因此,我们实际构建的因子是:

$$

factor = 100 - RSI

$$

第一次实验

简单用Alphalens的默认值跑一下,我们得到以下结果:

多空组合的收益情况

默认参数下的因子分层情况


by quantiles分层下的mpwr图

看收益看不出什么问题。如果你是做纯数据挖掘,就会觉得这也没什么,反正这个因子也是盈利了呀,对不对?

但如果我们仔细看分层图,就会发现,这次实验没有任何意义。因为第一层的因子值从0跨到78.9,最后一层因子值,从22跨越到了97。

看分层收益均值图,会发现因子与收益之间没有线性关系。Alphalens只能做线性分析,在这种情况下,Alphalens又如何能揭示因子与收益之间的因果关系呢?

第二次实验

Alphalens的默认分层方式是by quantiles。我们能运用这种方式来分层的前提,是因子本身是均匀分布的。而RSI不是。

除了RSI之外,还有很多例子不适用by quantiles分层。比如,如果因子是语料情感类的,那么因子大概是0~5之样的标签。这种情况下,也不适合按quantiles分层。


Alphalens提供另一种分层方式,即by bins。我们提供的分箱是[0,10,20,30,70,80,90,100]。这里我们有一个假设,即我们对中间的RSI不感兴趣,认为它们不会提供交易信号。

现在分层的结果就很合理了:

by bins分层情况

但是我们如果看一下 mean period wise return by Factor quantile图,就会发现,因子与收益之间镜像的线性关系:

如果Alphalens能做多第4组,做空第1组,这样的策略结果应该不错。但是Alphalens并不能这么做。需要我们修改因子。


我们的方法是,抛弃掉因子值大于50的那一部分,再让Alphalens来分析因子与收益之间是否存在关系。

第三次实验

这次我们得到了非常完美的线性关系:

过滤掉部分因子

在这种情况下,可以认为,Alphalens的分析结果是有效的。

当然收益也很好看。

过于好看了。能够超过这个策略的,只有涨停板因子。


关于收益的讨论

一般来说,当我们看到这么好的收益时,就应该认为是实施步骤出现了问题。 在我们的实验中,是否存在实施问题呢?因子分析比较复杂,这就是为什么我们要尽可能地使用框架的原因。用对了框架,再离奇的结论也要接受。

那么,这个收益我们能否兑现?只有极少数人能够兑现这个收益。因为它的大部分收益是通过做空第一组来实现的。在我们的算法中,第一组实际上就是RSI大于90的那一组。

这一组的股票,往往是涨停股了,平常融券不易,此时融券就更难。但是,从今年以来披露的一些违规案例来看,有些机构先拉涨停板,再融券做空,这是充分利用了我们这里因子分析的结果:即RSI>90时,做空胜算很大。

所以,只有极少数人能兑现这么高的收益。

随着各种交易规则的完善,之前被这些人割走的利润,现在将回到市场中。

结论

Alphalens无法揭示复杂的非线性关系,这是由于它的因子检验方法所决定的。所以,对一些因子与收益之间不存在简单线性关系的因子,我们需要对它进行适当的变换,以适合分析框架。

否则,无论你的因子是好是坏,都不可能得到正确的结果。


量化投资顶刊有哪些(一)?

  1. Journal of Finance 创刊于1946年,是由美国金融协会(American Finance Association)主办的一份顶级学术期刊。它不仅吸引了世界各地顶尖学者的投稿,也是衡量学术成就和职业发展的重要指标。许多诺贝尔经济学奖得主的早期工作都曾在该期刊上发表,比如作为现代金融基石的现代资产组合理论(Markowitz)、资本资产定价模型(William Sharpe)、MM定理(Merton H. Miller)、有效市场假说(Eugene Fama)等。
  2. Journal of Financial Economics. Rolf Banz, 1981年发表《The relationship between return and market value of common stocks》(即小市值因子),就是选择的这一家。2015年Famma发表五因子模型,也是这家期刊。
  3. Review of Financial Studies,由牛津出版,是一本同行评审学术期刊。它在2020年的影响因子为5.814,在商业、金融类排名5/110。《Market Liquidity and Funding Liquidity》一文最早就发表在这里。在google学术上,它有超过6500次引用。
  4. Journal of Portfolio Management,专注于投资组合管理的实践和理论,包括量化策略和风险管理。
  5. Journal of Financial and Quantitative Analysis,简写JFQA,发表金融经济领域理论和实证研究。
  6. Journal of Empirical Finance,强调实证研究,包括市场效率、资产定价和投资策略的实证分析。
  7. The Journal of Trading,关注交易策略、市场动态和交易技术的期刊,不过已停刊。同类型的杂志有《The Traders' Magazine》