跳转至




2024

Alphalens 因子分析 - 以低换手率因子为例(1)

R50 因子分析是量化研究的基本技能之一。通过因子分析,找出有效的因子,通过相关性去重后,就可以通过机器学习、线性回归等方法把因子组合起来,构成交易策略。

这一篇笔记我们就介绍如何使用 Alphalens 来进行单因子分析。我们使用的因子是低换手率因子。

KS Test, 广义双曲分布和抄底沪指

R50 上一篇笔记我们抛出一个问题,沪指大跌 4%时,能不能抄底?今天的笔记,我们就通过 KS 检验,找出沪指的概率分布,进而回答这个问题。在后面的笔记中,我们还将换一个方法继续回答这个问题。

Z-score 因子的深入思考

R50

最新(2024 年 1 月)出版的 SC 技术分析(Techical Analysis of Stock & Commodities)的第 4 条文章给到了 Z-score,原文标题为《Z-score: How to use it in Trading》。今天的笔记,就借此机会,同步推出我们对通过Z-score来构建量化因子的一些观点。

存了50TB!pyarrow + parquet

R50 在上一篇笔记中,我们指出,如果我们只在日线级别上存储行情数据和因子,HDF5 无论如何都是够用了。即使是在存储了 40 年分钟线的单个股数据集上,查询时间也只花了 0.2 秒 -- 这个速度已经足够快了,如果我们不需要在分钟级别上进行横截面数据查询的话。

200倍速!基于 HDF5 的证券数据存储

R50

去年 15 日的笔记挖了个坑,给出了量化数据和因子的存储方案技术导图。这一篇笔记就开始填坑。

即使我们购买了在线数据服务,比如 tushare, 聚宽的账号,我们仍然要构建自己的本地存储,为什么?

2024年,免费博客赚钱方案

几年前,我就推荐过用 Markdown 写作静态博客。静态博客几乎是零托管成本,比较适合个人博客起步。Markdown 便于本地搜索,也可当作是个人知识库方案。

现在有了新的进展。我不仅构建了一个视觉上相当不错的个人网站,还美化了 github、构建了个人出版系统 -- 将文章导出为排版精美的图片和 pdf 的能力。