§ 量化交易中的 NUMPY 和 PANDAS
创建数组的常用方法,以及几个内置数组,这些数组在量化中也非常常用
如何向数组中追加、插入、删除元素,以及修改?
介绍indexing, slicing, searchsorted等
矩阵运算等数学运算及均值、方差、协方差、percentile 等统计函数
深入了解Numpy数据类型及其转换,以及Typing库,帮助我们写出健壮的代码
我们从第三方获得的数据可能包含np.nan数据;技术指标在冷启动期的值也常常是np.nan。在数据包含None或者np.nan的情况下,如果计算其均值、最大值?将介绍 np.isnan, nanmean, nanmax 等 nan *函数
随机数和采样是量化的高频操作,在“造”数据方面非常好用
介绍如何读取csv、保存csv等io操作
从其它库中得到的行情数据的时间、日期,怎么转换?
如何在Numpy数组中进行字符串查找等操作?
举例:如何高效地寻找连续涨停、N 连阳和计算 connor's rsi 中 streaks
分时均价线在日内交易中非常重要,一般来说,两次攻击分时线不破,就是日内买入(卖出)的信号。我们要如何计算分时均线呢?
如何用 numpy 快速计算均线?介绍一个卷积算法
很多时候,我们需要自适应参数。怎么选?percentile很多时候是个好方案
如果你有经验,就能判断出 2 月 7 日的大反弹。反弹之日,要找跌幅最大的股票。怎么选呢?
不要买入长期看跌的个股。关键是,如何判断呢?这一节将介绍多项式回归
Alpha101 中有好几个基础函数,因子就构建在这些基础函数上。如何高效地实现它们?
介绍 corrcoef 和 correlate
从随机生成若干资产开始,计算资产的期望收益和波动率。这是高频应用场景之一。
深入Numpy高效的底层原理
index, info,describe,columns,head,tail 等
介绍Pandas中的索引(indexing)、数据选择
盘中实时获得分钟线惊人地昂贵。所以,我们需要从tick级数据自己合成。这就是重采样
dataframe中包含了我们提取的特征。要选取PE最大同时是PB最小的前30列,怎么做?
因子分析数据表包含了行业标签和各公司的PE值。如何选出每个行业PE最强的5支
这是pandas中比较难懂的内容之一
用以计算移动平均等具有滑动窗口的指标
均值、方差、协方差、percentile,diff,pct_change,rank 等统计函数,量化基础
因子分析的预处理过程中,要进行缺失值、缩尾、去重等操作,怎么做?
如何将数据从csv,网页,数据库,parquet等地方读进来
除基本操作外,还将介绍读取 csv 时如何加速
我们从其它库中得到的行情数据的时间、日期,怎么转换?
dataframe存放了证券基本信息,比如名字和代码。如何排除科创板?
让pandas拥有excel一样丰富的条件着色功能
实现通达信公式中的HHV,LLV,HHVBARS,LAST等方法
介绍最新版引入的as-of-join功能。量化必遇场景
使用Alphalens进行因子分析时,最常用的dataframe操作
使用category,以及更紧湊的数据类型压缩内存使用
使用 itertuples 而不是 iterrows, 使用 apply 来优化迭代,先筛选再计算
一行代码,实现pandas替代,并拥有多核、不受内存限制的计算能力
最快的tableu解决方案
分布式tableu,可运行在数千结点上