匡醍量化|大富翁量化 Table of Content Pandas应用案例[3] “Modin 通过多核并行加速 Pandas 操作,读取 10GB CSV 文件比 Pandas 快 4-8 倍;Polars 基于 Rust 架构,内存占用仅为 Pandas 的 1/3;Dask 则支持分布式计算,轻松处理 TB 级数据。” 2025-04-05 Pandas应用案例[2] “通过将字符串列转换为 category 类型,内存占用可减少 90% 以上;使用 itertuples 替代 iterrows,遍历速度提升 6 倍;结合 Numba 的 JIT 编译,数值计算性能可媲美 C 语言。” 2025-04-05 Pandas应用案例[1] “Alphalens 要求因子数据是双重索引的 Series,价格数据是日期为索引、资产代码为列的 DataFrame。通过 Pandas 的 pivot_table 和 set_index,可以轻松完成格式转换,为因子分析奠定基础。” 2025-04-04 Pandas核心语法[7] “Pandas 的 DataFrame 提供了强大的样式功能,可以通过 Styler 对象实现类似 Excel 的条件着色效果。此外,Pandas 内置的绘图方法支持多种图表类型,轻松满足数据可视化需求。” 2025-04-03 Pandas核心语法[6] “Pandas 提供了强大的日期时间处理功能,从字符串到时间戳的转换、时区调整到格式化输出,都可以轻松实现。此外,字符串操作如替换、分割、过滤等,也能通过 str 访问器高效完成。” 2025-04-02 Pandas核心语法[5] “Pandas 提供了丰富的 IO 操作功能,支持从 CSV、SQL、Parquet 等多种文件格式中读取数据。通过优化参数如 chunksize、usecols 和 dtype,可以显著提升读取速度并减少内存占用。” 2025-04-01 Pandas核心语法[4] “在 Pandas 中,逻辑运算和比较运算是数据筛选的基础工具。通过与(&)、或(|)等操作符,可以轻松实现复杂条件筛选,比如选出市盈率最大且市净率最小的股票。” 2025-03-31 Pandas核心语法[3] “DataFrame 是 Pandas 的核心数据结构,支持多种数据类型和灵活的操作方式。无论是嵌套字典、NumPy 数组还是 CSV 文件,都可以轻松转换为 DataFrame,助你快速完成数据分析任务。” 2025-03-30 Pandas核心语法[2] 1. Series 的基本功能本节,我们将介绍Series的一些数据的基本操作方法。后续将会深入地挖掘pandas在数据分析和处理方面的功能。 2025-03-29 Pandas核心语法[1] Pandas在量化交易中,处于核心地位。许多基于Python SDK的数据源返回的数据格式一般是pandas.DataFrame。因子分析库Alphalens、性能评估库empyrical等都依赖于Pandas。 2025-03-28 Numpy应用案例[3] “去极值是量化分析预处理中不可或缺的一步。在各种方法中,中位数拉回法因其鲁棒性和适应性广泛应用。通过 Numpy 的向量化实现,我们可以轻松完成多资产的去极值操作,显著提升计算效率。” 2025-03-27 Numpy应用案例[2] “线性回归是量化分析中的常用工具,但在大规模数据中,循环实现效率低下。通过 Numpy 的向量化技巧,我们可以将计算提速百倍,轻松应对滑动窗口和批量计算等复杂需求。” 2025-03-26