跳到内容

表达式

我们在前面的章节中介绍了“表达式”的概念。在本节中,我们将重点探讨 Polars 提供的表达式类型。每个小节都概述了它们的功能并提供了额外的示例。

  • 要点
    • 基本操作 – 如何对数据框(dataframe)列进行基本操作,例如算术计算、比较以及其他常见通用操作
    • 表达式展开 – 什么是表达式展开以及如何使用它
    • 类型转换 – 如何将值转换/强制转换为不同的数据类型
  • 如何使用特定类型的数据或数据类型命名空间
    • 字符串 – 如何使用字符串和命名空间 str
    • 列表和数组 – 数据类型 ListArray 之间的区别,何时以及如何使用它们
    • 分类数据和枚举 – 数据类型 CategoricalEnum 之间的区别,何时以及如何使用它们
    • 结构体 – 何时以及如何使用数据类型 Struct
    • 缺失数据 – 如何处理缺失数据以及如何填充缺失数据
  • 操作类型
    • 聚合 – 如何使用 group_by 等聚合上下文
    • 窗口函数 – 如何在数据框(dataframe)的列上应用窗口函数
    • 折叠 – 如何在列之间横向执行任意计算
  • 用户定义的 Python 函数 – 如何将用户定义的 Python 函数应用于数据框(dataframe)列或列值
  • Numpy 函数 – 如何在 Polars 数据框(dataframe)和系列(series)上使用 NumPy 原生函数