使用方法

Lazy API を使うと、Polars は各クエリを行ごとに実行するのではなく、クエリ全体をエンドツーエンドで処理します。Polars を最大限に活用するには、以下の理由から Lazy API を使うことが重要です：

ここでは、ファイルまたは既存の DataFrame から Lazy API を使う方法を見ていきます。

ファイルから Lazy APIを使う

クエリオプティマイザーがファイルから読み込むデータ量を削減できるため、理想的にはファイルから Lazy API を使うのが良いでしょう。

Reddit の CSV データから Lazy クエリを作成し、いくつかの変換を適用します。

pl.scan_csv からクエリを始めることで、Lazy API を使います。

Python

q1 = (
    pl.scan_csv(f"docs/data/reddit.csv")
    .with_columns(pl.col("name").str.to_uppercase())
    .filter(pl.col("comment_karma") > 0)
)

pl.scan_ 関数は、CSV、IPC、Parquet、JSON などの様々なファイル形式に対応しています。

このクエリでは、Polars に以下を指定しています:

この Lazy クエリはこの時点では実行されません。Lazy クエリの実行については Lazy クエリの実行のページを参照してください。

Lazy API にアクセスする別の方法は、メモリ上に作成済みの DataFrame に対して .lazy を呼び出すことです。

Python

q3 = pl.DataFrame({"foo": ["a", "b", "c"], "bar": [0, 1, 2]}).lazy()

.lazy を呼び出すことで、DataFrame を LazyFrame に変換します。