Apache Pig 操作符¶
Apache Pig 是一个用于分析大型数据集的平台,它包含一种用于表达数据分析程序的高级语言,并与用于评估这些程序的基础设施相结合。Pig 程序易于大规模并行化,这反过来使它们能够处理非常大的数据集。
使用 PigOperator
来执行 Pig 脚本。
tests/system/apache/pig/example_pig.py
run_this = PigOperator(
task_id="run_example_pig_script",
pig="ls /;",
pig_opts="-x local",
)