airflow.providers.google.cloud.operators.dataprep¶
此模块包含一个 Google Dataprep 算子。
类¶
获取 Cloud Dataprep 作业中的批处理作业信息。 |
|
获取指定的作业组。 |
|
创建一个 |
|
创建所提供流 ID 的副本,以及所有包含的数据处理脚本。 |
|
删除具有指定 ID 的流。 |
|
运行具有指定 ID 的流。 |
模块内容¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepGetJobsForJobGroupOperator(*, dataprep_conn_id='dataprep_default', job_group_id, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取 Cloud Dataprep 作业中的批处理作业信息。
API 文档: https://clouddataprep.com/documentation/api#section/Overview。
另请参阅
有关如何使用此算子的更多信息,请参阅指南:获取作业组的作业
:param job_group_id 将要请求的作业组的 ID
- template_fields: collections.abc.Sequence[str] = ('job_group_id',)[source]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepGetJobGroupOperator(*, dataprep_conn_id='dataprep_default', project_id=PROVIDE_PROJECT_ID, job_group_id, embed, include_deleted, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取指定的作业组。
作业组是在流中从特定节点执行的作业。
API 文档: https://clouddataprep.com/documentation/api#section/Overview。
另请参阅
有关如何使用此算子的更多信息,请参阅指南:获取作业组
- 参数:
- template_fields: collections.abc.Sequence[str] = ('job_group_id', 'embed', 'project_id')[source]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepRunJobGroupOperator(*, project_id=PROVIDE_PROJECT_ID, dataprep_conn_id='dataprep_default', body_request, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建一个
jobGroup
,它以认证用户的身份启动指定的作业。这执行的操作与在应用程序中点击“运行作业”按钮相同。
要获取 recipe_id,请参阅 Dataprep API 文档:https://clouddataprep.com/documentation/api#operation/runJobGroup。
另请参阅
有关如何使用此算子的更多信息,请参阅指南:运行作业组
- 参数:
- template_fields: collections.abc.Sequence[str] = ('body_request',)[source]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepCopyFlowOperator(*, project_id=PROVIDE_PROJECT_ID, dataprep_conn_id='dataprep_default', flow_id, name='', description='', copy_datasources=False, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建所提供流 ID 的副本,以及所有包含的数据处理脚本。
- 参数:
- template_fields: collections.abc.Sequence[str] = ('flow_id', 'name', 'project_id', 'description')[source]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepDeleteFlowOperator(*, dataprep_conn_id='dataprep_default', flow_id, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除具有指定 ID 的流。
- template_fields: collections.abc.Sequence[str] = ('flow_id',)[source]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepRunFlowOperator(*, project_id=PROVIDE_PROJECT_ID, flow_id, body_request, dataprep_conn_id='dataprep_default', **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
运行具有指定 ID 的流。
- 参数:
- template_fields: collections.abc.Sequence[str] = ('flow_id', 'project_id')[source]¶