airflow.providers.google.cloud.operators.dataprep
¶
此模块包含一个 Google Dataprep 操作符。
模块内容¶
类¶
获取有关 Cloud Dataprep 作业中批处理作业的信息。 |
|
获取指定的作业组。 |
|
创建一个 |
|
创建所提供流 ID 的副本,以及所有包含的配方。 |
|
删除具有提供的 ID 的流。 |
|
运行具有提供的 ID 的流,它是提供的流 ID 的副本。 |
- class airflow.providers.google.cloud.operators.dataprep.DataprepGetJobsForJobGroupOperator(*, dataprep_conn_id='dataprep_default', job_group_id, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取有关 Cloud Dataprep 作业中批处理作业的信息。
API 文档: https://clouddataprep.com/documentation/api#section/Overview。
另请参阅
有关如何使用此操作符的更多信息,请查看指南: 获取作业组的作业
:param job_group_id 将被请求的作业组的 ID
- template_fields: collections.abc.Sequence[str] = ('job_group_id',)[源代码]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepGetJobGroupOperator(*, dataprep_conn_id='dataprep_default', project_id=PROVIDE_PROJECT_ID, job_group_id, embed, include_deleted, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取指定的作业组。
作业组是从流中特定节点执行的作业。
API 文档: https://clouddataprep.com/documentation/api#section/Overview。
另请参阅
有关如何使用此操作符的更多信息,请查看指南: 获取作业组
- 参数
job_group_id (int | str) – 将被请求的作业组的 ID
embed (str) – 要作为响应的一部分拉入的对象的逗号分隔列表
include_deleted (bool) – 如果设置为“true”,将包括已删除的对象
- template_fields: collections.abc.Sequence[str] = ('job_group_id', 'embed', 'project_id')[源代码]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepRunJobGroupOperator(*, project_id=PROVIDE_PROJECT_ID, dataprep_conn_id='dataprep_default', body_request, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建一个
jobGroup
,它以经过身份验证的用户身份启动指定的作业。这执行与单击应用程序中的“运行作业”按钮相同的操作。
要获取 recipe_id,请遵循 Dataprep API 文档: https://clouddataprep.com/documentation/api#operation/runJobGroup。
另请参阅
有关如何使用此操作符的更多信息,请查看指南: 运行作业组
- 参数
dataprep_conn_id (str) – Dataprep 连接 ID
body_request (dict) – 作为 body_request 传递给 GoogleDataprepHook 的 run_job_group,它是要运行的配方的标识符
- template_fields: collections.abc.Sequence[str] = ('body_request',)[source]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepCopyFlowOperator(*, project_id=PROVIDE_PROJECT_ID, dataprep_conn_id='dataprep_default', flow_id, name='', description='', copy_datasources=False, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建所提供流 ID 的副本,以及所有包含的配方。
- 参数
- template_fields: collections.abc.Sequence[str] = ('flow_id', 'name', 'project_id', 'description')[source]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepDeleteFlowOperator(*, dataprep_conn_id='dataprep_default', flow_id, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除具有提供的 ID 的流。
- template_fields: collections.abc.Sequence[str] = ('flow_id',)[source]¶
- class airflow.providers.google.cloud.operators.dataprep.DataprepRunFlowOperator(*, project_id=PROVIDE_PROJECT_ID, flow_id, body_request, dataprep_conn_id='dataprep_default', **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
运行具有提供的 ID 的流,它是提供的流 ID 的副本。
- 参数
- template_fields: collections.abc.Sequence[str] = ('flow_id', 'project_id')[source]¶