airflow.providers.google.cloud.triggers.cloud_batch

属性

DEFAULT_BATCH_LOCATION

CloudBatchJobFinishedTrigger

Cloud Batch 触发器,用于检查模板化作业是否已完成。

模块内容

airflow.providers.google.cloud.triggers.cloud_batch.DEFAULT_BATCH_LOCATION = 'us-central1'[源代码]
class airflow.providers.google.cloud.triggers.cloud_batch.CloudBatchJobFinishedTrigger(job_name, project_id, location=DEFAULT_BATCH_LOCATION, gcp_conn_id='google_cloud_default', impersonation_chain=None, polling_period_seconds=10, timeout=None)[源代码]

基类: airflow.triggers.base.BaseTrigger

Cloud Batch 触发器,用于检查模板化作业是否已完成。

参数
  • job_name (str) – 必需。作业名称。

  • project_id (str | None) – 必需。启动作业的 Google Cloud 项目 ID。

  • location (str) – 可选。执行作业的位置。如果设置为 None,则使用 DEFAULT_BATCH_LOCATION 的值。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选。用于使用短期凭据模拟的服务账号,或者获取列表中最后一个账号的 access_token 所需的账号链,该账号将在请求中被模拟。如果设置为字符串,则该账号必须授予发起账号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中的身份必须授予直接前一个身份 Service Account Token Creator IAM 角色,列表中的第一个账号将此角色授予发起账号(模板化)。

  • poll_sleep – 检查状态的轮询周期(秒)

project_id[源代码]
job_name[源代码]
location = 'us-central1'[源代码]
gcp_conn_id = 'google_cloud_default'[源代码]
polling_period_seconds = 10[源代码]
timeout = None[源代码]
impersonation_chain = None[源代码]
serialize()[源代码]

序列化类参数和类路径。

async run()[源代码]

获取作业状态或产生特定事件。

该类的主循环,用于获取作业状态并产生特定事件。

如果作业状态为成功,则产生状态为成功的 TriggerEvent,如果作业状态为失败,则产生状态为错误的 TriggerEvent,如果作业正在被删除,则产生状态为删除的 TriggerEvent。在任何其他情况下,Trigger 将等待存储在 self.polling_period_seconds 变量中的指定时间。

此条目是否有帮助?