airflow.providers.google.cloud.sensors.bigquery

该模块包含 Google BigQuery 传感器。

模块内容

BigQueryTableExistenceSensor

检查 Google Bigquery 中是否存在表。

BigQueryTablePartitionExistenceSensor

检查 Google Bigquery 中表中是否存在分区。

class airflow.providers.google.cloud.sensors.bigquery.BigQueryTableExistenceSensor(*, project_id, dataset_id, table_id, gcp_conn_id='google_cloud_default', impersonation_chain=None, deferrable=conf.getboolean('operators', 'default_deferrable', fallback=False), **kwargs)[source]

基类:airflow.sensors.base.BaseSensorOperator

检查 Google Bigquery 中是否存在表。

参数
  • project_id (str) – 要在其中查找表的 Google 云项目。提供给 Hook 的连接必须提供对指定项目的访问权限。

  • dataset_id (str) – 要在其中查找表的数据库名称。存储桶。

  • table_id (str) – 要检查是否存在的表的名称。

  • gcp_conn_id (str) – (可选)用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟,或获取列表中最后一个帐户的 access_token 所需的帐户链列表,该帐户将在请求中模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的标识必须将“服务帐户令牌创建者”IAM 角色授予紧接的前一个标识,列表中的第一个帐户将此角色授予原始帐户(已模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'dataset_id', 'table_id', 'impersonation_chain')[source]
ui_color = '#f0eee4'[source]
poke(context)[source]

在派生此类时重写。

execute(context)[source]

Airflow 在 worker 上运行此方法,并使用触发器进行延迟。

execute_complete(context, event=None)[source]

当触发器触发时充当回调 - 立即返回。

依赖触发器抛出异常,否则假设执行成功。

class airflow.providers.google.cloud.sensors.bigquery.BigQueryTablePartitionExistenceSensor(*, project_id, dataset_id, table_id, partition_id, gcp_conn_id='google_cloud_default', impersonation_chain=None, deferrable=conf.getboolean('operators', 'default_deferrable', fallback=False), **kwargs)[source]

基类:airflow.sensors.base.BaseSensorOperator

检查 Google Bigquery 中表中是否存在分区。

参数
  • project_id (str) – 要在其中查找表的 Google 云项目。提供给 Hook 的连接必须提供对指定项目的访问权限。

  • dataset_id (str) – 要在其中查找表的数据库名称。存储桶。

  • table_id (str) – 要检查是否存在的表的名称。

  • partition_id (str) – 要检查是否存在的分区的名称。

  • gcp_conn_id (str) – (可选)用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟,或获取列表中最后一个帐户的 access_token 所需的帐户链列表,该帐户将在请求中模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的标识必须将“服务帐户令牌创建者”IAM 角色授予紧接的前一个标识,列表中的第一个帐户将此角色授予原始帐户(已模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'dataset_id', 'table_id', 'partition_id', 'impersonation_chain')[source]
ui_color = '#f0eee4'[source]
poke(context)[source]

在派生此类时重写。

execute(context)[source]

如果 deferrable 为 True,则 Airflow 在 worker 上运行此方法,并使用触发器进行延迟。

execute_complete(context, event=None)[source]

当触发器触发时充当回调 - 立即返回。

依赖触发器抛出异常,否则假设执行成功。

此条目是否有帮助?