airflow.providers.google.cloud.operators.bigquery_dts¶
本模块包含 Google BigQuery Data Transfer Service 算子。
类¶
创建新的数据传输配置。 |
|
删除传输配置。 |
|
启动手动传输运行,在 schedule_time 等于当前时间时立即执行。 |
模块内容¶
- class airflow.providers.google.cloud.operators.bigquery_dts.BigQueryCreateDataTransferOperator(*, transfer_config, project_id=PROVIDE_PROJECT_ID, location=None, authorization_code=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建新的数据传输配置。
另请参阅
有关如何使用此算子的更多信息,请参阅指南: 创建传输配置
- 参数:
transfer_config (dict) – 要创建的数据传输配置。
project_id (str) – 要创建传输配置的 BigQuery 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
location (str | None) – 用于区域传输的 BigQuery Transfer Service 位置。
authorization_code (str | None) – 用于此传输配置的授权码。如果需要新的凭据,则此参数是必需的。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定了 None,则不会重试请求。
timeout (float | None) – 等待请求完成的超时时间(秒)。请注意,如果指定了 retry,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的附加元数据。
gcp_conn_id – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 用于使用短期凭据模拟的可选服务帐号,或获取列表中最后一个帐号的 access_token 所需的帐号链,该帐号将在请求中被模拟。如果设置为字符串,该帐号必须授予原始帐号 Service Account Token Creator IAM 角色。如果设置为序列,列表中的身份必须授予 Service Account Token Creator IAM 角色给紧接的前一个身份,列表中的第一个帐号将此角色授予原始帐号(使用模板)。
- template_fields: collections.abc.Sequence[str] = ('transfer_config', 'project_id', 'authorization_code', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.bigquery_dts.BigQueryDeleteDataTransferConfigOperator(*, transfer_config_id, project_id=PROVIDE_PROJECT_ID, location=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除传输配置。
另请参阅
有关如何使用此算子的更多信息,请参阅指南: 删除传输配置
- 参数:
transfer_config_id (str) – 要使用的传输配置 ID。
project_id (str) – 要创建传输配置的 BigQuery 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
location (str | None) – 用于区域传输的 BigQuery Transfer Service 位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定了 None,则不会重试请求。
timeout (float | None) – 等待请求完成的超时时间(秒)。请注意,如果指定了 retry,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的附加元数据。
gcp_conn_id – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 用于使用短期凭据模拟的可选服务帐号,或获取列表中最后一个帐号的 access_token 所需的帐号链,该帐号将在请求中被模拟。如果设置为字符串,该帐号必须授予原始帐号 Service Account Token Creator IAM 角色。如果设置为序列,列表中的身份必须授予 Service Account Token Creator IAM 角色给紧接的前一个身份,列表中的第一个帐号将此角色授予原始帐号(使用模板)。
- template_fields: collections.abc.Sequence[str] = ('transfer_config_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.bigquery_dts.BigQueryDataTransferServiceStartTransferRunsOperator(*, transfer_config_id, project_id=PROVIDE_PROJECT_ID, location=None, requested_time_range=None, requested_run_time=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, deferrable=conf.getboolean('operators', 'default_deferrable', fallback=False), **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
启动手动传输运行,在 schedule_time 等于当前时间时立即执行。
可以为一个时间范围(其中 run_time 在 start_time(包含)和 end_time(不包含)之间)创建传输运行,或为一个特定的 run_time 创建。
另请参阅
有关如何使用此算子的更多信息,请参阅指南: 手动启动传输运行
- 参数:
transfer_config_id (str) – 要使用的传输配置 ID。
requested_time_range (dict | None) – 应启动的传输运行的时间范围。如果提供了 dict,其形式必须与 protobuf 消息 ~google.cloud.bigquery_datatransfer_v1.types.TimeRange 相同。
requested_run_time (dict | None) – 应启动的传输运行的特定 run_time。requested_run_time 不能是未来时间。如果提供了 dict,其形式必须与 protobuf 消息 ~google.cloud.bigquery_datatransfer_v1.types.Timestamp 相同。
project_id (str) – 应创建传输配置的 BigQuery 项目 ID。
location (str | None) – 用于区域传输的 BigQuery Transfer Service 位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定了 None,则不会重试请求。
timeout (float | None) – 等待请求完成的超时时间(秒)。请注意,如果指定了 retry,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的附加元数据。
gcp_conn_id – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 用于使用短期凭据模拟的可选服务帐号,或获取列表中最后一个帐号的 access_token 所需的帐号链,该帐号将在请求中被模拟。如果设置为字符串,该帐号必须授予原始帐号 Service Account Token Creator IAM 角色。如果设置为序列,列表中的身份必须授予 Service Account Token Creator IAM 角色给紧接的前一个身份,列表中的第一个帐号将此角色授予原始帐号(使用模板)。
deferrable (bool) – 在可延迟模式下运行算子。
- template_fields: collections.abc.Sequence[str] = ('transfer_config_id', 'project_id', 'requested_time_range', 'requested_run_time',...[source]¶