airflow.providers.google.cloud.hooks.bigquery_dts¶
此模块包含一个 BigQuery Hook。
类¶
用于 Google Bigquery Transfer API 的 Hook。 |
|
用于 BigQuery 服务,与 Google 库的异步客户端一起使用的 Hook。 |
函数¶
|
返回对象的唯一 ID。 |
模块内容¶
- class airflow.providers.google.cloud.hooks.bigquery_dts.BiqQueryDataTransferServiceHook(gcp_conn_id='google_cloud_default', location=None, impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.common.hooks.base_google.GoogleBaseHook
用于 Google Bigquery Transfer API 的 Hook。
Hook 中所有使用
project_id
的方法都必须使用关键字参数调用,而不是位置参数。- get_conn()[source]¶
检索到 Google Bigquery 的连接。
- 返回:
Google Bigquery API 客户端
- 返回类型:
google.cloud.bigquery_datatransfer_v1.DataTransferServiceClient
- create_transfer_config(transfer_config, project_id=PROVIDE_PROJECT_ID, authorization_code=None, retry=DEFAULT, timeout=None, metadata=())[source]¶
创建一个新的数据传输配置。
- 参数:
transfer_config (dict | google.cloud.bigquery_datatransfer_v1.types.TransferConfig) – 要创建的数据传输配置。
project_id (str) – 应创建传输配置的 BigQuery 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认项目 ID。
authorization_code (str | None) – 与此传输配置一起使用的授权码。如果需要新凭据,则此参数为必需。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则 timeout 应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的额外元数据。
- 返回:
一个
google.cloud.bigquery_datatransfer_v1.types.TransferConfig
实例。- 返回类型:
- delete_transfer_config(transfer_config_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=())[source]¶
删除传输配置。
- 参数:
transfer_config_id (str) – 要使用的传输配置 ID。
project_id (str) – 应创建传输配置的 BigQuery 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认项目 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则 timeout 应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的额外元数据。
- 返回:
None
- 返回类型:
None
- start_manual_transfer_runs(transfer_config_id, project_id=PROVIDE_PROJECT_ID, requested_time_range=None, requested_run_time=None, retry=DEFAULT, timeout=None, metadata=())[source]¶
启动手动传输运行,立即执行,schedule_time 等于当前时间。
可以为一个时间范围创建传输运行,其中 run_time 在 start_time(包含)和 end_time(不包含)之间,或为一个特定的 run_time。
- 参数:
transfer_config_id (str) – 要使用的传输配置 ID。
requested_time_range (dict | None) – 应启动的传输运行的时间范围。如果提供的是字典,其形式必须与 protobuf 消息 ~google.cloud.bigquery_datatransfer_v1.types.TimeRange 相同
requested_run_time (dict | None) – 要启动的传输运行的特定 run_time。`requested_run_time` 不能是将来时间。如果提供的是字典,其形式必须与 protobuf 消息 ~google.cloud.bigquery_datatransfer_v1.types.Timestamp 相同
project_id (str) – 应创建传输配置的 BigQuery 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认项目 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则 timeout 应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的额外元数据。
- 返回:
一个
google.cloud.bigquery_datatransfer_v1.types.StartManualTransferRunsResponse
实例。- 返回类型:
google.cloud.bigquery_datatransfer_v1.types.StartManualTransferRunsResponse
- get_transfer_run(run_id, transfer_config_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=())[source]¶
返回关于特定传输运行的信息。
- 参数:
run_id (str) – 传输运行的 ID。
transfer_config_id (str) – 要使用的传输配置 ID。
project_id (str) – 应创建传输配置的 BigQuery 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认项目 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则 timeout 应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的额外元数据。
- 返回:
一个
google.cloud.bigquery_datatransfer_v1.types.TransferRun
实例。- 返回类型:
- class airflow.providers.google.cloud.hooks.bigquery_dts.AsyncBiqQueryDataTransferServiceHook(gcp_conn_id='google_cloud_default', location=None, impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.common.hooks.base_google.GoogleBaseAsyncHook
用于 BigQuery 服务,与 Google 库的异步客户端一起使用的 Hook。
- async get_transfer_run(config_id, run_id, project_id, location=None, retry=DEFAULT, timeout=None, metadata=())[source]¶
返回关于特定传输运行的信息。
- 参数:
run_id (str) – 传输运行的 ID。
config_id (str) – 要使用的传输配置 ID。
project_id (str | None) – 应创建传输配置的 BigQuery 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认项目 ID。
location (str | None) – 用于区域传输的 BigQuery Transfer Service 位置。
retry (google.api_core.retry_async.AsyncRetry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则 timeout 应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的额外元数据。
- 返回:
一个
google.cloud.bigquery_datatransfer_v1.types.TransferRun
实例。