airflow.providers.amazon.aws.transfers.gcs_to_s3

此模块包含 Google Cloud Storage 到 S3 的操作符。

模块内容

GCSToS3Operator

同步 Google Cloud Storage 存储桶与 S3 存储桶。

class airflow.providers.amazon.aws.transfers.gcs_to_s3.GCSToS3Operator(*, gcs_bucket, prefix=None, gcp_conn_id='google_cloud_default', dest_aws_conn_id='aws_default', dest_s3_key, dest_verify=None, replace=False, google_impersonation_chain=None, dest_s3_extra_args=None, s3_acl_policy=None, keep_directory_structure=True, match_glob=None, gcp_user_project=None, **kwargs)[源代码]

基类: airflow.models.BaseOperator

同步 Google Cloud Storage 存储桶与 S3 存储桶。

另请参阅

有关如何使用此操作符的更多信息,请查看指南:Google Cloud Storage 到 Amazon S3

参数
  • gcs_bucket (str) – 要查找对象的 Google Cloud Storage 存储桶。(模板化)

  • prefix (str | None) – 前缀字符串,用于筛选名称以此前缀开头的对象。(模板化)

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • dest_aws_conn_id (str | None) – 目标 S3 连接

  • dest_s3_key (str) – 用于存储文件的基本 S3 密钥。(模板化)

  • dest_verify (str | bool | None) –

    是否验证 S3 连接的 SSL 证书。默认情况下,会验证 SSL 证书。您可以提供以下值

    • False:不验证 SSL 证书。仍将使用 SSL

      (除非 use_ssl 为 False),但不会验证 SSL 证书。

    • path/to/cert/bundle.pem:要使用的 CA 证书捆绑文件的文件名。

      如果您想使用与 botocore 使用的 CA 证书捆绑不同的证书捆绑,则可以指定此参数。

  • replace (bool) – 是否验证目标存储桶中是否存在文件。默认情况下设置为 False。如果设置为 True,将上传所有文件,替换目标存储桶中的现有文件。如果设置为 False,则只会上传源存储桶中存在但目标存储桶中不存在的文件。

  • google_impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的 Google 服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须向原始帐户授予服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予服务帐户令牌创建者 IAM 角色,列表中的第一个帐户将此角色授予原始帐户(模板化)。

  • s3_acl_policy (str | None) – 可选的字符串,用于指定要在 S3 中上传的对象的预定义 ACL 策略

  • keep_directory_structure (bool) – (可选) 如果设置为 False,则会在 dest_s3_key 中传递的路径内重新创建存储桶上文件的路径。

  • match_glob (str | None) – (可选) 根据字符串给定的 glob 模式筛选对象(例如,'**/*/.json')

  • gcp_user_project (str | None) – (可选) 用于为此请求计费的 Google Cloud 项目的标识符。对于请求者付款存储桶是必需的。

template_fields: collections.abc.Sequence[str] = ('gcs_bucket', 'prefix', 'dest_s3_key', 'google_impersonation_chain', 'gcp_user_project')[源代码]
ui_color = '#f0eee4'[源代码]
execute(context)[源代码]

在创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

此条目是否有帮助?