airflow.providers.presto.transfers.gcs_to_presto

此模块包含 Google Cloud Storage 到 Presto 的操作符。

模块内容

GCSToPrestoOperator

将 CSV 文件从 Google Cloud Storage 加载到 Presto 表中。

class airflow.providers.presto.transfers.gcs_to_presto.GCSToPrestoOperator(*, source_bucket, source_object, presto_table, presto_conn_id='presto_default', gcp_conn_id='google_cloud_default', schema_fields=None, schema_object=None, impersonation_chain=None, **kwargs)[源代码]

基类: airflow.models.BaseOperator

将 CSV 文件从 Google Cloud Storage 加载到 Presto 表中。

假设:1. CSV 文件不应有标题 2. 已经创建了具有所需列的 Presto 表 3. (可选)可以提供带有标题或标题列表的单独 JSON 文件

参数
  • source_bucket (str) – 包含 CSV 文件的源 GCS 存储桶

  • source_object (str) – CSV 文件,包括路径

  • presto_table (str) – 要上传数据的 Presto 表

  • presto_conn_id (str) – 目标 Presto 连接

  • gcp_conn_id (str) – (可选)用于连接到 Google Cloud 并与 Google Cloud Storage 服务交互的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据进行模拟,或获取列表中最后一个帐户的 access_token 所需的链式帐户列表,该列表将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的标识必须将“服务帐户令牌创建者”IAM 角色授予直接前面的标识,其中列表中的第一个帐户将此角色授予原始帐户。

template_fields: collections.abc.Sequence[str] = ('source_bucket', 'source_object', 'presto_table')[源代码]
execute(context)[源代码]

在创建操作符时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

此条目是否有帮助?