Microsoft Azure Blob 存储连接

Microsoft Azure Blob 存储连接类型启用 Azure Blob 存储集成。

验证 Azure Blob 存储

有六种方法可以使用 Airflow 连接到 Azure Blob 存储。

  1. 使用令牌凭据,即向 Airflow 连接添加特定凭据(client_id、secret、tenant)和订阅 ID。

  2. 使用Azure 共享密钥凭据,即向 Airflow 连接的 shared_access_key 添加共享密钥凭据。

  3. 使用 SAS 令牌,即在 Airflow 连接中向 sas_token 添加密钥配置。

  4. 使用连接字符串,即向 Airflow 连接的 connection_string 添加连接字符串。

  5. 通过设置 managed_identity_client_idworkload_identity_tenant_id 来使用托管标识(在后台,它使用 DefaultAzureCredential 和这些参数)

  6. 回退到 DefaultAzureCredential。这包括尝试使用不同选项进行身份验证的机制:托管系统标识、环境变量、通过 Azure CLI 进行身份验证等。

一次只能使用一种授权方法。如果需要管理多个凭据或密钥,则应配置多个连接。

默认连接 ID

与 Microsoft Azure Blob 存储相关的所有钩子和操作符默认使用 wasb_default

配置连接

登录 (可选)

指定用于 Azure Blob 存储的登录名。作为服务主体凭据,严格需要用于 Active Directory(令牌)身份验证。如果指定了主机(帐户 URL),则对于其余的身份验证是可选的。它可以省略以回退到 DefaultAzureCredential

密码(可选)

指定用于 Azure Blob 存储的密码。用于 Active Directory(令牌凭据)和共享密钥身份验证。它可以省略以回退到 DefaultAzureCredential

主机(可选)

指定 Azure Blob 存储的帐户 URL。作为服务主体凭据,严格需要用于 Active Directory(令牌)和 DefaultAzureCredential 身份验证。如果指定了登录名(帐户名称),则对于其余的身份验证是可选的。

Blob 存储连接字符串(可选)

用于连接字符串身份验证的连接字符串。它可以省略以回退到 DefaultAzureCredential

Blob 存储共享访问密钥(可选)

指定共享访问密钥。仅在共享访问密钥身份验证时需要。它可以省略以回退到 DefaultAzureCredential

SAS 令牌(可选)

用于 SAS 令牌身份验证的 SAS 令牌。它可以省略以回退到 DefaultAzureCredential

租户 ID(Active Directory 身份验证)(可选)

指定要使用的租户。仅在 Active Directory(令牌)身份验证时需要。它可以省略以回退到 DefaultAzureCredential

额外参数(可选)

指定可以在 Azure 连接中使用的额外参数(作为 JSON 字典)。以下参数均为可选

  • client_secret_auth_config: 在使用 ClientSecretCredential 作为服务主体进行身份验证时要传递的额外配置。它可以省略以回退到 DefaultAzureCredential

  • managed_identity_client_id:用户分配的托管标识的客户端 ID。如果提供 workload_identity_tenant_id,它们将传递给 DefaultAzureCredential

  • workload_identity_tenant_id:应用程序的 Microsoft Entra 租户的 ID。也称为其“目录” ID。如果提供 managed_identity_client_id,它们将传递给 DefaultAzureCredential

在环境变量中指定连接时,应使用 URI 语法指定它。

请注意,URI 的所有组件都应进行 URL 编码。

例如,使用令牌凭据连接

export AIRFLOW_CONN_WASB_DEFAULT='wasb://blob%20username:blob%[email protected]?tenant_id=tenant+id'

此条目是否有帮助?