Microsoft Azure Blob 存储连接¶
Microsoft Azure Blob 存储连接类型启用 Azure Blob 存储集成。
验证 Azure Blob 存储¶
有六种方法可以使用 Airflow 连接到 Azure Blob 存储。
使用令牌凭据,即向 Airflow 连接添加特定凭据(client_id、secret、tenant)和订阅 ID。
使用Azure 共享密钥凭据,即向 Airflow 连接的
shared_access_key
添加共享密钥凭据。使用 SAS 令牌,即在 Airflow 连接中向
sas_token
添加密钥配置。使用连接字符串,即向 Airflow 连接的
connection_string
添加连接字符串。通过设置
managed_identity_client_id
、workload_identity_tenant_id
来使用托管标识(在后台,它使用 DefaultAzureCredential 和这些参数)回退到 DefaultAzureCredential。这包括尝试使用不同选项进行身份验证的机制:托管系统标识、环境变量、通过 Azure CLI 进行身份验证等。
一次只能使用一种授权方法。如果需要管理多个凭据或密钥,则应配置多个连接。
默认连接 ID¶
与 Microsoft Azure Blob 存储相关的所有钩子和操作符默认使用 wasb_default
。
配置连接¶
- 登录 (可选)
指定用于 Azure Blob 存储的登录名。作为服务主体凭据,严格需要用于 Active Directory(令牌)身份验证。如果指定了主机(帐户 URL),则对于其余的身份验证是可选的。它可以省略以回退到 DefaultAzureCredential。
- 密码(可选)
指定用于 Azure Blob 存储的密码。用于 Active Directory(令牌凭据)和共享密钥身份验证。它可以省略以回退到 DefaultAzureCredential。
- 主机(可选)
指定 Azure Blob 存储的帐户 URL。作为服务主体凭据,严格需要用于 Active Directory(令牌)和 DefaultAzureCredential 身份验证。如果指定了登录名(帐户名称),则对于其余的身份验证是可选的。
- Blob 存储连接字符串(可选)
用于连接字符串身份验证的连接字符串。它可以省略以回退到 DefaultAzureCredential。
- Blob 存储共享访问密钥(可选)
指定共享访问密钥。仅在共享访问密钥身份验证时需要。它可以省略以回退到 DefaultAzureCredential。
- SAS 令牌(可选)
用于 SAS 令牌身份验证的 SAS 令牌。它可以省略以回退到 DefaultAzureCredential。
- 租户 ID(Active Directory 身份验证)(可选)
指定要使用的租户。仅在 Active Directory(令牌)身份验证时需要。它可以省略以回退到 DefaultAzureCredential。
- 额外参数(可选)
指定可以在 Azure 连接中使用的额外参数(作为 JSON 字典)。以下参数均为可选
client_secret_auth_config
: 在使用 ClientSecretCredential 作为服务主体进行身份验证时要传递的额外配置。它可以省略以回退到 DefaultAzureCredential。managed_identity_client_id
:用户分配的托管标识的客户端 ID。如果提供 workload_identity_tenant_id,它们将传递给DefaultAzureCredential
。workload_identity_tenant_id
:应用程序的 Microsoft Entra 租户的 ID。也称为其“目录” ID。如果提供 managed_identity_client_id,它们将传递给DefaultAzureCredential
。
在环境变量中指定连接时,应使用 URI 语法指定它。
请注意,URI 的所有组件都应进行 URL 编码。
例如,使用令牌凭据连接
export AIRFLOW_CONN_WASB_DEFAULT='wasb://blob%20username:blob%[email protected]?tenant_id=tenant+id'