Hive CLI 连接

Hive CLI 连接类型启用 Hive CLI 集成。

验证 Hive CLI

有两种方法可以使用 Airflow 连接到 Hive。

  1. 使用 Hive Beeline。例如,使用主机、端口和 schema 创建 JDBC 连接字符串。或者,您可以使用代理用户连接,并指定登录名和密码。

  2. 使用 Hive CLI。例如,在 extras 字段中指定 Hive CLI 参数。

一次只能使用一种授权方法。如果您需要管理多个凭据或密钥,则应配置多个连接。

默认连接 ID

所有与 Hive_CLI 相关的 hook 和操作符默认使用 hive_cli_default

配置连接

登录名(可选)

指定代理用户或 Beeline CLI 的用户名。

密码(可选)

指定您的 Beeline CLI 密码。

主机(可选)

指定用于 Hive Beeline 的 JDBC Hive 主机。

端口(可选)

指定用于 Hive Beeline 的 JDBC Hive 端口。

Schema(可选)

指定您要使用 Beeline 连接的 JDBC Hive 数据库,或者为要使用 Hive CLI 运行的 HQL 语句指定 schema。

使用 Beeline(可选)

如果使用 Beeline CLI,则指定为 True。默认为 False

代理用户(可选)

指定一个代理用户以该用户的身份运行 HQL 代码。

Principal(可选)

指定要与 Hive Beeline 一起使用的 JDBC Hive principal。

高可用性(可选)

如果您想连接到在高可用性模式下运行的 Hive 安装,则指定为 True。相应地指定主机。

在环境变量中指定连接时,应使用 URI 语法指定。

请注意,URI 的所有组成部分都应进行 URL 编码。

例如

export AIRFLOW_CONN_HIVE_CLI_DEFAULT='hive-cli://beeline-username:beeline-password@jdbc-hive-host:80/hive-database?hive_cli_params=params&use_beeline=True&auth=noSasl&principal=hive%2F_HOST%40EXAMPLE.COM'

此条目是否有帮助?