airflow.providers.apache.livy.hooks.livy¶
此模块包含 Apache Livy hook。
类¶
批量会话状态。 |
|
通过 REST API 连接 Apache Livy 的 hook。 |
|
通过 REST API 异步连接 Apache Livy 的 hook。 |
函数¶
|
确保 endpoint 前缀以斜杠开头。 |
模块内容¶
- airflow.providers.apache.livy.hooks.livy.sanitize_endpoint_prefix(endpoint_prefix)[source]¶
确保 endpoint 前缀以斜杠开头。
- class airflow.providers.apache.livy.hooks.livy.LivyHook(livy_conn_id=default_conn_name, extra_options=None, extra_headers=None, auth_type=None, endpoint_prefix=None)[source]¶
继承自:
airflow.providers.http.hooks.http.HttpHook
通过 REST API 连接 Apache Livy 的 hook。
- 参数:
另请参阅
有关更多详细信息,请参阅 Apache Livy API 参考:https://livy.apache.org/docs/latest/rest-api.html
- run_method(endpoint, method='GET', data=None, headers=None, retry_args=None)[source]¶
封装 HttpHook;允许在同一个 HttpHook 上更改方法。
- get_batch_state(session_id, retry_args=None)[source]¶
获取指定批量作业的状态。
- 参数:
retry_args (dict[str, Any] | None) – 定义重试行为的参数。请参阅 Tenacity 文档:https://github.com/jd/tenacity
- 返回:
批量状态
- 返回类型:
- static build_post_batch_body(file, args=None, class_name=None, jars=None, py_files=None, files=None, archives=None, name=None, driver_memory=None, driver_cores=None, executor_memory=None, executor_cores=None, num_executors=None, queue=None, proxy_user=None, conf=None)[source]¶
构建 post batch 请求体。
另请参阅
有关格式的更多信息,请参阅 https://livy.apache.org/docs/latest/rest-api.html
- 参数:
file (str) – 包含要执行的应用程序的文件路径(必需)。
proxy_user (str | None) – 运行作业时要模拟的用户。
class_name (str | None) – 应用程序 Java/Spark 主类字符串。
args (collections.abc.Sequence[str | int | float] | None) – 应用程序的命令行参数。
driver_memory (str | None) – 用于 driver 进程的内存量字符串。
executor_memory (str | None) – 每个 executor 进程使用的内存量字符串。
executor_cores (int | None) – 每个 executor 使用的核数整数。
queue (str | None) – 提交到的 YARN 队列名称字符串。
name (str | None) – 此会话的名称字符串。
conf (dict[Any, Any] | None) – Spark 配置属性。
- 返回:
请求体
- 返回类型:
- class airflow.providers.apache.livy.hooks.livy.LivyAsyncHook(livy_conn_id=default_conn_name, extra_options=None, extra_headers=None, endpoint_prefix=None)[source]¶
继承自:
airflow.providers.http.hooks.http.HttpAsyncHook
通过 REST API 异步连接 Apache Livy 的 hook。
- 参数:
另请参阅
有关更多详细信息,请参阅 Apache Livy API 参考:https://livy.apache.org/docs/latest/rest-api.html
- async run_method(endpoint, method='GET', data=None, headers=None)[source]¶
包装 HttpAsyncHook;允许在同一个 HttpAsyncHook 上更改方法。
- static build_post_batch_body(file, args=None, class_name=None, jars=None, py_files=None, files=None, archives=None, name=None, driver_memory=None, driver_cores=None, executor_memory=None, executor_cores=None, num_executors=None, queue=None, proxy_user=None, conf=None)[source]¶
构建 post batch 请求体。
- 参数:
file (str) – 包含要执行的应用程序的文件路径(必需)。
proxy_user (str | None) – 运行作业时要模拟的用户。
class_name (str | None) – 应用程序 Java/Spark 主类字符串。
args (collections.abc.Sequence[str | int | float] | None) – 应用程序的命令行参数。
driver_memory (str | None) – 用于 driver 进程的内存量字符串。
executor_memory (str | None) – 每个 executor 进程使用的内存量字符串。
executor_cores (int | None) – 每个 executor 使用的核数整数。
queue (str | None) – 提交到的 YARN 队列名称字符串。
name (str | None) – 此会话的名称字符串。
conf (dict[Any, Any] | None) – Spark 配置属性。
- 返回:
请求体
- 返回类型: