配置参考

此页面包含 apache-airflow-providers-edge3 提供程序所有可用的 Airflow 配置列表,这些配置可以在 airflow.cfg 文件中或使用环境变量设置。

注意

提供程序中嵌入的配置从 Airflow 2.7.0 开始使用。之前,配置在 Airflow 核心包中描述和配置 - 因此,如果您使用的是低于 2.7.0 版本的 Airflow,请查阅 Airflow 文档以获取 Airflow 核心中可用的配置选项列表。

注意

更多信息请参阅 设置配置选项

[edge]

本节仅在您使用上面 [core] 部分的 EdgeExecutor 时适用。

api_enabled

标记插件端点是否已启用以服务 Edge Workers。

类型:

布尔值

默认值:

False

环境变量:

AIRFLOW__EDGE__API_ENABLED

示例:

True

api_url

Airflow 代码边缘 API 可从边缘工作节点访问的 URL 端点。

类型:

字符串

默认值:

环境变量:

AIRFLOW__EDGE__API_URL

示例:

https://airflow.hosting.org/edge_worker/v1/rpcapi

heartbeat_interval

边缘工作节点持续向中心站点报告状态。此参数定义了发送带有心跳的状态的频率。在心跳过程中,状态会被报告,同时也会检查正在运行的任务是否需要终止。

类型:

整数

默认值:

30

环境变量:

AIRFLOW__EDGE__HEARTBEAT_INTERVAL

示例:

10

job_fail_purge

EdgeExecutor 的失败作业从数据库中清除的分钟数。

类型:

整数

默认值:

60

环境变量:

AIRFLOW__EDGE__JOB_FAIL_PURGE

job_poll_interval

边缘工作节点当前通过 HTTP 轮询新作业。此参数定义了在轮询新作业之间应休眠的秒数。作业轮询仅在边缘工作节点寻找新工作时发生,忙碌时则不会。

类型:

整数

默认值:

5

环境变量:

AIRFLOW__EDGE__JOB_POLL_INTERVAL

示例:

5

job_success_purge

EdgeExecutor 的成功作业从数据库中清除的分钟数。

类型:

整数

默认值:

5

环境变量:

AIRFLOW__EDGE__JOB_SUCCESS_PURGE

push_log_chunk_size

边缘工作节点以块(chunk)的形式上传日志文件。如果上传的日志文件部分超过块大小,它会创建一个新的请求。应用网关可以限制最大请求体大小,请参阅:https://nginx.ac.cn/en/docs/http/ngx_http_core_module.html#client_max_body_size。HTTP 413 问题可能指向此值以解决问题。此值必须以字节(Bytes)为单位定义。

类型:

整数

默认值:

524288

环境变量:

AIRFLOW__EDGE__PUSH_LOG_CHUNK_SIZE

worker_concurrency

并发度定义了默认的最大并行运行任务实例数,也可以在启动工作节点时使用 airflow edge worker 命令参数设置。工作节点的大小和资源必须支持您的任务性质。此参数与任务的 concurrency_slots 参数协同工作。

类型:

整数

默认值:

8

环境变量:

AIRFLOW__EDGE__WORKER_CONCURRENCY

此条目有帮助吗?