airflow.providers.apache.druid.operators.druid

DruidOperator

允许直接向 Druid 提交任务。

模块内容

class airflow.providers.apache.druid.operators.druid.DruidOperator(*, json_index_file, druid_ingest_conn_id='druid_ingest_default', timeout=1, max_ingestion_time=None, ingestion_type=IngestionType.BATCH, verify_ssl=True, **kwargs)[source]

基类: airflow.models.BaseOperator

允许直接向 Druid 提交任务。

参数:
  • json_index_file (str) – Druid 索引规范的文件路径

  • druid_ingest_conn_id (str) – 接受索引作业的 Druid overlord 的连接 ID

  • timeout (int) – 轮询 Druid 作业以获取摄取作业状态的间隔时间(秒)。必须大于或等于 1

  • max_ingestion_time (int | None) – 假定作业失败前的最大摄取时间

  • ingestion_type (airflow.providers.apache.druid.hooks.druid.IngestionType) – 作业的摄取类型。可以是 IngestionType.Batch 或 IngestionType.MSQ

  • verify_ssl (bool) – 是否使用 SSL 加密提交索引作业。如果设置为 False,则检查连接信息以查找要使用的 CA 捆绑包路径。默认为 True

template_fields: collections.abc.Sequence[str] = ('json_index_file',)[source]
template_ext: collections.abc.Sequence[str] = ('.json',)[source]
template_fields_renderers[source]
json_index_file[source]
conn_id = 'druid_ingest_default'[source]
timeout = 1[source]
max_ingestion_time = None[source]
ingestion_type[source]
verify_ssl = True[source]
execute(context)[source]

创建 operator 时派生。

Context 与渲染 jinja 模板时使用的字典相同。

请参考 get_template_context 获取更多 context。

此条目是否有帮助?