airflow.providers.databricks.sensors.databricks_partition

此模块包含 Databricks 传感器。

DatabricksPartitionSensor

用于检测 Databricks 中表分区是否存在的传感器。

模块内容

class airflow.providers.databricks.sensors.databricks_partition.DatabricksPartitionSensor(*, databricks_conn_id=DatabricksSqlHook.default_conn_name, http_path=None, sql_warehouse_name=None, session_configuration=None, http_headers=None, catalog='', schema='default', table_name, partitions, partition_operator='=', handler=fetch_all_handler, client_parameters=None, **kwargs)[source]

基础类:airflow.sensors.base.BaseSensorOperator

用于检测 Databricks 中表分区是否存在的传感器。

参数
  • databricks_conn_id (str) – 对 Databricks 连接 ID 的引用 (模板化),默认为 DatabricksSqlHook.default_conn_name。

  • sql_warehouse_name (str | None) – Databricks SQL 仓库的可选名称。如果未指定,则必须提供 http_path(如下所述),默认为 None

  • http_path (str | None) – 指定 Databricks SQL 仓库或通用集群的 HTTP 路径的可选字符串。如果未指定,则应在 Databricks 连接的额外参数中指定,或者必须指定 sql_warehouse_name。

  • session_configuration – Spark session 参数的可选字典。如果未指定,则可以在 Databricks 连接的额外参数中指定,默认为 None

  • http_headers (list[tuple[str, str]] | None) – 可选的 (k, v) 对列表,将在每个请求中设置为 HTTP 头。(模板化)。

  • catalog (str) – 要使用的可选初始目录。需要 Databricks Runtime 9.0+ 版本 (模板化),默认为 ""。

  • schema (str) – 要使用的可选初始 schema。需要 Databricks Runtime 9.0+ 版本 (模板化),默认为 “default”。

  • table_name (str) – 要检查分区的表的名称。

  • partitions (dict) – 要检查的分区名称。示例:{“date”: “2023-01-03”, “name”: [“abc”, “def”]}。

  • partition_operator (str) – 用于分区的可选比较运算符,例如 >=。

  • handler (Callable[[Any], Any]) – DbApiHook.run() 的处理器,用于返回结果,默认为 fetch_all_handler。

  • client_parameters (dict[str, Any] | None) – Databricks SQL 连接器内部的附加参数。

template_fields: collections.abc.Sequence[str] = ('databricks_conn_id', 'catalog', 'schema', 'table_name', 'partitions', 'http_headers')[source]
template_ext: collections.abc.Sequence[str] = ('.sql',)[source]
template_fields_renderers[source]
databricks_conn_id = 'databricks_default'[source]
session_config = None[source]
http_headers = None[source]
catalog = ''[source]
schema = 'default'[source]
caller = 'DatabricksPartitionSensor'[source]
partitions[source]
partition_operator = '='[source]
table_name[source]
client_parameters[source]
hook_params[source]
handler[source]
escaper[source]
poke(context)[source]

检查表分区并返回结果。

此条目是否有帮助?