airflow.providers.databricks.sensors.databricks_sql

此模块包含 Databricks 传感器。

模块内容

DatabricksSqlSensor

在 Databricks 上运行 SQL 查询的传感器。

class airflow.providers.databricks.sensors.databricks_sql.DatabricksSqlSensor(*, databricks_conn_id=DatabricksSqlHook.default_conn_name, http_path=None, sql_warehouse_name=None, session_configuration=None, http_headers=None, catalog='', schema='default', sql, handler=fetch_all_handler, client_parameters=None, **kwargs)[源代码]

基类: airflow.sensors.base.BaseSensorOperator

在 Databricks 上运行 SQL 查询的传感器。

参数
  • databricks_conn_id (str) – 指向 Databricks 连接 ID 的引用(可模板化),默认为 DatabricksSqlHook.default_conn_name。

  • sql_warehouse_name (str | None) – Databricks SQL 仓库的可选名称。如果未指定,则必须提供如下所述的 http_path,默认为 None

  • http_path (str | None) – 指定 Databricks SQL 仓库或通用集群的 HTTP 路径的可选字符串。如果未指定,则应在 Databricks 连接的额外参数中指定,或必须指定 sql_warehouse_name

  • session_configuration – Spark 会话参数的可选字典。如果未指定,可以在 Databricks 连接的额外参数中指定,默认为 None

  • http_headers (list[tuple[str, str]] | None) – 一个可选的 (k, v) 对列表,将在每个请求上设置为 HTTP 标头。(可模板化)。

  • catalog (str) – 要使用的可选初始目录。需要 Databricks Runtime 版本 9.0+(可模板化),默认为 “”

  • schema (str) – 要使用的可选初始模式。需要 Databricks Runtime 版本 9.0+(可模板化),默认为 “default”

  • sql (str | collections.abc.Iterable[str]) – 要执行的 SQL 语句。

  • handler (Callable[[Any], Any]) – 用于 DbApiHook.run() 返回结果的处理程序,默认为 fetch_all_handler

  • client_parameters (dict[str, Any] | None) – Databricks SQL 连接器参数内部的其他参数。

template_fields: collections.abc.Sequence[str] = ('databricks_conn_id', 'sql', 'catalog', 'schema', 'http_headers')[源代码]
template_ext: collections.abc.Sequence[str] = ('.sql',)[源代码]
template_fields_renderers[源代码]
hook()[源代码]

创建并返回一个 DatabricksSqlHook 对象。

poke(context)[源代码]

传感器轮询函数,用于从 SQL 传感器获取并返回结果。

此条目是否有帮助?