airflow.providers.microsoft.azure.hooks.synapse
¶
模块内容¶
类¶
Azure Synapse Spark 作业操作状态。 |
|
用于与 Azure Synapse 交互的钩子。 |
|
Azure Synapse 管道操作状态。 |
|
一个基础钩子类,用于使用连接 ID 创建会话并连接到 Azure Synapse。 |
|
用于与 Azure Synapse 管道交互的钩子。 |
属性¶
- class airflow.providers.microsoft.azure.hooks.synapse.AzureSynapseSparkBatchRunStatus[源代码]¶
Azure Synapse Spark 作业操作状态。
- class airflow.providers.microsoft.azure.hooks.synapse.AzureSynapseHook(azure_synapse_conn_id=default_conn_name, spark_pool='')[源代码]¶
基类:
airflow.hooks.base.BaseHook
用于与 Azure Synapse 交互的钩子。
- 参数
azure_synapse_conn_id (str) – Azure Synapse 连接 ID。
spark_pool (str) – 用于提交作业的 Apache Spark 池
- run_spark_job(payload)[source]¶
在 Apache Spark 池中运行作业。
- 参数
payload (azure.synapse.spark.models.SparkBatchJobOptions) – Livy 兼容的有效载荷,表示用户要提交的 Spark 作业。
- class airflow.providers.microsoft.azure.hooks.synapse.AzureSynapsePipelineRunStatus[source]¶
Azure Synapse 管道操作状态。
- exception airflow.providers.microsoft.azure.hooks.synapse.AzureSynapsePipelineRunException[source]¶
基类:
airflow.exceptions.AirflowException
指示管道运行未能完成的异常。
- class airflow.providers.microsoft.azure.hooks.synapse.BaseAzureSynapseHook(azure_synapse_conn_id=default_conn_name, **kwargs)[source]¶
基类:
airflow.hooks.base.BaseHook
一个基础钩子类,用于使用连接 ID 创建会话并连接到 Azure Synapse。
- 参数
azure_synapse_conn_id (str) – Azure Synapse 连接 ID。
- class airflow.providers.microsoft.azure.hooks.synapse.AzureSynapsePipelineHook(azure_synapse_workspace_dev_endpoint, azure_synapse_conn_id=default_conn_name, **kwargs)[源代码]¶
-
用于与 Azure Synapse 管道交互的钩子。
- 参数
azure_synapse_conn_id (str) – Azure Synapse 连接 ID。
azure_synapse_workspace_dev_endpoint (str) – Azure Synapse Workspace 开发终结点。
- run_pipeline(pipeline_name, **config)[源代码]¶
运行 Synapse 管道。
- 参数
pipeline_name (str) – 管道名称。
config (Any) – Synapse Artifact Client 的额外参数。
- 返回
管道运行 ID。
- 返回类型
azure.synapse.artifacts.models.CreateRunResponse
- get_pipeline_run(run_id)[源代码]¶
获取管道运行。
- 参数
run_id (str) – 管道运行标识符。
- 返回
管道运行。
- 返回类型
azure.synapse.artifacts.models.PipelineRun
- wait_for_pipeline_run_status(run_id, expected_statuses, check_interval=60, timeout=60 * 60 * 24 * 7)[源代码]¶
等待管道运行与预期状态匹配。
- 参数
run_id (str) – 管道运行标识符。
expected_statuses (str | set[str]) – 要针对管道运行的当前状态检查的所需状态。
check_interval (int) – 以秒为单位检查管道运行状态的时间间隔。
timeout (int) – 等待管道达到终端状态或预期状态的秒数。
- 返回
布尔值,指示管道运行是否已达到
expected_status
。- 返回类型