DatabricksReposUpdateOperator

使用 DatabricksReposUpdateOperator 通过 api/2.0/repos/ API 端点,将现有 Databricks Repos 中的代码更新到指定的 Git 分支或标签。

使用操作符

通常,此操作符用于在 Databricks 作业执行前更新其源代码。要使用此操作符,您需要提供 branchtag,以及 repo_pathrepo_id

参数

输入

branch: str

要更新到的现有 Git 分支名称(如果未提供 tag,则必需)。

tag: str

要更新到的现有 Git 标签名称(如果未提供 branch,则必需)。

repo_path: str

现有 Databricks Repos 的路径,例如 /Repos/<user_email>/repo_name(如果未提供 repo_id,则必需)。

repo_id: str

现有 Databricks Repos 的 ID(如果未提供 repo_path,则必需)。

databricks_conn_id: string

要使用的 Airflow 连接名称。

databricks_retry_limit: integer

如果 Databricks 后端不可达,重试的次数。

databricks_retry_delay: decimal

每次重试之间等待的秒数。

示例

通过指定路径更新 Databricks Repo

DatabricksReposUpdateOperator 的一个示例如下所示

tests/system/databricks/example_databricks_repos.py

    # Example of updating a Databricks Repo to the latest code
    repo_path = "/Repos/user@domain.com/demo-repo"
    update_repo = DatabricksReposUpdateOperator(task_id="update_repo", repo_path=repo_path, branch="releases")

本条目对您有帮助吗?