airflow.providers.snowflake.operators.snowpark

SnowparkOperator

使用 Snowpark Python 代码执行 Python 函数。

模块内容

class airflow.providers.snowflake.operators.snowpark.SnowparkOperator(*, snowflake_conn_id='snowflake_default', python_callable, op_args=None, op_kwargs=None, templates_dict=None, templates_exts=None, show_return_value_in_logs=True, warehouse=None, database=None, schema=None, role=None, authenticator=None, session_parameters=None, **kwargs)[source]

基类: airflow.providers.common.compat.standard.operators.PythonOperator

使用 Snowpark Python 代码执行 Python 函数。

另请参阅

有关如何使用此操作符的更多信息,请参阅指南: SnowparkOperator

参数:
  • snowflake_conn_id (str) – 对 Snowflake 连接 ID 的引用

  • python_callable (Callable) – 对可调用对象的引用

  • op_args (collections.abc.Collection[Any] | None) – 调用可调用对象时将解包的位置参数列表

  • op_kwargs (collections.abc.Mapping[str, Any] | None) – 将在函数中解包的关键字参数字典

  • templates_dict (dict[str, Any] | None) – 一个字典,其值是模板,这些模板将在 __init__execute 执行之间的某个时间点由 Airflow 引擎进行模板化,并在模板应用后在可调用对象的上下文中使用。(模板化)

  • templates_exts (collections.abc.Sequence[str] | None) – 处理模板化字段时要解析的文件扩展名列表,例如 ['.sql', '.hql']

  • show_return_value_in_logs (bool) – 一个布尔值,指示是否在日志中显示返回值。默认为 True,允许输出返回值日志。可以设置为 False 以防止在返回大量数据(例如通过 XCom 向 TaskAPI 传输大量数据)时输出返回值日志。

  • warehouse (str | None) – 仓库名称(将覆盖连接的 extra JSON 中定义的任何仓库)

  • database (str | None) – 数据库名称(将覆盖连接中定义的数据库)

  • schema (str | None) – 模式名称(将覆盖连接中定义的模式)

  • role (str | None) – 角色名称(将覆盖连接的 extra JSON 中定义的任何角色)

  • authenticator (str | None) – Snowflake 的认证方式。'snowflake'(默认)使用 Snowflake 内部认证方式;'externalbrowser' 使用您的 Web 浏览器和 Okta、ADFS 或为您的帐户定义的任何其他符合 SAML 2.0 的身份提供商 (IdP) 进行认证;'https://<your_okta_account_name>.okta.com' 通过原生 Okta 进行认证。

  • session_parameters (dict | None) – 连接 Snowflake 时,您可以设置会话级别参数

snowflake_conn_id = 'snowflake_default'[source]
warehouse = None[source]
database = None[source]
schema = None[source]
role = None[source]
authenticator = None[source]
session_parameters = None[source]
execute_callable()[source]

使用给定参数调用 Python 可调用对象。

返回:

调用的返回值。

此条目有帮助吗?