airflow.providers.presto.hooks.presto

属性

T

异常

PrestoException

Presto 异常。

PrestoHook

通过 prestodb 与 Presto 交互。

函数

generate_presto_client_info()

返回包含 dag_id、task_id、logical_date 和 try_number 的 json 字符串。

模块内容

airflow.providers.presto.hooks.presto.T[source]
airflow.providers.presto.hooks.presto.generate_presto_client_info()[source]

返回包含 dag_id、task_id、logical_date 和 try_number 的 json 字符串。

exception airflow.providers.presto.hooks.presto.PrestoException[source]

Bases: Exception

Presto 异常。

class airflow.providers.presto.hooks.presto.PrestoHook(*args, **kwargs)[source]

Bases: airflow.providers.common.sql.hooks.sql.DbApiHook

通过 prestodb 与 Presto 交互。

>>> ph = PrestoHook()
>>> sql = "SELECT count(1) AS num FROM airflow.static_babynames"
>>> ph.get_records(sql)
[[340698]]
conn_name_attr = 'presto_conn_id'[source]
default_conn_name = 'presto_default'[source]
conn_type = 'presto'[source]
hook_name = 'Presto'[source]
strip_semicolon = True[source]
get_conn()[source]

返回连接对象。

get_isolation_level()[source]

返回隔离级别。

get_records(sql='', parameters=None)[source]

执行 sql 并返回一组记录。

参数:
get_first(sql='', parameters=None)[source]

执行 sql 并返回第一行结果。

参数:
get_pandas_df(sql='', parameters=None, **kwargs)[source]

执行 sql 并返回 pandas 数据帧。

参数:
  • sql (str) – 要执行的 sql 语句(字符串)或要执行的 sql 语句列表

  • parameters – 用于渲染 SQL 查询的参数。

  • kwargs – (可选) 传递给 pandas.io.sql.read_sql 方法。

insert_rows(table, rows, target_fields=None, commit_every=0, replace=False, **kwargs)[source]

将一组元组插入到表中。

参数:
  • table (str) – 目标表的名称

  • rows (collections.abc.Iterable[tuple]) – 要插入到表中的行

  • target_fields (collections.abc.Iterable[str] | None) – 要在表中填充的列名

  • commit_every (int) – 在一个事务中插入的最大行数。设置为 0 表示在一个事务中插入所有行。

  • replace (bool) – 是替换而不是插入

此条目有帮助吗?