airflow.providers.amazon.aws.operators.appflow¶
属性¶
类¶
Amazon AppFlow 基础操作器类(不建议直接在 DAG 中使用)。 |
|
按原样执行 AppFlow 运行。 |
|
执行 AppFlow 全量运行,移除任何过滤器。 |
|
更新过滤器以仅选择先前数据后,执行 AppFlow 运行。 |
|
更新过滤器以仅选择未来数据后,执行 AppFlow 运行。 |
|
更新过滤器以仅选择单日数据后,执行 AppFlow 运行。 |
|
在 AppFlow 运行为空的情况下进行短路(跳过后续任务)。 |
模块内容¶
- airflow.providers.amazon.aws.operators.appflow.MANDATORY_FILTER_DATE_MSG = '{entity} 必须提供 filter_date 参数!'[source]¶
- airflow.providers.amazon.aws.operators.appflow.NOT_SUPPORTED_SOURCE_MSG = '{entity} 不支持数据源 {source}!'[source]¶
- class airflow.providers.amazon.aws.operators.appflow.AppflowBaseOperator(flow_name, flow_update, source=None, source_field=None, filter_date=None, poll_interval=20, max_attempts=60, wait_for_completion=True, **kwargs)[source]¶
基类:
airflow.providers.amazon.aws.operators.base_aws.AwsBaseOperator[airflow.providers.amazon.aws.hooks.appflow.AppflowHook]Amazon AppFlow 基础操作器类(不建议直接在 DAG 中使用)。
- 参数:
source (str | None) – 数据源名称(支持:salesforce, zendesk)
flow_name (str) – 流名称
flow_update (bool) – 一个布尔值,用于在运行前启用/禁用流更新
source_field (str | None) – 应用过滤器的字段名称
filter_date (str | None) – 用于过滤器中的日期值(或模板)。
poll_interval (int) – 检查查询状态的间隔(秒)
max_attempts (int) – 超时前检查状态的次数
wait_for_completion (bool) – 是否在返回前等待运行结束
aws_conn_id – Airflow 用于 AWS 凭证的连接 ID。如果该值为
None或为空,则使用默认的 boto3 行为。若在分布式方式运行 Airflow 且aws_conn_id为None或空,则会使用默认的 boto3 配置(并且需在每个工作节点上维护该配置)。region_name – AWS 区域名称(region_name)。如果未指定,则使用默认的 boto3 行为。
verify – 是否验证 SSL 证书。参见: https://boto3.amazonaws.com/v1/documentation/api/latest/reference/core/session.html
botocore_config – 用于 botocore 客户端的配置字典(键值对)。参见: https://botocore.amazonaws.com/v1/documentation/api/latest/reference/config.html
- class airflow.providers.amazon.aws.operators.appflow.AppflowRunOperator(flow_name, poll_interval=20, wait_for_completion=True, **kwargs)[source]¶
-
按原样执行 AppFlow 运行。
另请参阅
有关如何使用此操作器的更多信息,请查看指南: 运行全量流 (Run Flow Full)
- class airflow.providers.amazon.aws.operators.appflow.AppflowRunFullOperator(source, flow_name, poll_interval=20, wait_for_completion=True, **kwargs)[source]¶
-
执行 AppFlow 全量运行,移除任何过滤器。
另请参阅
有关如何使用此操作器的更多信息,请查看指南: 运行每日流 (Run Flow Daily)
- class airflow.providers.amazon.aws.operators.appflow.AppflowRunBeforeOperator(source, flow_name, source_field, filter_date, poll_interval=20, wait_for_completion=True, **kwargs)[source]¶
-
更新过滤器以仅选择先前数据后,执行 AppFlow 运行。
另请参阅
有关如何使用此操作器的更多信息,请查看指南: 运行后续流 (Run Flow After)
- 参数:
source (str) – 数据源名称(支持:salesforce)
flow_name (str) – 流名称
source_field (str) – 应用过滤器的字段名称
filter_date (str) – 用于过滤器中的日期值(或模板)。
poll_interval (int) – 检查查询状态的间隔(秒)
aws_conn_id – 用于 AWS 凭证的 Airflow 连接。如果此参数为 None 或为空,则使用默认的 boto3 行为。如果在分布式方式下运行 Airflow 且 aws_conn_id 为 None 或为空,则将使用默认的 boto3 配置(必须在每个 worker 节点上维护)。
region – 要使用的 AWS 区域
wait_for_completion (bool) – 是否在返回前等待运行结束
- class airflow.providers.amazon.aws.operators.appflow.AppflowRunAfterOperator(source, flow_name, source_field, filter_date, poll_interval=20, wait_for_completion=True, **kwargs)[source]¶
-
更新过滤器以仅选择未来数据后,执行 AppFlow 运行。
另请参阅
有关如何使用此操作器的更多信息,请查看指南: 跳过空运行任务 (Skipping Tasks For Empty Runs)
- class airflow.providers.amazon.aws.operators.appflow.AppflowRunDailyOperator(source, flow_name, source_field, filter_date, poll_interval=20, wait_for_completion=True, **kwargs)[source]¶
-
更新过滤器以仅选择单日数据后,执行 AppFlow 运行。
另请参阅
有关如何使用此操作器的更多信息,请查看指南: 运行前置流 (Run Flow Before)
- class airflow.providers.amazon.aws.operators.appflow.AppflowRecordsShortCircuitOperator(*, flow_name, appflow_run_task_id, ignore_downstream_trigger_rules=True, aws_conn_id='aws_default', region_name=None, verify=None, botocore_config=None, **kwargs)[source]¶
基类:
airflow.providers.common.compat.standard.operators.ShortCircuitOperator,airflow.providers.amazon.aws.utils.mixins.AwsBaseHookMixin[airflow.providers.amazon.aws.hooks.appflow.AppflowHook]在 AppFlow 运行为空的情况下进行短路。
另请参阅
有关如何使用此操作器的更多信息,请查看指南: 参考 (Reference)
- 参数:
flow_name (str) – 流名称
appflow_run_task_id (str) – 此操作器应从中提取执行 ID 的运行任务 ID
ignore_downstream_trigger_rules (bool) – 忽略下游触发规则
aws_conn_id (str | None) – 用于获取 AWS 凭证的 Airflow 连接。如果为
None或为空,则使用默认的 boto3 行为。如果在分布式环境中运行 Airflow 且aws_conn_id为None或为空,则会使用默认的 boto3 配置(需在每个工作节点上维护该配置)。region_name (str | None) – AWS 区域名称。如果未指定,则使用默认的 boto3 行为。
verify (bool | str | None) – 是否验证 SSL 证书。参见:https://boto3.amazonaws.com/v1/documentation/api/latest/reference/core/session.html
botocore_config (dict | None) – botocore 客户端的配置字典(键值对)。参见:https://botocore.amazonaws.com/v1/documentation/api/latest/reference/config.html