airflow.providers.amazon.aws.triggers.glue¶
类¶
监视 Glue 作业,在作业完成时触发。 |
|
异步等待 AWS Glue Catalog 中出现分区。 |
|
在 AWS Glue 数据质量评估运行完成时触发。 |
|
在 AWS Glue 数据质量推荐运行完成时触发。 |
模块内容¶
- class airflow.providers.amazon.aws.triggers.glue.GlueJobCompleteTrigger(job_name, run_id, verbose, aws_conn_id, job_poll_interval)[source]¶
基类:
airflow.triggers.base.BaseTrigger
监视 Glue 作业,在作业完成时触发。
- 参数:
- class airflow.providers.amazon.aws.triggers.glue.GlueCatalogPartitionTrigger(database_name, table_name, expression='', waiter_delay=60, aws_conn_id='aws_default', region_name=None, verify=None, botocore_config=None)[source]¶
基类:
airflow.triggers.base.BaseTrigger
异步等待 AWS Glue Catalog 中出现分区。
- 参数:
database_name (str) – 分区所在的目录数据库名称。
table_name (str) – 要等待的表名,支持点表示法 (my_database.my_table)
expression (str) – 要等待的分区子句。此参数将按原样传递给 AWS Glue Catalog API 的 get_partitions 函数,支持类似 SQL 的表示法,例如
ds='2015-01-01' AND type='value'
,以及比较运算符,例如"ds>=2015-01-01"
。请参阅 https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-catalog-partitions.html #aws-glue-api-catalog-partitions-GetPartitionsaws_conn_id (str | None) – 存储凭据和额外配置的 Airflow 连接 ID
region_name (str | None) – 可选的 AWS 区域名称(例如:us-east-1)。如果未指定,则使用连接中的区域。
waiter_delay (int) – 两次检查之间等待的秒数。默认为 60 秒。
- class airflow.providers.amazon.aws.triggers.glue.GlueDataQualityRuleSetEvaluationRunCompleteTrigger(evaluation_run_id, waiter_delay=60, waiter_max_attempts=75, aws_conn_id='aws_default')[source]¶
基类:
airflow.providers.amazon.aws.triggers.base.AwsBaseWaiterTrigger
在 AWS Glue 数据质量评估运行完成时触发。
- 参数:
- class airflow.providers.amazon.aws.triggers.glue.GlueDataQualityRuleRecommendationRunCompleteTrigger(recommendation_run_id, waiter_delay=60, waiter_max_attempts=75, aws_conn_id='aws_default')[source]¶
基类:
airflow.providers.amazon.aws.triggers.base.AwsBaseWaiterTrigger
在 AWS Glue 数据质量推荐运行完成时触发。
- 参数: