airflow.providers.google.cloud.operators.dlp

各种 Google Cloud DLP 操作符,允许您使用 Cloud DLP 执行基本操作。

CloudDLPCancelDLPJobOperator

启动对长时间运行的 DlpJob 的异步取消。

CloudDLPCreateDeidentifyTemplateOperator

创建一个去标识化模板,以重用内容、图像和存储的常用配置。

CloudDLPCreateDLPJobOperator

创建一个新作业以检查存储或计算风险指标。

CloudDLPCreateInspectTemplateOperator

创建一个 InspectTemplate,以重用内容、图像和存储的常用配置。

CloudDLPCreateJobTriggerOperator

创建一个作业触发器,以便按设定的时间表运行 DLP 操作,例如扫描存储以查找敏感信息。

CloudDLPCreateStoredInfoTypeOperator

创建一个预构建的存储信息类型用于检查。

CloudDLPDeidentifyContentOperator

从内容项中去标识化潜在的敏感信息;限制输入大小和输出大小。

CloudDLPDeleteDeidentifyTemplateOperator

删除一个 DeidentifyTemplate。

CloudDLPDeleteDLPJobOperator

删除一个长时间运行的 DlpJob。

CloudDLPDeleteInspectTemplateOperator

删除一个 InspectTemplate。

CloudDLPDeleteJobTriggerOperator

删除一个作业触发器。

CloudDLPDeleteStoredInfoTypeOperator

删除一个存储信息类型。

CloudDLPGetDeidentifyTemplateOperator

获取一个 DeidentifyTemplate。

CloudDLPGetDLPJobOperator

获取长时间运行的 DlpJob 的最新状态。

CloudDLPGetInspectTemplateOperator

获取一个 InspectTemplate。

CloudDLPGetDLPJobTriggerOperator

获取一个作业触发器。

CloudDLPGetStoredInfoTypeOperator

获取一个存储信息类型。

CloudDLPInspectContentOperator

在内容中查找潜在的敏感信息;限制输入大小、处理时间和输出大小。

CloudDLPListDeidentifyTemplatesOperator

列出去标识化模板。

CloudDLPListDLPJobsOperator

列出请求中与指定过滤器匹配的 DlpJobs。

CloudDLPListInfoTypesOperator

返回 DLP API 支持的敏感信息类型列表。

CloudDLPListInspectTemplatesOperator

列出 InspectTemplates。

CloudDLPListJobTriggersOperator

列出作业触发器。

CloudDLPListStoredInfoTypesOperator

列出存储信息类型。

CloudDLPRedactImageOperator

从图像中编辑潜在的敏感信息;限制输入大小、处理时间和输出大小。

CloudDLPReidentifyContentOperator

重新标识已被去标识化的内容。

CloudDLPUpdateDeidentifyTemplateOperator

更新 DeidentifyTemplate。

CloudDLPUpdateInspectTemplateOperator

更新 InspectTemplate。

CloudDLPUpdateJobTriggerOperator

更新作业触发器。

CloudDLPUpdateStoredInfoTypeOperator

通过创建新版本来更新存储信息类型。

模块内容

class airflow.providers.google.cloud.operators.dlp.CloudDLPCancelDLPJobOperator(*, dlp_job_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

启动对长时间运行的 DlpJob 的异步取消。

参阅

有关如何使用此操作符的更多信息,请参阅指南:取消作业

参数:
  • dlp_job_id (str) – 要取消的 DLP 作业资源的 ID。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('dlp_job_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
dlp_job_id[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateDeidentifyTemplateOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, deidentify_template=None, template_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

创建一个去标识化模板,以重用内容、图像和存储的常用配置。

参阅

有关如何使用此操作符的更多信息,请参阅指南:去标识化模板

参数:
  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • deidentify_template (dict | google.cloud.dlp_v2.types.DeidentifyTemplate | None) – (可选) 要创建的 DeidentifyTemplate。

  • template_id (str | None) – (可选) 模板 ID。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'deidentify_template', 'template_id', 'gcp_conn_id',...[source]
organization_id = None[source]
project_id = None[source]
deidentify_template = None[source]
template_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateDLPJobOperator(*, project_id=PROVIDE_PROJECT_ID, inspect_job=None, risk_job=None, job_id=None, retry=DEFAULT, timeout=None, metadata=(), wait_until_finished=True, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

创建一个新作业以检查存储或计算风险指标。

参阅

有关如何使用此操作符的更多信息,请参阅指南:创建作业

参数:
  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • inspect_job (dict | google.cloud.dlp_v2.types.InspectJobConfig | None) – (可选) 检查作业的配置。

  • risk_job (dict | google.cloud.dlp_v2.types.RiskAnalysisJobConfig | None) – (可选) 风险分析作业的配置。

  • job_id (str | None) – (可选) 作业 ID。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • wait_until_finished (bool) – (可选) 如果为 True,将持续轮询作业状态,直到状态变为 DONE。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'inspect_job', 'risk_job', 'job_id', 'gcp_conn_id', 'impersonation_chain')[source]
project_id = None[source]
inspect_job = None[source]
risk_job = None[source]
job_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
wait_until_finished = True[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateInspectTemplateOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, inspect_template=None, template_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

创建一个 InspectTemplate,以重用内容、图像和存储的常用配置。

参阅

有关如何使用此操作符的更多信息,请参阅指南:创建模板

参数:
  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • inspect_template (google.cloud.dlp_v2.types.InspectTemplate | None) – (可选) 要创建的 InspectTemplate。

  • template_id (str | None) – (可选) 模板 ID。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'inspect_template', 'template_id', 'gcp_conn_id',...[source]
organization_id = None[source]
project_id = None[source]
inspect_template = None[source]
template_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateJobTriggerOperator(*, project_id=PROVIDE_PROJECT_ID, job_trigger=None, trigger_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

创建一个作业触发器,以便按设定的时间表运行 DLP 操作,例如扫描存储以查找敏感信息。

参阅

有关如何使用此 operator 的更多信息,请参阅指南: 创建作业触发器

参数:
  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • job_trigger (dict | google.cloud.dlp_v2.types.JobTrigger | None) – (可选)要创建的 JobTrigger。

  • trigger_id (str | None) – (可选)JobTrigger ID。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'job_trigger', 'trigger_id', 'gcp_conn_id', 'impersonation_chain')[source]
project_id = None[source]
job_trigger = None[source]
trigger_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateStoredInfoTypeOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, config=None, stored_info_type_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

创建一个预构建的存储信息类型用于检查。

参阅

有关如何使用此 operator 的更多信息,请参阅指南: 创建存储的信息类型

参数:
  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • config (google.cloud.dlp_v2.types.StoredInfoTypeConfig | None) – (可选)StoredInfoType 的配置。

  • stored_info_type_id (str | None) – (可选)StoredInfoType ID。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'config', 'stored_info_type_id', 'gcp_conn_id', 'impersonation_chain')[source]
organization_id = None[source]
project_id = None[source]
config = None[source]
stored_info_type_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPDeidentifyContentOperator(*, project_id=PROVIDE_PROJECT_ID, deidentify_config=None, inspect_config=None, item=None, inspect_template_name=None, deidentify_template_name=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

从内容项中去标识化潜在的敏感信息;限制输入大小和输出大小。

参阅

有关如何使用此 operator 的更多信息,请参阅指南: 对内容进行去标识化

参数:
  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • deidentify_config (dict | google.cloud.dlp_v2.types.DeidentifyConfig | None) – (可选)用于对内容项进行去标识化的配置。此处指定的项将覆盖 deidentify_template_name 参数引用的模板中设置的配置。

  • inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可选)检查器的配置。此处指定的项将覆盖 inspect_template_name 参数引用的模板中设置的配置。

  • item (dict | google.cloud.dlp_v2.types.ContentItem | None) – (可选)要进行去标识化的项。将视为文本处理。

  • inspect_template_name (str | None) – (可选)要使用的可选模板。直接在 inspect_config 中指定的任何配置将覆盖模板中设置的配置。

  • deidentify_template_name (str | None) – (可选)要使用的可选模板。直接在 deidentify_config 中指定的任何配置将覆盖模板中设置的配置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'deidentify_config', 'inspect_config', 'item', 'inspect_template_name',...[source]
project_id = None[source]
deidentify_config = None[source]
inspect_config = None[source]
item = None[source]
inspect_template_name = None[source]
deidentify_template_name = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteDeidentifyTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

删除一个 DeidentifyTemplate。

参阅

有关如何使用此操作符的更多信息,请参阅指南:去标识化模板

参数:
  • template_id (str) – 要删除的去标识化模板的 ID。

  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
template_id[source]
organization_id = None[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteDLPJobOperator(*, dlp_job_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

删除一个长时间运行的 DlpJob。

此方法指示客户端不再对 DlpJob 结果感兴趣。如果可能,将取消作业。

参阅

有关如何使用此操作符的更多信息,请参阅指南:删除作业

参数:
  • dlp_job_id (str) – 要删除的 DLP 作业资源的 ID。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('dlp_job_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
dlp_job_id[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteInspectTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

删除一个 InspectTemplate。

参阅

有关如何使用此操作符的更多信息,请参阅指南:删除模板

参数:
  • template_id (str) – 要删除的检查模板的 ID。

  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
template_id[source]
organization_id = None[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteJobTriggerOperator(*, job_trigger_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

删除一个作业触发器。

参阅

有关如何使用此操作符的更多信息,请参阅指南:内容方法

参数:
  • job_trigger_id (str) – 要删除的 DLP 作业触发器的 ID。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('job_trigger_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
job_trigger_id[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteStoredInfoTypeOperator(*, stored_info_type_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

删除一个存储信息类型。

参阅

有关如何使用此操作符的更多信息,请参阅指南:删除存储的信息类型

参数:
  • stored_info_type_id (str) – 要删除的存储信息类型的 ID。

  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('stored_info_type_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
stored_info_type_id[source]
organization_id = None[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPGetDeidentifyTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

获取一个 DeidentifyTemplate。

参阅

了解如何使用此 Operator 的更多信息,请参阅指南: 去标识化模板

参数:
  • template_id (str) – 要读取的去标识化模板的 ID。

  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
template_id[source]
organization_id = None[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPGetDLPJobOperator(*, dlp_job_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

获取长时间运行的 DlpJob 的最新状态。

参阅

了解如何使用此 Operator 的更多信息,请参阅指南: 检索作业

参数:
  • dlp_job_id (str) – 要读取的 DLP 作业资源的 ID。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('dlp_job_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
dlp_job_id[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPGetInspectTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

获取一个 InspectTemplate。

参阅

了解如何使用此 Operator 的更多信息,请参阅指南: 检索模板

参数:
  • template_id (str) – 要读取的检查模板的 ID。

  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
template_id[source]
organization_id = None[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPGetDLPJobTriggerOperator(*, job_trigger_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

获取一个作业触发器。

参阅

了解如何使用此 Operator 的更多信息,请参阅指南: 检索作业触发器

参数:
  • job_trigger_id (str) – 要读取的 DLP 作业触发器的 ID。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('job_trigger_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
job_trigger_id[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPGetStoredInfoTypeOperator(*, stored_info_type_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

获取一个存储信息类型。

参阅

有关如何使用此 Operator 的更多信息,请参阅指南: 检索存储的信息类型

参数:
  • stored_info_type_id (str) – 要读取的存储信息类型的 ID。

  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('stored_info_type_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
stored_info_type_id[source]
organization_id = None[source]
project_id = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPInspectContentOperator(*, project_id=PROVIDE_PROJECT_ID, inspect_config=None, item=None, inspect_template_name=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

在内容中查找潜在的敏感信息;限制输入大小、处理时间和输出大小。

参阅

有关如何使用此 Operator 的更多信息,请参阅指南: 使用模板

参数:
  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可选)检查器的配置。此处指定的项将覆盖 inspect_template_name 参数引用的模板中设置的配置。

  • item (dict | google.cloud.dlp_v2.types.ContentItem | None) – (可选)要进行去标识化的项。将视为文本处理。

  • inspect_template_name (str | None) – (可选)要使用的可选模板。直接在 inspect_config 中指定的任何配置将覆盖模板中设置的配置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'inspect_config', 'item', 'inspect_template_name', 'gcp_conn_id', 'impersonation_chain')[source]
project_id = None[source]
inspect_config = None[source]
item = None[source]
inspect_template_name = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPListDeidentifyTemplatesOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出去标识化模板。

参阅

有关如何使用此 Operator 的更多信息,请参阅指南: 去标识化模板

参数:
  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数量。

  • order_by (str | None) – (可选) 可选的逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
organization_id = None[source]
project_id = None[source]
page_size = None[source]
order_by = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPListDLPJobsOperator(*, project_id=PROVIDE_PROJECT_ID, results_filter=None, page_size=None, job_type=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出请求中与指定过滤器匹配的 DlpJobs。

参阅

有关如何使用此 Operator 的更多信息,请参阅指南: 检索作业

参数:
  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • results_filter (str | None) – (可选) 用于指定结果子集的过滤器。

  • page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数量。

  • job_type (str | None) – (可选) 作业类型。

  • order_by (str | None) – (可选) 可选的逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'gcp_conn_id', 'impersonation_chain')[source]
project_id = None[source]
results_filter = None[source]
page_size = None[source]
job_type = None[source]
order_by = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPListInfoTypesOperator(*, project_id=PROVIDE_PROJECT_ID, language_code=None, results_filter=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

返回 DLP API 支持的敏感信息类型列表。

参阅

有关如何使用此 Operator 的更多信息,请参阅指南: 检索存储的信息类型

参数:
  • language_code (str | None) – (可选) 用于本地化 infoType 友好名称的可选 BCP-47 语言代码。如果省略,或如果本地化字符串不可用,则将返回 en-US 字符串。

  • results_filter (str | None) – (可选) 用于指定结果子集的过滤器。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('language_code', 'gcp_conn_id', 'impersonation_chain')[source]
project_id = None[source]
language_code = None[source]
results_filter = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPListInspectTemplatesOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出 InspectTemplates。

参阅

有关如何使用此 operator 的更多信息,请参阅指南:检索模板

参数:
  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数量。

  • order_by (str | None) – (可选) 可选的逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
organization_id = None[source]
project_id = None[source]
page_size = None[source]
order_by = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPListJobTriggersOperator(*, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, results_filter=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出作业触发器。

参阅

有关如何使用此 operator 的更多信息,请参阅指南:检索作业触发器

参数:
  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数量。

  • order_by (str | None) – (可选) 可选的逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。

  • results_filter (str | None) – (可选) 用于指定结果子集的过滤器。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'gcp_conn_id', 'impersonation_chain')[source]
project_id = None[source]
page_size = None[source]
order_by = None[source]
results_filter = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPListStoredInfoTypesOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出存储信息类型。

参阅

有关如何使用此 operator 的更多信息,请参阅指南:检索存储的信息类型

参数:
  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数量。

  • order_by (str | None) – (可选) 可选的逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]
organization_id = None[source]
project_id = None[source]
page_size = None[source]
order_by = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPRedactImageOperator(*, project_id=PROVIDE_PROJECT_ID, inspect_config=None, image_redaction_configs=None, include_findings=None, byte_item=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

从图像中编辑潜在的敏感信息;限制输入大小、处理时间和输出大小。

参阅

有关如何使用此 operator 的更多信息,请参阅指南:参考

参数:
  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可选)检查器的配置。此处指定的项将覆盖 inspect_template_name 参数引用的模板中设置的配置。

  • image_redaction_configs (None | list[dict] | list[google.cloud.dlp_v2.types.RedactImageRequest.ImageRedactionConfig]) – (可选)用于指定从图像中隐去哪些内容的配置。

  • include_findings (bool | None) – (可选)响应是否应包含查找结果以及隐去的图像。

  • byte_item (dict | google.cloud.dlp_v2.types.ByteContentItem | None) – (可选)内容必须为 PNG、JPEG、SVG 或 BMP 格式。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'inspect_config', 'image_redaction_configs', 'include_findings', 'byte_item',...[source]
project_id = None[source]
inspect_config = None[source]
image_redaction_configs = None[source]
include_findings = None[source]
byte_item = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPReidentifyContentOperator(*, project_id=PROVIDE_PROJECT_ID, reidentify_config=None, inspect_config=None, item=None, inspect_template_name=None, reidentify_template_name=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

重新标识已被去标识化的内容。

参阅

有关如何使用此操作器的更多信息,请参阅指南:重新标识内容

参数:
  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • reidentify_config (dict | google.cloud.dlp_v2.types.DeidentifyConfig | None) – (可选)用于重新标识内容项的配置。

  • inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可选)检查器的配置。

  • item (dict | google.cloud.dlp_v2.types.ContentItem | None) – (可选)要重新标识的项。将视为文本处理。

  • inspect_template_name (str | None) – (可选)要使用的可选模板。直接在 inspect_config 中指定的任何配置将覆盖模板中设置的配置。

  • reidentify_template_name (str | None) – (可选)可选的模板。引用 DeidentifyTemplate 的一个实例。直接在 reidentify_config 或 inspect_config 中指定的任何配置将覆盖模板中设置的配置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('project_id', 'reidentify_config', 'inspect_config', 'item', 'inspect_template_name',...[source]
project_id = None[source]
reidentify_config = None[source]
inspect_config = None[source]
item = None[source]
inspect_template_name = None[source]
reidentify_template_name = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateDeidentifyTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, deidentify_template=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

更新 DeidentifyTemplate。

参阅

有关如何使用此操作器的更多信息,请参阅指南:去标识化模板

参数:
  • template_id (str) – 要更新的去标识化模板的 ID。

  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • deidentify_template (dict | google.cloud.dlp_v2.types.DeidentifyTemplate | None) – 新的 DeidentifyTemplate 值。

  • update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用于控制哪些字段需要更新的掩码。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'deidentify_template', 'update_mask',...[source]
template_id[source]
organization_id = None[source]
project_id = None[source]
deidentify_template = None[source]
update_mask = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateInspectTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, inspect_template=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

更新 InspectTemplate。

参阅

有关如何使用此操作器的更多信息,请参阅指南:更新模板

参数:
  • template_id (str) – 要更新的检查模板的 ID。

  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • inspect_template (dict | google.cloud.dlp_v2.types.InspectTemplate | None) – 新的 InspectTemplate 值。

  • update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用于控制哪些字段需要更新的掩码。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'inspect_template', 'update_mask',...[source]
template_id[source]
organization_id = None[source]
project_id = None[source]
inspect_template = None[source]
update_mask = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateJobTriggerOperator(*, job_trigger_id, project_id=PROVIDE_PROJECT_ID, job_trigger=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

更新作业触发器。

参阅

有关如何使用此操作器的更多信息,请参阅指南:更新作业触发器

参数:
  • job_trigger_id – 要更新的 DLP 作业触发器的 ID。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。

  • job_trigger (dict | google.cloud.dlp_v2.types.JobTrigger | None) – 新的 JobTrigger 值。

  • update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用于控制哪些字段需要更新的掩码。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('job_trigger_id', 'project_id', 'job_trigger', 'update_mask', 'gcp_conn_id', 'impersonation_chain')[source]
job_trigger_id[source]
project_id = None[source]
job_trigger = None[source]
update_mask = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[源代码]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateStoredInfoTypeOperator(*, stored_info_type_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, config=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

通过创建新版本来更新存储信息类型。

参阅

有关如何使用此 operator 的更多信息,请参阅指南:更新存储的信息类型

参数:
  • stored_info_type_id – 要更新的存储信息类型的 ID。

  • organization_id (str | None) – (可选) 组织 ID。如果父资源是组织,则必须设置此字段。

  • project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时设置此字段。

  • config (dict | google.cloud.dlp_v2.types.StoredInfoTypeConfig | None) – 存储信息类型的更新配置。如果未提供,则将使用现有配置创建一个新版本的存储信息类型。

  • update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用于控制哪些字段需要更新的掩码。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定 None,则不重试请求。

  • timeout (float | None) – (可选) 等待请求完成的时间,以秒为单位。请注意,如果指定了 retry,则超时应用于每次尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的附加元数据。

  • gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – (可选) 使用短期凭证模拟的服务帐号,或获取列表中最后一个帐号的 access_token 所需的链式帐号列表,该帐号将在请求中被模拟。如果设置为字符串,则该帐号必须授予发起帐号 Service Account Token Creator IAM 角色。如果设置为序列,则列表中身份必须授予其直接前一个身份 Service Account Token Creator IAM 角色,列表中第一个帐号授予发起帐号此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('stored_info_type_id', 'organization_id', 'project_id', 'config', 'update_mask', 'gcp_conn_id',...[源代码]
stored_info_type_id[源代码]
organization_id = None[源代码]
project_id = None[源代码]
config = None[源代码]
update_mask = None[源代码]
retry[源代码]
timeout = None[源代码]
metadata = ()[源代码]
gcp_conn_id = 'google_cloud_default'[源代码]
impersonation_chain = None[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

请参阅 get_template_context 获取更多上下文信息。

此条目是否有帮助?