airflow.providers.google.cloud.operators.automl

此模块包含 Google AutoML operators。

属性

MetaData

AutoMLTrainModelOperator

创建 Google Cloud AutoML 模型。

AutoMLPredictOperator

在 Google Cloud AutoML 上运行预测操作。

AutoMLCreateDatasetOperator

创建 Google Cloud AutoML 数据集。

AutoMLImportDataOperator

将数据导入 Google Cloud AutoML 数据集。

AutoMLTablesListColumnSpecsOperator

列出表中的列规范。

AutoMLTablesUpdateDatasetOperator

更新数据集。

AutoMLGetModelOperator

获取 Google Cloud AutoML 模型。

AutoMLDeleteModelOperator

删除 Google Cloud AutoML 模型。

AutoMLDeployModelOperator

部署模型;如果模型已部署,则使用相同参数部署不会产生影响。

AutoMLTablesListTableSpecsOperator

列出数据集中的表规范。

AutoMLListDatasetOperator

列出项目中的 AutoML 数据集。

AutoMLDeleteDatasetOperator

删除数据集及其所有内容。

模块内容

airflow.providers.google.cloud.operators.automl.MetaData[source]
class airflow.providers.google.cloud.operators.automl.AutoMLTrainModelOperator(*, model, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

创建 Google Cloud AutoML 模型。

另请参阅

有关如何使用此 operator 的更多信息,请参阅指南: 模型操作

参数
  • model (dict) – 模型定义。

  • project_id (str) – 将创建模型的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。

  • location (str) – 项目位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('model', 'location', 'project_id', 'impersonation_chain')[source]
model[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLPredictOperator(*, model_id=None, endpoint_id=None, location, payload, operation_params=None, instances=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

在 Google Cloud AutoML 上运行预测操作。

警告

用于文本、图像和视频预测的 AutoMLPredictOperator 已被弃用。请改用 endpoint_id 参数而不是 model_id 参数。

另请参阅

有关如何使用此 operator 的更多信息,请参阅指南: 进行预测

参数
  • model_id (str | None) – 请求用于批量预测的模型名称。

  • endpoint_id (str | None) – 用于预测的 endpoint 名称。

  • payload (dict) – 用于预测的模型名称。

  • project_id (str) – 模型所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。

  • location (str) – 项目位置。

  • operation_params (dict[str, str] | None) – 用于预测的附加领域特定参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]
model_id = None[source]
endpoint_id = None[source]
operation_params = None[source]
instances = None[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
payload[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
property hook: airflow.providers.google.cloud.hooks.automl.CloudAutoMLHook | airflow.providers.google.cloud.hooks.vertex_ai.prediction_service.PredictionServiceHook[source]
property model: google.cloud.automl_v1beta1.Model | None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLCreateDatasetOperator(*, dataset, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

创建 Google Cloud AutoML 数据集。

用于表格、视频智能、视觉和自然语言的 AutoMLCreateDatasetOperator 已被弃用且不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.CreateDatasetOperatorairflow.providers.google.cloud.operators.translate.TranslateCreateDatasetOperator

另请参阅

有关如何使用此 operator 的更多信息,请参阅指南: 创建数据集

参数
  • dataset (dict) – 要创建的数据集。如果提供 dict,则其形式必须与 protobuf 消息 Dataset 相同。

  • project_id (str) – 数据集所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。

  • location (str) – 项目位置。

  • params – 用于预测的附加领域特定参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset', 'location', 'project_id', 'impersonation_chain')[source]
dataset[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLImportDataOperator(*, dataset_id, location, input_config, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

将数据导入 Google Cloud AutoML 数据集。

警告

AutoMLImportDataOperator 用于表格、视频智能、视觉和自然语言的功能已弃用且不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.ImportDataOperator

另请参阅

有关如何使用此 Operator 的更多信息,请参阅指南:创建数据集

参数
  • dataset_id (str) – 要更新的数据集的 ID。

  • input_config (dict) – 期望的输入位置及其领域特定的语义(如果有)。如果提供字典,则其形式必须与 protobuf 消息 InputConfig 相同。

  • project_id (str) – 数据集所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。

  • location (str) – 项目位置。

  • params – 用于预测的附加领域特定参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset_id', 'input_config', 'location', 'project_id', 'impersonation_chain')[source]
dataset_id[source]
input_config[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLTablesListColumnSpecsOperator(*, dataset_id, table_spec_id, location, field_mask=None, filter_=None, page_size=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出表中的列规范。

警告

Operator AutoMLTablesListColumnSpecsOperator 已因 AutoML Tables 旧版本于 2024 年 3 月 31 日关停而弃用。更多信息请参阅:https://cloud.google.com/automl-tables/docs/deprecations

另请参阅

有关如何使用此 Operator 的更多信息,请参阅指南:列出表和列规范

参数
  • dataset_id (str) – 数据集的名称。

  • table_spec_id (str) – 用于路径构建器的 table_spec_id。

  • field_mask (dict | None) – 指定要读取哪些字段的掩码。如果提供字典,其形式必须与 protobuf 消息 google.cloud.automl_v1beta1.types.FieldMask 相同

  • filter – 过滤表达式,请参阅 go/filtering。

  • page_size (int | None) – 底层 API 响应中包含的最大资源数。如果按资源执行页面流式传输,此参数不影响返回值。如果按页面执行页面流式传输,此参数确定页面中的最大资源数。

  • project_id (str) – 数据集所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。

  • location (str) – 项目位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset_id', 'table_spec_id', 'field_mask', 'filter_', 'location', 'project_id', 'impersonation_chain')[source]
dataset_id[source]
table_spec_id[source]
field_mask = None[source]
filter_ = None[source]
page_size = None[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLTablesUpdateDatasetOperator(*, dataset, location, update_mask=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

更新数据集。

警告

Operator AutoMLTablesUpdateDatasetOperator 已因 AutoML Tables 旧版本于 2024 年 3 月 31 日关停而弃用。更多信息请参阅:https://cloud.google.com/automl-tables/docs/deprecations。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.UpdateDatasetOperator

另请参阅

有关如何使用此 Operator 的更多信息,请参阅指南:创建数据集

参数
  • dataset (dict) – 在服务器上替换资源的那个数据集。如果提供字典,其形式必须与 protobuf 消息 Dataset 相同。

  • update_mask (dict | None) – 应用于资源的更新掩码。如果提供字典,其形式必须与 protobuf 消息 FieldMask 相同。

  • location (str) – 项目位置。

  • params – 用于预测的附加领域特定参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset', 'update_mask', 'location', 'impersonation_chain')[source]
dataset[source]
update_mask = None[source]
location[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLGetModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

获取 Google Cloud AutoML 模型。

警告

AutoMLGetModelOperator 用于表格、视频智能、视觉和自然语言的功能已弃用且不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.model_service.GetModelOperator

另请参阅

有关如何使用此 Operator 的更多信息,请参阅指南:模型操作

参数
  • model_id (str) – 请求用于提供预测的模型的名称。

  • project_id (str) – 模型所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。

  • location (str) – 项目位置。

  • params – 用于预测的附加领域特定参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]
model_id[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLDeleteModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

删除 Google Cloud AutoML 模型。

警告

AutoMLDeleteModelOperator 适用于表格、视频智能、视觉和自然语言的功能已被弃用且不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.model_service.DeleteModelOperator

另请参阅

有关如何使用此 Operator 的更多信息,请参阅指南:模型上的操作

参数
  • model_id (str) – 请求用于提供预测的模型的名称。

  • project_id (str) – 模型所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。

  • location (str) – 项目位置。

  • params – 用于预测的附加领域特定参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]
model_id[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLDeployModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, image_detection_metadata=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

部署模型;如果模型已部署,则使用相同参数部署不会产生影响。

使用不同的参数(例如更改 node_number)进行部署将重置部署状态,而不会中断 model_id 的可用性。

仅适用于文本分类、图像对象检测和表格;所有其他领域都会自动管理部署。

警告

由于旧版 AutoML Natural Language、Vision、Video Intelligence 已于 2024 年 3 月 31 日关闭,AutoMLDeployModelOperator Operator 已被弃用。更多信息请参阅:https://cloud.google.com/vision/automl/docs/deprecations。请改用 airflow.providers.google.cloud.operators.vertex_ai.endpoint_service.DeployModelOperator

另请参阅

有关如何使用此 Operator 的更多信息,请参阅指南:模型上的操作

参数
  • model_id (str) – 要部署的模型名称。

  • image_detection_metadata (dict | None) – 图像对象检测特有的模型部署元数据。如果提供的是 dict,则其形式必须与 protobuf 消息 ImageObjectDetectionModelDeploymentMetadata 相同

  • project_id (str) – 模型所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。

  • location (str) – 项目位置。

  • params – 用于预测的附加领域特定参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]
model_id[source]
image_detection_metadata = None[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLTablesListTableSpecsOperator(*, dataset_id, location, page_size=None, filter_=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出数据集中的表规范。

警告

由于旧版 AutoML Tables 已于 2024 年 3 月 31 日关闭,AutoMLTablesListTableSpecsOperator Operator 已被弃用。更多信息请参阅:https://cloud.google.com/automl-tables/docs/deprecations

另请参阅

有关如何使用此 Operator 的更多信息,请参阅指南:列出表格和列规范

参数
  • dataset_id (str) – 数据集的名称。

  • filter – 过滤表达式,请参阅 go/filtering。

  • page_size (int | None) – 基础 API 响应中包含的最大资源数。如果按资源进行页面流式传输,此参数不会影响返回值。如果按页面进行页面流式传输,此参数决定了页面中的最大资源数。

  • project_id (str) – Google Cloud 项目的 ID,数据集位于此项目中。如果为 None,则使用默认的 project_id。

  • location (str) – 项目位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset_id', 'filter_', 'location', 'project_id', 'impersonation_chain')[source]
dataset_id[source]
filter_ = None[source]
page_size = None[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLListDatasetOperator(*, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出项目中的 AutoML 数据集。

警告

AutoMLListDatasetOperator 适用于表格、视频智能、视觉和自然语言的功能已被弃用且不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.ListDatasetsOperator

另请参阅

有关如何使用此 Operator 的更多信息,请参阅指南:列出和删除数据集

参数
  • project_id (str) – Google Cloud 项目的 ID,数据集位于此项目中。如果为 None,则使用默认的 project_id。

  • location (str) – 项目位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('location', 'project_id', 'impersonation_chain')[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLDeleteDatasetOperator(*, dataset_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

删除数据集及其所有内容。

AutoMLDeleteDatasetOperator(用于表格、视频智能、视觉和自然语言)已弃用且不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.DeleteDatasetOperator

另请参阅

有关如何使用此 Operator 的更多信息,请参阅指南:列出和删除数据集

参数
  • dataset_id (str | list[str]) – 要删除的数据集 ID 的名称、数据集 ID 列表或以逗号分隔的数据集 ID 字符串。

  • project_id (str) – 数据集所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。

  • location (str) – 项目位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。

  • timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。

  • metadata (MetaData) – 提供给方法的附加元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset_id', 'location', 'project_id', 'impersonation_chain')[source]
dataset_id[source]
location[source]
project_id = None[source]
metadata = ()[source]
timeout = None[source]
retry[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

创建 operator 时派生。

上下文与渲染 Jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

此条目是否有帮助?