airflow.providers.google.cloud.operators.automl¶
此模块包含 Google AutoML operators。
属性¶
类¶
创建 Google Cloud AutoML 模型。 |
|
在 Google Cloud AutoML 上运行预测操作。 |
|
创建 Google Cloud AutoML 数据集。 |
|
将数据导入 Google Cloud AutoML 数据集。 |
|
列出表中的列规范。 |
|
更新数据集。 |
|
获取 Google Cloud AutoML 模型。 |
|
删除 Google Cloud AutoML 模型。 |
|
部署模型;如果模型已部署,则使用相同参数部署不会产生影响。 |
|
列出数据集中的表规范。 |
|
列出项目中的 AutoML 数据集。 |
|
删除数据集及其所有内容。 |
模块内容¶
- class airflow.providers.google.cloud.operators.automl.AutoMLTrainModelOperator(*, model, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建 Google Cloud AutoML 模型。
警告
用于表格、视频智能、视觉和自然语言的 AutoMLTrainModelOperator 已被弃用且不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.auto_ml.CreateAutoMLTabularTrainingJobOperator
、airflow.providers.google.cloud.operators.vertex_ai.auto_ml.CreateAutoMLVideoTrainingJobOperator
、airflow.providers.google.cloud.operators.vertex_ai.auto_ml.CreateAutoMLImageTrainingJobOperator
、airflow.providers.google.cloud.operators.vertex_ai.generative_model.SupervisedFineTuningTrainOperator
、airflow.providers.google.cloud.operators.translate.TranslateCreateModelOperator
。另请参阅
有关如何使用此 operator 的更多信息,请参阅指南: 模型操作
- 参数:
model (dict) – 模型定义。
project_id (str) – 将创建模型的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。
location (str) – 项目位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('model', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLPredictOperator(*, model_id=None, endpoint_id=None, location, payload, operation_params=None, instances=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
在 Google Cloud AutoML 上运行预测操作。
警告
用于文本、图像和视频预测的 AutoMLPredictOperator 已被弃用。请改用 endpoint_id 参数而不是 model_id 参数。
另请参阅
有关如何使用此 operator 的更多信息,请参阅指南: 进行预测
- 参数:
model_id (str | None) – 请求用于批量预测的模型名称。
endpoint_id (str | None) – 用于预测的 endpoint 名称。
payload (dict) – 用于预测的模型名称。
project_id (str) – 模型所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。
location (str) – 项目位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLCreateDatasetOperator(*, dataset, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建 Google Cloud AutoML 数据集。
用于表格、视频智能、视觉和自然语言的 AutoMLCreateDatasetOperator 已被弃用且不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.CreateDatasetOperator
、airflow.providers.google.cloud.operators.translate.TranslateCreateDatasetOperator
。另请参阅
有关如何使用此 operator 的更多信息,请参阅指南: 创建数据集
- 参数:
dataset (dict) – 要创建的数据集。如果提供 dict,则其形式必须与 protobuf 消息 Dataset 相同。
project_id (str) – 数据集所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。
location (str) – 项目位置。
params – 用于预测的附加领域特定参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLImportDataOperator(*, dataset_id, location, input_config, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
将数据导入 Google Cloud AutoML 数据集。
警告
AutoMLImportDataOperator 用于表格、视频智能、视觉和自然语言的功能已弃用且不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.ImportDataOperator
。另请参阅
有关如何使用此 Operator 的更多信息,请参阅指南:创建数据集
- 参数:
dataset_id (str) – 要更新的数据集的 ID。
input_config (dict) – 期望的输入位置及其领域特定的语义(如果有)。如果提供字典,则其形式必须与 protobuf 消息 InputConfig 相同。
project_id (str) – 数据集所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。
location (str) – 项目位置。
params – 用于预测的附加领域特定参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset_id', 'input_config', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLTablesListColumnSpecsOperator(*, dataset_id, table_spec_id, location, field_mask=None, filter_=None, page_size=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出表中的列规范。
警告
Operator AutoMLTablesListColumnSpecsOperator 已因 AutoML Tables 旧版本于 2024 年 3 月 31 日关停而弃用。更多信息请参阅:https://cloud.google.com/automl-tables/docs/deprecations。
另请参阅
有关如何使用此 Operator 的更多信息,请参阅指南:列出表和列规范
- 参数:
dataset_id (str) – 数据集的名称。
table_spec_id (str) – 用于路径构建器的 table_spec_id。
field_mask (dict | None) – 指定要读取哪些字段的掩码。如果提供字典,其形式必须与 protobuf 消息 google.cloud.automl_v1beta1.types.FieldMask 相同
filter – 过滤表达式,请参阅 go/filtering。
page_size (int | None) – 底层 API 响应中包含的最大资源数。如果按资源执行页面流式传输,此参数不影响返回值。如果按页面执行页面流式传输,此参数确定页面中的最大资源数。
project_id (str) – 数据集所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。
location (str) – 项目位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset_id', 'table_spec_id', 'field_mask', 'filter_', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLTablesUpdateDatasetOperator(*, dataset, location, update_mask=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
更新数据集。
警告
Operator AutoMLTablesUpdateDatasetOperator 已因 AutoML Tables 旧版本于 2024 年 3 月 31 日关停而弃用。更多信息请参阅:https://cloud.google.com/automl-tables/docs/deprecations。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.UpdateDatasetOperator
。另请参阅
有关如何使用此 Operator 的更多信息,请参阅指南:创建数据集
- 参数:
dataset (dict) – 在服务器上替换资源的那个数据集。如果提供字典,其形式必须与 protobuf 消息 Dataset 相同。
update_mask (dict | None) – 应用于资源的更新掩码。如果提供字典,其形式必须与 protobuf 消息 FieldMask 相同。
location (str) – 项目位置。
params – 用于预测的附加领域特定参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset', 'update_mask', 'location', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLGetModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取 Google Cloud AutoML 模型。
警告
AutoMLGetModelOperator 用于表格、视频智能、视觉和自然语言的功能已弃用且不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.model_service.GetModelOperator
。另请参阅
有关如何使用此 Operator 的更多信息,请参阅指南:模型操作
- 参数:
model_id (str) – 请求用于提供预测的模型的名称。
project_id (str) – 模型所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。
location (str) – 项目位置。
params – 用于预测的附加领域特定参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLDeleteModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除 Google Cloud AutoML 模型。
警告
AutoMLDeleteModelOperator 适用于表格、视频智能、视觉和自然语言的功能已被弃用且不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.model_service.DeleteModelOperator
。另请参阅
有关如何使用此 Operator 的更多信息,请参阅指南:模型上的操作
- 参数:
model_id (str) – 请求用于提供预测的模型的名称。
project_id (str) – 模型所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。
location (str) – 项目位置。
params – 用于预测的附加领域特定参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLDeployModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, image_detection_metadata=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
部署模型;如果模型已部署,则使用相同参数部署不会产生影响。
使用不同的参数(例如更改 node_number)进行部署将重置部署状态,而不会中断 model_id 的可用性。
仅适用于文本分类、图像对象检测和表格;所有其他领域都会自动管理部署。
警告
由于旧版 AutoML Natural Language、Vision、Video Intelligence 已于 2024 年 3 月 31 日关闭,AutoMLDeployModelOperator Operator 已被弃用。更多信息请参阅:https://cloud.google.com/vision/automl/docs/deprecations。请改用
airflow.providers.google.cloud.operators.vertex_ai.endpoint_service.DeployModelOperator
。另请参阅
有关如何使用此 Operator 的更多信息,请参阅指南:模型上的操作
- 参数:
model_id (str) – 要部署的模型名称。
image_detection_metadata (dict | None) – 图像对象检测特有的模型部署元数据。如果提供的是 dict,则其形式必须与 protobuf 消息 ImageObjectDetectionModelDeploymentMetadata 相同
project_id (str) – 模型所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。
location (str) – 项目位置。
params – 用于预测的附加领域特定参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLTablesListTableSpecsOperator(*, dataset_id, location, page_size=None, filter_=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出数据集中的表规范。
警告
由于旧版 AutoML Tables 已于 2024 年 3 月 31 日关闭,AutoMLTablesListTableSpecsOperator Operator 已被弃用。更多信息请参阅:https://cloud.google.com/automl-tables/docs/deprecations。
另请参阅
有关如何使用此 Operator 的更多信息,请参阅指南:列出表格和列规范
- 参数:
dataset_id (str) – 数据集的名称。
filter – 过滤表达式,请参阅 go/filtering。
page_size (int | None) – 基础 API 响应中包含的最大资源数。如果按资源进行页面流式传输,此参数不会影响返回值。如果按页面进行页面流式传输,此参数决定了页面中的最大资源数。
project_id (str) – Google Cloud 项目的 ID,数据集位于此项目中。如果为 None,则使用默认的 project_id。
location (str) – 项目位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset_id', 'filter_', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLListDatasetOperator(*, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出项目中的 AutoML 数据集。
警告
AutoMLListDatasetOperator 适用于表格、视频智能、视觉和自然语言的功能已被弃用且不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.ListDatasetsOperator
。另请参阅
有关如何使用此 Operator 的更多信息,请参阅指南:列出和删除数据集
- 参数:
project_id (str) – Google Cloud 项目的 ID,数据集位于此项目中。如果为 None,则使用默认的 project_id。
location (str) – 项目位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLDeleteDatasetOperator(*, dataset_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除数据集及其所有内容。
AutoMLDeleteDatasetOperator(用于表格、视频智能、视觉和自然语言)已弃用且不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.DeleteDatasetOperator
。另请参阅
有关如何使用此 Operator 的更多信息,请参阅指南:列出和删除数据集
- 参数:
dataset_id (str | list[str]) – 要删除的数据集 ID 的名称、数据集 ID 列表或以逗号分隔的数据集 ID 字符串。
project_id (str) – 数据集所在的 Google Cloud 项目 ID,如果为 None,则使用默认 project_id。
location (str) – 项目位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不重试请求。
timeout (float | None) – 等待请求完成的时间(秒)。请注意,如果指定了 retry,则超时应用于每次单独尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号,用于使用短期凭据模拟,或用于获取列表中最后一个帐号的 access_token 的帐号链列表,该帐号链将在请求中被模拟。如果设置为字符串,则原始帐号必须授予该帐号“服务帐号令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须向直接前一个身份授予“服务帐号令牌创建者”IAM 角色,列表中的第一个帐号将此角色授予原始帐号(模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset_id', 'location', 'project_id', 'impersonation_chain')[source]¶