airflow.providers.google.cloud.operators.automl
¶
此模块包含 Google AutoML 操作符。
模块内容¶
类¶
创建 Google Cloud AutoML 模型。 |
|
在 Google Cloud AutoML 上运行预测操作。 |
|
在 Google Cloud AutoML 上执行批量预测。 |
|
创建 Google Cloud AutoML 数据集。 |
|
将数据导入 Google Cloud AutoML 数据集。 |
|
列出表中列的规范。 |
|
更新数据集。 |
|
获取 Google Cloud AutoML 模型。 |
|
删除 Google Cloud AutoML 模型。 |
|
部署模型;如果模型已部署,则使用相同参数部署它不会产生任何影响。 |
|
列出数据集中的表规范。 |
|
列出项目中的 AutoML 数据集。 |
|
删除数据集及其所有内容。 |
属性¶
- class airflow.providers.google.cloud.operators.automl.AutoMLTrainModelOperator(*, model, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建 Google Cloud AutoML 模型。
警告
用于表格、视频智能、视觉和自然语言的 AutoMLTrainModelOperator 已被弃用,不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.auto_ml.CreateAutoMLTabularTrainingJobOperator
、airflow.providers.google.cloud.operators.vertex_ai.auto_ml.CreateAutoMLVideoTrainingJobOperator
、airflow.providers.google.cloud.operators.vertex_ai.auto_ml.CreateAutoMLImageTrainingJobOperator
、airflow.providers.google.cloud.operators.vertex_ai.generative_model.SupervisedFineTuningTrainOperator
。另请参阅
有关如何使用此操作符的更多信息,请查看指南: 模型操作
- 参数
model (dict) – 模型定义。
project_id (str) – 要在其中创建模型的 Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- class airflow.providers.google.cloud.operators.automl.AutoMLPredictOperator(*, model_id=None, endpoint_id=None, location, payload, operation_params=None, instances=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
在 Google Cloud AutoML 上运行预测操作。
警告
用于文本、图像和视频预测的 AutoMLPredictOperator 已被弃用。请使用 endpoint_id 参数代替 model_id 参数。
另请参阅
有关如何使用此运算符的更多信息,请参阅指南: 进行预测
- 参数
model_id (str | None) – 请求用于批量预测的模型名称。
endpoint_id (str | None) – 用于预测的端点名称。
payload (dict) – 用于预测的模型名称。
project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
operation_params (dict[str, str] | None) – 用于预测的其他特定于域的参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLBatchPredictOperator(*, model_id, input_config, output_config, location, project_id=PROVIDE_PROJECT_ID, prediction_params=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
在 Google Cloud AutoML 上执行批量预测。
警告
用于表格、视频智能、视觉和自然语言的 AutoMLBatchPredictOperator 已被弃用,不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.batch_prediction_job.CreateBatchPredictionJobOperator
、airflow.providers.google.cloud.operators.vertex_ai.batch_prediction_job.GetBatchPredictionJobOperator
、airflow.providers.google.cloud.operators.vertex_ai.batch_prediction_job.ListBatchPredictionJobsOperator
、airflow.providers.google.cloud.operators.vertex_ai.batch_prediction_job.DeleteBatchPredictionJobOperator
。另请参阅
有关如何使用此运算符的更多信息,请参阅指南: 进行预测
- 参数
project_id (str) – 要在其中创建模型的 Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
model_id (str) – 请求用于批量预测的 model_id 名称。
input_config (dict) – 必需。批量预测的输入配置。如果提供了一个字典,则它必须与 protobuf 消息 google.cloud.automl_v1beta1.types.BatchPredictInputConfig 的形式相同
output_config (dict) – 必需。指定应在何处写入输出预测的配置。如果提供了一个字典,则它必须与 protobuf 消息 google.cloud.automl_v1beta1.types.BatchPredictOutputConfig 的形式相同
prediction_params (dict[str, str] | None) – 用于预测的其他特定于域的参数,任何字符串的长度都必须不超过 25000 个字符。
project_id – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location – 项目的位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('model_id', 'input_config', 'output_config', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLCreateDatasetOperator(*, dataset, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建 Google Cloud AutoML 数据集。
用于表格、视频智能、视觉和自然语言的 AutoMLCreateDatasetOperator 已被弃用,不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.CreateDatasetOperator
。另请参阅
有关如何使用此运算符的更多信息,请查看指南:创建数据集
- 参数
dataset (dict) – 要创建的数据集。如果提供一个字典,它的形式必须与 protobuf 消息 Dataset 相同。
project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
params – 预测的其他特定于域的参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset', 'location', 'project_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLImportDataOperator(*, dataset_id, location, input_config, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
将数据导入 Google Cloud AutoML 数据集。
警告
用于表格、视频智能、视觉和自然语言的 AutoMLImportDataOperator 已被弃用,不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.ImportDataOperator
。另请参阅
有关如何使用此运算符的更多信息,请查看指南:创建数据集
- 参数
dataset_id (str) – 要更新的数据集的 ID。
input_config (dict) – 所需的输入位置及其特定于域的语义(如果有)。如果提供一个字典,它的形式必须与 protobuf 消息 InputConfig 相同。
project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
params – 预测的其他特定于域的参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset_id', 'input_config', 'location', 'project_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLTablesListColumnSpecsOperator(*, dataset_id, table_spec_id, location, field_mask=None, filter_=None, page_size=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出表中列的规范。
警告
由于 AutoML Tables 的旧版本已于 2024 年 3 月 31 日关闭,Operator AutoMLTablesListColumnSpecsOperator 已被弃用。有关其他信息,请参阅:https://cloud.google.com/automl-tables/docs/deprecations。
另请参阅
有关如何使用此操作符的更多信息,请查看以下指南:列出表和列的规范
- 参数
dataset_id (str) – 数据集的名称。
table_spec_id (str) – 用于路径构建器的 table_spec_id。
field_mask (dict | None) – 指定要读取的字段的掩码。如果提供了字典,则其格式必须与 protobuf 消息 google.cloud.automl_v1beta1.types.FieldMask 的格式相同
filter – 筛选表达式,请参阅 go/filtering。
page_size (int | None) – 底层 API 响应中包含的最大资源数。如果按资源执行页面流式传输,则此参数不会影响返回值。如果按页执行页面流式传输,则此参数确定页面中的最大资源数。
project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset_id', 'table_spec_id', 'field_mask', 'filter_', 'location', 'project_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLTablesUpdateDatasetOperator(*, dataset, location, update_mask=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
更新数据集。
警告
由于 AutoML Tables 的旧版本已于 2024 年 3 月 31 日关闭,Operator AutoMLTablesUpdateDatasetOperator 已被弃用。有关其他信息,请参阅:https://cloud.google.com/automl-tables/docs/deprecations。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.UpdateDatasetOperator
。另请参阅
有关如何使用此操作符的更多信息,请查看以下指南:创建数据集
- 参数
dataset (dict) – 替换服务器上资源的 数据集。如果提供了字典,则其格式必须与 protobuf 消息 Dataset 的格式相同。
update_mask (dict | None) – 更新掩码应用于资源。如果提供了字典,则其格式必须与 protobuf 消息 FieldMask 的格式相同。
location (str) – 项目的位置。
params – 预测的其他特定于域的参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset', 'update_mask', 'location', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLGetModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取 Google Cloud AutoML 模型。
警告
用于表格、视频智能、视觉和自然语言的 AutoMLGetModelOperator 已被弃用,不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.model_service.GetModelOperator
。另请参阅
关于如何使用此运算符的更多信息,请查看指南:模型操作
- 参数
model_id (str) – 请求用于提供预测服务的模型名称。
project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
params – 预测的其他特定于域的参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLDeleteModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除 Google Cloud AutoML 模型。
警告
用于表格、视频智能、视觉和自然语言的 AutoMLDeleteModelOperator 已被弃用,不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.model_service.DeleteModelOperator
。另请参阅
关于如何使用此运算符的更多信息,请查看指南:模型操作
- 参数
model_id (str) – 请求用于提供预测服务的模型名称。
project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
params – 预测的其他特定于域的参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLDeployModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, image_detection_metadata=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
部署模型;如果模型已部署,则使用相同参数部署它不会产生任何影响。
使用不同参数进行部署(例如更改 node_number)将重置部署状态,而不会暂停 model_id 的可用性。
仅适用于文本分类、图像对象检测和表格;所有其他域都会自动管理部署。
警告
由于旧版本的 AutoML 自然语言、视觉、视频智能于 2024 年 3 月 31 日关闭,因此运算符 AutoMLDeployModelOperator 已被弃用。有关更多信息,请参阅:https://cloud.google.com/vision/automl/docs/deprecations 。请改用
airflow.providers.google.cloud.operators.vertex_ai.endpoint_service.DeployModelOperator
。另请参阅
关于如何使用此运算符的更多信息,请查看指南:模型操作
- 参数
model_id (str) – 要部署的模型的名称。
image_detection_metadata (dict | None) – 图像对象检测特有的模型部署元数据。如果提供了 dict,则其格式必须与 protobuf 消息 ImageObjectDetectionModelDeploymentMetadata 相同
project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
params – 预测的其他特定于域的参数。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLTablesListTableSpecsOperator(*, dataset_id, location, page_size=None, filter_=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出数据集中的表规范。
警告
由于旧版 AutoML Tables 已于 2024 年 3 月 31 日关闭,Operator AutoMLTablesListTableSpecsOperator 已被弃用。有关更多信息,请参阅:https://cloud.google.com/automl-tables/docs/deprecations。
另请参阅
有关如何使用此运算符的更多信息,请查看以下指南:列出表格和列规范
- 参数
dataset_id (str) – 数据集的名称。
filter – 筛选表达式,请参阅 go/filtering。
page_size (int | None) – 底层 API 响应中包含的最大资源数量。如果按资源执行页面流式传输,则此参数不会影响返回值。如果按页面执行页面流式传输,则此参数确定页面中的最大资源数量。
project_id (str) – Google Cloud 项目的 ID。如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset_id', 'filter_', 'location', 'project_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLListDatasetOperator(*, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出项目中的 AutoML 数据集。
警告
用于表格、视频智能、视觉和自然语言的 AutoMLListDatasetOperator 已被弃用,不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.ListDatasetsOperator
。另请参阅
有关如何使用此运算符的更多信息,请查看以下指南:列出和删除数据集
- 参数
project_id (str) – Google Cloud 项目的 ID,其中包含数据集。如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('location', 'project_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.automl.AutoMLDeleteDatasetOperator(*, dataset_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除数据集及其所有内容。
用于表格、视频智能、视觉和自然语言的 AutoMLDeleteDatasetOperator 已被弃用,不再可用。请改用
airflow.providers.google.cloud.operators.vertex_ai.dataset.DeleteDatasetOperator
。另请参阅
有关如何使用此运算符的更多信息,请查看以下指南:列出和删除数据集
- 参数
dataset_id (str | list[str]) – 要删除的数据集名称、数据集名称列表或以逗号分隔的数据集名称字符串。
project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。
location (str) – 项目的位置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。
timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。
metadata (MetaData) – 提供给方法的其他元数据。
gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('dataset_id', 'location', 'project_id', 'impersonation_chain')[源代码]¶