airflow.providers.google.cloud.operators.automl

此模块包含 Google AutoML 操作符。

模块内容

AutoMLTrainModelOperator

创建 Google Cloud AutoML 模型。

AutoMLPredictOperator

在 Google Cloud AutoML 上运行预测操作。

AutoMLBatchPredictOperator

在 Google Cloud AutoML 上执行批量预测。

AutoMLCreateDatasetOperator

创建 Google Cloud AutoML 数据集。

AutoMLImportDataOperator

将数据导入 Google Cloud AutoML 数据集。

AutoMLTablesListColumnSpecsOperator

列出表中列的规范。

AutoMLTablesUpdateDatasetOperator

更新数据集。

AutoMLGetModelOperator

获取 Google Cloud AutoML 模型。

AutoMLDeleteModelOperator

删除 Google Cloud AutoML 模型。

AutoMLDeployModelOperator

部署模型;如果模型已部署,则使用相同参数部署它不会产生任何影响。

AutoMLTablesListTableSpecsOperator

列出数据集中的表规范。

AutoMLListDatasetOperator

列出项目中的 AutoML 数据集。

AutoMLDeleteDatasetOperator

删除数据集及其所有内容。

属性

MetaData

airflow.providers.google.cloud.operators.automl.MetaData[源代码]
class airflow.providers.google.cloud.operators.automl.AutoMLTrainModelOperator(*, model, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

创建 Google Cloud AutoML 模型。

另请参阅

有关如何使用此操作符的更多信息,请查看指南: 模型操作

参数
  • model (dict) – 模型定义。

  • project_id (str) – 要在其中创建模型的 Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('model', 'location', 'project_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLPredictOperator(*, model_id=None, endpoint_id=None, location, payload, operation_params=None, instances=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

在 Google Cloud AutoML 上运行预测操作。

警告

用于文本、图像和视频预测的 AutoMLPredictOperator 已被弃用。请使用 endpoint_id 参数代替 model_id 参数。

另请参阅

有关如何使用此运算符的更多信息,请参阅指南: 进行预测

参数
  • model_id (str | None) – 请求用于批量预测的模型名称。

  • endpoint_id (str | None) – 用于预测的端点名称。

  • payload (dict) – 用于预测的模型名称。

  • project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • operation_params (dict[str, str] | None) – 用于预测的其他特定于域的参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[source]
hook()[source]
model()[source]
execute(context)[source]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLBatchPredictOperator(*, model_id, input_config, output_config, location, project_id=PROVIDE_PROJECT_ID, prediction_params=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

在 Google Cloud AutoML 上执行批量预测。

另请参阅

有关如何使用此运算符的更多信息,请参阅指南: 进行预测

参数
  • project_id (str) – 要在其中创建模型的 Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • model_id (str) – 请求用于批量预测的 model_id 名称。

  • input_config (dict) – 必需。批量预测的输入配置。如果提供了一个字典,则它必须与 protobuf 消息 google.cloud.automl_v1beta1.types.BatchPredictInputConfig 的形式相同

  • output_config (dict) – 必需。指定应在何处写入输出预测的配置。如果提供了一个字典,则它必须与 protobuf 消息 google.cloud.automl_v1beta1.types.BatchPredictOutputConfig 的形式相同

  • prediction_params (dict[str, str] | None) – 用于预测的其他特定于域的参数,任何字符串的长度都必须不超过 25000 个字符。

  • project_id – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location – 项目的位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('model_id', 'input_config', 'output_config', 'location', 'project_id', 'impersonation_chain')[source]
hook()[源代码]
model()[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLCreateDatasetOperator(*, dataset, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

创建 Google Cloud AutoML 数据集。

用于表格、视频智能、视觉和自然语言的 AutoMLCreateDatasetOperator 已被弃用,不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.CreateDatasetOperator

另请参阅

有关如何使用此运算符的更多信息,请查看指南:创建数据集

参数
  • dataset (dict) – 要创建的数据集。如果提供一个字典,它的形式必须与 protobuf 消息 Dataset 相同。

  • project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • params – 预测的其他特定于域的参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset', 'location', 'project_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLImportDataOperator(*, dataset_id, location, input_config, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

将数据导入 Google Cloud AutoML 数据集。

警告

用于表格、视频智能、视觉和自然语言的 AutoMLImportDataOperator 已被弃用,不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.ImportDataOperator

另请参阅

有关如何使用此运算符的更多信息,请查看指南:创建数据集

参数
  • dataset_id (str) – 要更新的数据集的 ID。

  • input_config (dict) – 所需的输入位置及其特定于域的语义(如果有)。如果提供一个字典,它的形式必须与 protobuf 消息 InputConfig 相同。

  • project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • params – 预测的其他特定于域的参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset_id', 'input_config', 'location', 'project_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLTablesListColumnSpecsOperator(*, dataset_id, table_spec_id, location, field_mask=None, filter_=None, page_size=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出表中列的规范。

警告

由于 AutoML Tables 的旧版本已于 2024 年 3 月 31 日关闭,Operator AutoMLTablesListColumnSpecsOperator 已被弃用。有关其他信息,请参阅:https://cloud.google.com/automl-tables/docs/deprecations

另请参阅

有关如何使用此操作符的更多信息,请查看以下指南:列出表和列的规范

参数
  • dataset_id (str) – 数据集的名称。

  • table_spec_id (str) – 用于路径构建器的 table_spec_id。

  • field_mask (dict | None) – 指定要读取的字段的掩码。如果提供了字典,则其格式必须与 protobuf 消息 google.cloud.automl_v1beta1.types.FieldMask 的格式相同

  • filter – 筛选表达式,请参阅 go/filtering。

  • page_size (int | None) – 底层 API 响应中包含的最大资源数。如果按资源执行页面流式传输,则此参数不会影响返回值。如果按页执行页面流式传输,则此参数确定页面中的最大资源数。

  • project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset_id', 'table_spec_id', 'field_mask', 'filter_', 'location', 'project_id', 'impersonation_chain')[source]
execute(context)[source]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLTablesUpdateDatasetOperator(*, dataset, location, update_mask=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

更新数据集。

警告

由于 AutoML Tables 的旧版本已于 2024 年 3 月 31 日关闭,Operator AutoMLTablesUpdateDatasetOperator 已被弃用。有关其他信息,请参阅:https://cloud.google.com/automl-tables/docs/deprecations。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.UpdateDatasetOperator

另请参阅

有关如何使用此操作符的更多信息,请查看以下指南:创建数据集

参数
  • dataset (dict) – 替换服务器上资源的 数据集。如果提供了字典,则其格式必须与 protobuf 消息 Dataset 的格式相同。

  • update_mask (dict | None) – 更新掩码应用于资源。如果提供了字典,则其格式必须与 protobuf 消息 FieldMask 的格式相同。

  • location (str) – 项目的位置。

  • params – 预测的其他特定于域的参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset', 'update_mask', 'location', 'impersonation_chain')[source]
execute(context)[source]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLGetModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

获取 Google Cloud AutoML 模型。

警告

用于表格、视频智能、视觉和自然语言的 AutoMLGetModelOperator 已被弃用,不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.model_service.GetModelOperator

另请参阅

关于如何使用此运算符的更多信息,请查看指南:模型操作

参数
  • model_id (str) – 请求用于提供预测服务的模型名称。

  • project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • params – 预测的其他特定于域的参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLDeleteModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

删除 Google Cloud AutoML 模型。

警告

用于表格、视频智能、视觉和自然语言的 AutoMLDeleteModelOperator 已被弃用,不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.model_service.DeleteModelOperator

另请参阅

关于如何使用此运算符的更多信息,请查看指南:模型操作

参数
  • model_id (str) – 请求用于提供预测服务的模型名称。

  • project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • params – 预测的其他特定于域的参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLDeployModelOperator(*, model_id, location, project_id=PROVIDE_PROJECT_ID, image_detection_metadata=None, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

部署模型;如果模型已部署,则使用相同参数部署它不会产生任何影响。

使用不同参数进行部署(例如更改 node_number)将重置部署状态,而不会暂停 model_id 的可用性。

仅适用于文本分类、图像对象检测和表格;所有其他域都会自动管理部署。

警告

由于旧版本的 AutoML 自然语言、视觉、视频智能于 2024 年 3 月 31 日关闭,因此运算符 AutoMLDeployModelOperator 已被弃用。有关更多信息,请参阅:https://cloud.google.com/vision/automl/docs/deprecations 。请改用 airflow.providers.google.cloud.operators.vertex_ai.endpoint_service.DeployModelOperator

另请参阅

关于如何使用此运算符的更多信息,请查看指南:模型操作

参数
  • model_id (str) – 要部署的模型的名称。

  • image_detection_metadata (dict | None) – 图像对象检测特有的模型部署元数据。如果提供了 dict,则其格式必须与 protobuf 消息 ImageObjectDetectionModelDeploymentMetadata 相同

  • project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • params – 预测的其他特定于域的参数。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('model_id', 'location', 'project_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLTablesListTableSpecsOperator(*, dataset_id, location, page_size=None, filter_=None, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出数据集中的表规范。

警告

由于旧版 AutoML Tables 已于 2024 年 3 月 31 日关闭,Operator AutoMLTablesListTableSpecsOperator 已被弃用。有关更多信息,请参阅:https://cloud.google.com/automl-tables/docs/deprecations

另请参阅

有关如何使用此运算符的更多信息,请查看以下指南:列出表格和列规范

参数
  • dataset_id (str) – 数据集的名称。

  • filter – 筛选表达式,请参阅 go/filtering。

  • page_size (int | None) – 底层 API 响应中包含的最大资源数量。如果按资源执行页面流式传输,则此参数不会影响返回值。如果按页面执行页面流式传输,则此参数确定页面中的最大资源数量。

  • project_id (str) – Google Cloud 项目的 ID。如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset_id', 'filter_', 'location', 'project_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLListDatasetOperator(*, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

列出项目中的 AutoML 数据集。

警告

用于表格、视频智能、视觉和自然语言的 AutoMLListDatasetOperator 已被弃用,不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.ListDatasetsOperator

另请参阅

有关如何使用此运算符的更多信息,请查看以下指南:列出和删除数据集

参数
  • project_id (str) – Google Cloud 项目的 ID,其中包含数据集。如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('location', 'project_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.automl.AutoMLDeleteDatasetOperator(*, dataset_id, location, project_id=PROVIDE_PROJECT_ID, metadata=(), timeout=None, retry=DEFAULT, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

删除数据集及其所有内容。

用于表格、视频智能、视觉和自然语言的 AutoMLDeleteDatasetOperator 已被弃用,不再可用。请改用 airflow.providers.google.cloud.operators.vertex_ai.dataset.DeleteDatasetOperator

另请参阅

有关如何使用此运算符的更多信息,请查看以下指南:列出和删除数据集

参数
  • dataset_id (str | list[str]) – 要删除的数据集名称、数据集名称列表或以逗号分隔的数据集名称字符串。

  • project_id (str) – Google Cloud 项目的 ID,如果为 None,则使用默认的 project_id。

  • location (str) – 项目的位置。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间(以秒为单位)。请注意,如果指定 retry,则超时适用于每次单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须授予直接位于其前面的身份“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(已模板化)。

template_fields: collections.abc.Sequence[str] = ('dataset_id', 'location', 'project_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

创建操作符时派生。

上下文是与渲染 jinja 模板时使用的相同字典。

有关更多上下文,请参阅 get_template_context。

此条目是否有帮助?