airflow.providers.google.cloud.operators.natural_language

此模块包含 Google Cloud Natural Language 运算符。

模块内容

CloudNaturalLanguageAnalyzeEntitiesOperator

在文本中查找命名实体及其各种属性。

CloudNaturalLanguageAnalyzeEntitySentimentOperator

类似于 AnalyzeEntities,也分析与每个实体及其提及相关的情感。

CloudNaturalLanguageAnalyzeSentimentOperator

分析所提供文本的情感。

CloudNaturalLanguageClassifyTextOperator

将文档分类到各个类别。

属性

元数据

airflow.providers.google.cloud.operators.natural_language.MetaData[源代码]
class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageAnalyzeEntitiesOperator(*, document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

在文本中查找命名实体及其各种属性。

示例属性:实体类型、显著性、每个实体的提及等。

另请参阅

有关如何使用此运算符的更多信息,请查看指南:分析实体

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供一个 dict,则它必须与 protobuf 消息 Document 的形式相同

  • encoding_type (google.cloud.language_v1.types.EncodingType | None) – API 用于计算偏移量的编码类型。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟身份,或获取列表中最后一个帐户的 access_token 所需的帐户链表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中标识必须向紧随其后的标识授予“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

在创建运算符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageAnalyzeEntitySentimentOperator(*, document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

类似于 AnalyzeEntities,也分析与每个实体及其提及相关的情感。

另请参阅

有关如何使用此运算符的更多信息,请查看指南:分析实体情感

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供一个 dict,则它必须与 protobuf 消息 Document 的形式相同

  • encoding_type (google.cloud.language_v1.types.EncodingType | None) – API 用于计算偏移量的编码类型。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟身份,或获取列表中最后一个帐户的 access_token 所需的帐户链表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中标识必须向紧随其后的标识授予“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[源代码]
execute(context)[源代码]

在创建运算符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageAnalyzeSentimentOperator(*, document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

分析所提供文本的情感。

另请参阅

关于如何使用此操作符的更多信息,请查看指南:分析情感

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供一个 dict,则它必须与 protobuf 消息 Document 的形式相同

  • encoding_type (google.cloud.language_v1.types.EncodingType | None) – API 用于计算偏移量的编码类型。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟身份,或获取列表中最后一个帐户的 access_token 所需的帐户链表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中标识必须向紧随其后的标识授予“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]
execute(context)[source]

在创建运算符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageClassifyTextOperator(*, document, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

基类: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

将文档分类到各个类别。

另请参阅

关于如何使用此操作符的更多信息,请查看指南:分类内容

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供一个 dict,则它必须与 protobuf 消息 Document 的形式相同

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (MetaData) – 提供给方法的其他元数据。

  • gcp_conn_id (str) – 用于连接到 Google Cloud 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟身份,或获取列表中最后一个帐户的 access_token 所需的帐户链表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中标识必须向紧随其后的标识授予“服务帐户令牌创建者”IAM 角色,列表中的第一个帐户授予原始帐户此角色(模板化)。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]
execute(context)[source]

在创建运算符时派生。

上下文与渲染 jinja 模板时使用的字典相同。

有关更多上下文,请参阅 get_template_context。

此条目是否有帮助?