airflow.providers.google.cloud.operators.natural_language¶

此模块包含 Google Cloud Natural Language operator。

属性¶

MetaData

类¶

`CloudNaturalLanguageAnalyzeEntitiesOperator`	在文本中查找命名实体以及各种属性。
`CloudNaturalLanguageAnalyzeEntitySentimentOperator`	与 AnalyzeEntities 类似，也会分析与每个实体及其提及相关的感情。
`CloudNaturalLanguageAnalyzeSentimentOperator`	分析提供文本的感情。
`CloudNaturalLanguageClassifyTextOperator`	将文档分类到不同的类别。

模块内容¶

airflow.providers.google.cloud.operators.natural_language.MetaData[source]¶

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageAnalyzeEntitiesOperator(*, document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

在文本中查找命名实体以及各种属性。

示例属性：实体类型、显着性、每个实体的提及等。

另请参阅

有关如何使用此 operator 的更多信息，请参阅指南：分析实体

参数:

document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供的是字典，则其形式必须与 protobuf 消息 Document 相同
encoding_type (google.cloud.language_v1.types.EncodingType | None) – API 用于计算偏移量的编码类型。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None，则不会重试请求。
timeout (float | None) – 等待请求完成的时间，以秒为单位。请注意，如果指定了 retry，则超时时间适用于每个单独的尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 连接到 Google Cloud 时使用的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号，用于使用短期凭据进行模拟，或按顺序排列的帐号列表，用于获取列表中最后一个帐号的 access_token，该 token 将用于请求模拟。如果设置为字符串，则该帐号必须授予源帐号 Service Account Token Creator IAM 角色。如果设置为序列，则列表中各身份必须授予紧邻的前一个身份 Service Account Token Creator IAM 角色，列表中的第一个帐号将此角色授予源帐号（模板化）。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]¶

document[source]¶

encoding_type = None[source]¶

retry[source]¶

timeout = None[source]¶

metadata = ()[source]¶

gcp_conn_id = 'google_cloud_default'[source]¶

impersonation_chain = None[source]¶

execute(context)[source]¶

创建 operator 时派生。

context 与渲染 jinja 模板时使用的字典相同。

有关更多 context，请参阅 get_template_context。

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageAnalyzeEntitySentimentOperator(*, document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

与 AnalyzeEntities 类似，也会分析与每个实体及其提及相关的感情。

另请参阅

有关如何使用此 operator 的更多信息，请参阅指南：分析实体情感

参数:

document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供的是字典，则其形式必须与 protobuf 消息 Document 相同
encoding_type (google.cloud.language_v1.types.EncodingType | None) – API 用于计算偏移量的编码类型。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None，则不会重试请求。
timeout (float | None) – 等待请求完成的时间，以秒为单位。请注意，如果指定了 retry，则超时时间适用于每个单独的尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 连接到 Google Cloud 时使用的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号，用于使用短期凭据进行模拟，或按顺序排列的帐号列表，用于获取列表中最后一个帐号的 access_token，该 token 将用于请求模拟。如果设置为字符串，则该帐号必须授予源帐号 Service Account Token Creator IAM 角色。如果设置为序列，则列表中各身份必须授予紧邻的前一个身份 Service Account Token Creator IAM 角色，列表中的第一个帐号将此角色授予源帐号（模板化）。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]¶

document[source]¶

encoding_type = None[source]¶

retry[source]¶

timeout = None[source]¶

metadata = ()[source]¶

gcp_conn_id = 'google_cloud_default'[source]¶

impersonation_chain = None[source]¶

execute(context)[source]¶

创建 operator 时派生。

context 与渲染 jinja 模板时使用的字典相同。

有关更多 context，请参阅 get_template_context。

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageAnalyzeSentimentOperator(*, document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

分析提供文本的感情。

另请参阅

有关如何使用此 operator 的更多信息，请参阅指南：分析情感

参数:

document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供的是字典，则其形式必须与 protobuf 消息 Document 相同
encoding_type (google.cloud.language_v1.types.EncodingType | None) – API 用于计算偏移量的编码类型。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None，则不会重试请求。
timeout (float | None) – 等待请求完成的时间，以秒为单位。请注意，如果指定了 retry，则超时时间适用于每个单独的尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 连接到 Google Cloud 时使用的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号，用于使用短期凭据进行模拟，或按顺序排列的帐号列表，用于获取列表中最后一个帐号的 access_token，该 token 将用于请求模拟。如果设置为字符串，则该帐号必须授予源帐号 Service Account Token Creator IAM 角色。如果设置为序列，则列表中各身份必须授予紧邻的前一个身份 Service Account Token Creator IAM 角色，列表中的第一个帐号将此角色授予源帐号（模板化）。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]¶

document[source]¶

encoding_type = None[source]¶

retry[source]¶

timeout = None[source]¶

metadata = ()[source]¶

gcp_conn_id = 'google_cloud_default'[source]¶

impersonation_chain = None[source]¶

execute(context)[source]¶

创建 operator 时派生。

context 与渲染 jinja 模板时使用的字典相同。

有关更多 context，请参阅 get_template_context。

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageClassifyTextOperator(*, document, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

将文档分类到不同的类别。

另请参阅

有关如何使用此 operator 的更多信息，请参阅指南：分类内容

参数:

document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供的是字典，则其形式必须与 protobuf 消息 Document 相同
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None，则不会重试请求。
timeout (float | None) – 等待请求完成的时间，以秒为单位。请注意，如果指定了 retry，则超时时间适用于每个单独的尝试。
metadata (MetaData) – 提供给方法的附加元数据。
gcp_conn_id (str) – 连接到 Google Cloud 时使用的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐号，用于使用短期凭据进行模拟，或按顺序排列的帐号列表，用于获取列表中最后一个帐号的 access_token，该 token 将用于请求模拟。如果设置为字符串，则该帐号必须授予源帐号 Service Account Token Creator IAM 角色。如果设置为序列，则列表中各身份必须授予紧邻的前一个身份 Service Account Token Creator IAM 角色，列表中的第一个帐号将此角色授予源帐号（模板化）。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]¶

document[source]¶

retry[source]¶

timeout = None[source]¶

metadata = ()[source]¶

gcp_conn_id = 'google_cloud_default'[source]¶

impersonation_chain = None[source]¶

execute(context)[source]¶

创建 operator 时派生。

context 与渲染 jinja 模板时使用的字典相同。

有关更多 context，请参阅 get_template_context。