apache-airflow-providers-weaviate

变更日志

3.0.3

杂项

  • 移除 冗余的 else (#49199)

3.0.2

杂项

  • flit 升级到 3.11.0 (#46938)

3.0.1

杂项

  • AIP-72: SDK 中支持更好的 Context 字典类型提示  (#45583)

  • Literal 别名移入 TYPE_CHECKING (#45345)

  • 移除 Python 3.9 之前版本对 pandas 的过时规范 (#45399)

3.0.0

注意

此提供程序版本仅适用于 Airflow 2.9+,具体说明请参见 Apache Airflow 提供程序支持策略

重大变更

警告

Weaviate provider 包中已移除所有已弃用的类、参数和功能。引入了以下重大变更:

  • WeaviateIngestOperator 中移除了已弃用的 input_json 参数。请改用 input_data

  • Weaviate Provider 中移除已弃用项 (#44745)

杂项

  • 将提供程序中的最低 Airflow 版本提升至 Airflow 2.9.0 (#44956)

2.1.0

注意

此提供程序版本仅适用于 Airflow 2.8+,具体说明请参见 Apache Airflow 提供程序支持策略

杂项

  • 将提供程序中的最低 Airflow 版本提升至 Airflow 2.8.0 (#41396)

2.0.0

重大变更

警告

我们将 weaviate-client 的最低版本提升到了 4.4.0。许多概念和方法已发生变化。建议您在升级到此版本之前阅读 从 v3 迁移到 v4

主要变更摘要
  • 为 Weaviate 连接添加 PortgRPC hostgRPC port 以及 Use httpsUse a secure channel for the underlying gRPC API 选项。Airflow 提供程序的默认值可能不适用于正确使用 Weaviate,因此建议明确指定这些值。

  • 更新 WeaviateIngestOperatorWeaviateDocumentIngestOperator 以使用支持 weaviate-client v4 API 的 WeaviateHook。主要变化是将参数 class_name 更改为 collection_name 并移除 batch_params

  • 更新 WeaviateHook 以利用 weaviate-client v4 API。实现方式已进行了广泛修改。建议您在使用更新后的 WeaviateHook 之前,阅读 从 v3 迁移到 v4,以了解 Weaviate 方面的变化。

  • 将以下 WeaviateHook 公共方法迁移到 v4 API: test_connections, query_with_vector, create_object, get_object, delete_object, update_object, replace_object, object_exists, batch_data, get_or_create_object, create_or_replace_document_objects

  • WeaviateHook 公共方法 update_schema 重命名为 update_collection_configurationcreate_class 重命名为 create_collectionget_schema 重命名为 get_collection_configurationdelete_classes 重命名为 delete_collectionsquery_without_vector 重命名为 query_with_text

  • 移除以下 WeaviateHook 公共方法: validate_object, update_schema, create_schema, delete_all_schema, check_subset_of_schema

  • 移除已弃用的方法 WeaviateHook.get_client

  • 移除 WeaviateHook.__init__ 中未使用的参数 retry_status_codes

  • weaviate-client 升级到 v4 (#40194)

Bug 修复

  • 修复新 weaviate 客户端中的 mypy 问题 (#40330)

1.4.2

杂项

  • 更新 Python 3.12 pandas 的最低要求 (#40272)

  • 在所有地方添加对 httpx >= 0.25.0 的依赖项 (#40256)

1.4.1

杂项

  • 更快的 'airflow_version' 导入 (#39552)

  • 简化 'airflow_version' 导入 (#39497)

1.4.0

注意

此提供程序版本仅适用于 Airflow 2.7+,具体说明请参见 Apache Airflow 提供程序支持策略

杂项

  • 将提供程序中的最低 Airflow 版本提升至 Airflow 2.7.0 (#39240)

1.3.4

Bug 修复

  • 修复 'MappedOperator' 中的 'WeaviateIngestOperator'/'WeaviateDocumentIngestOperator' 参数 (#38402)

1.3.3

杂项

  • 'pandas' 限制为 '<2.2' (#37748)

1.3.2

杂项

  • feat: 将所有类、函数、方法弃用标记切换为装饰器 (#36876)

1.3.1

Bug 修复

  • 修复 providers warnings.warn stacklevel (#36831)

  • 在构造函数中显式初始化模板化字段 (#36908)

1.3.0

新功能

  • 添加 WeaviateDocumentIngestOperator (#36402)

  • WeaviateIngestOperator 添加 'uuid_column', 'tenant' 参数 (#36387)

  • weaviate provider 添加 create_or_replace_document_objects 方法 (#36177)

Bug 修复

  • 移除 'insertion_errors' 作为必填参数 (#36435)

  • 处理  weaviate 'create_or_replace_document_objects' hook 方法中的列表状输入对象 (#36475)

1.2.0

新功能

  • 添加用于对 weaviate schema class 对象执行 CRUD 操作的帮助函数 (#35919)

  • WeaviateIngestOperator 添加重试机制和 dataframe 支持 (#36085)

Bug 修复

  • 修复 WeaviateIngestOperator template_fields (#36359)

1.1.0

注意

此提供程序版本仅适用于 Airflow 2.6+,具体说明请参见 Apache Airflow 提供程序支持策略

新功能

  • weaviate hook 中添加对象方法 (#35934)

  • weaviate 客户端添加缓存 (#35983)

  • 添加更多连接 weaviate 的方式 (#35864)

杂项

  • 将提供程序中的最低 Airflow 版本提升至 Airflow 2.6.0 (#36017)

1.0.0

提供程序的初始版本。

此条目有帮助吗?