运算符¶
将数据摄取到 pinecone 索引中¶
使用 PineconeIngestOperator
与 Pinecone API 交互以摄取向量。
使用运算符¶
PineconeIngestOperator 需要将 vectors
作为输入摄取到 Pinecone 中。使用 conn_id
参数指定用于连接到您的 Pinecone 帐户的连接。向量还可以包含引用与可被摄取到数据库中的向量对应的原始文本的元数据。
以这种方式使用运算符的示例
PineconeIngestOperator(
task_id="pinecone_vector_ingest",
index_name=index_name,
input_vectors=[
("id1", [1.0, 2.0, 3.0], {"key": "value"}),
("id2", [1.0, 2.0, 3.0]),
],
namespace=namespace,
batch_size=1,
)
创建基于 Pod 的索引¶
使用 CreatePodIndexOperator
与 Pinecone API 交互以创建基于 Pod 的索引。
使用运算符¶
CreatePodIndexOperator
需要索引详细信息以及 Pod 配置详细信息。api_key
、environment
可以通过参数传递给运算符,也可以通过连接传递。
以这种方式使用运算符的示例
# reference: https://docs.pinecone.io/reference/api/control-plane/create_index
create_index = CreatePodIndexOperator(
task_id="pinecone_create_pod_index",
index_name=index_name,
dimension=3,
replicas=1,
shards=1,
pods=1,
pod_type="p1.x1",
)
创建无服务器索引¶
使用 CreateServerlessIndexOperator
与 Pinecone API 交互以创建基于 Pod 的索引。
使用运算符¶
CreateServerlessIndexOperator
需要索引详细信息以及无服务器配置详细信息。api_key
、environment
可以通过参数传递给运算符,也可以通过连接传递。
以这种方式使用运算符的示例
# reference: https://docs.pinecone.io/reference/api/control-plane/create_index
create_index = CreateServerlessIndexOperator(
task_id="pinecone_create_serverless_index",
index_name=index_name,
dimension=128,
cloud="aws",
region="us-west-2",
metric="cosine",
)