條件過濾檢索

DashVector發表於2024-11-07

原文網址 : https://www.cnblogs.com/DashVector/p/18531663

背景介紹

在大多數業務場景中，單純使用向量進行相似性檢索並無法滿足業務需求，通常需要在滿足特定過濾條件、或者特定的"標籤"的前提下，再進行相似性檢索。

向量檢索服務DashVector支援條件過濾和向量相似性檢索相結合，在精確滿足過濾條件的前提下進行高效的向量檢索。

條件過濾檢索示例

說明

需要使用您的api-key替換示例中的 YOUR_API_KEY、您的Cluster Endpoint替換示例中的YOUR_CLUSTER_ENDPOINT，程式碼才能正常執行。
本示例需要參考新建Collection-使用示例

插入帶有Field的資料

Python

import dashvector
import numpy as np

client = dashvector.Client(
    api_key='YOUR_API_KEY',
    endpoint='YOUR_CLUSTER_ENDPOINT'
)
collection = client.get(name='quickstart')

ret = collection.insert([
    ('1', np.random.rand(4), {'name':'zhangsan', 'age': 10, 'male': True, 'weight': 35.0}),
    ('2', np.random.rand(4), {'name':'lisi', 'age': 20, 'male': False, 'weight': 45.0}),
    ('3', np.random.rand(4), {'name':'wangwu', 'age': 30, 'male': True, 'weight': 75.0}),
    ('4', np.random.rand(4), {'name':'zhaoliu', 'age': 5, 'male': False, 'weight': 18.0}),
    ('5', np.random.rand(4), {'name':'sunqi', 'age': 40, 'male': True, 'weight': 70.0})
])
assert ret

說明

在新建Collection-使用示例中，建立了名稱為quickstart的Collection，該Collection定義了3個Field（{'name': str, 'weight': float, 'age': int}）。DashVector具有Schema Free的特性，因此可以在插入Do時，隨意指定建立Collection時未定義的Field，如上述示例中的maleField。

透過filter進行條件過濾檢索

Python

import dashvector

client = dashvector.Client(
    api_key='YOUR_API_KEY',
    endpoint='YOUR_CLUSTER_ENDPOINT'
)
collection = client.get(name='quickstart')

# 要求年齡(age)大於18，並且體重(weight)大於65.0的男性(male=true)
docs = collection.query(
  [0.1, 0.1, 0.1, 0.1],
  topk=10,
  filter = 'age > 18 and weight > 65.0 and male = true'
)
print(docs)

DashVector支援的資料型別

當前DashVector支援Python的4種基礎資料型別：

str
float
int
bool

重要

Python的int型別可表達無限大小的整數，當前DashVector僅支援32位整數，範圍為-2,147,483,648~2,147,483,647，需要使用者自行保證資料未溢位。

比較運算子

透過Field 比較運算子常量的組合生成比較表示式，說明及示例如下：

成員運算子

透過Field 成員運算子常量的組合生成比較表示式，說明及示例如下：

字串運算子

透過Field 字串運算子常量的組合生成匹配表示式，說明及示例如下：

邏輯運算子

邏輯運算子用於組合多個表示式。

說明

可透過括號()組合邏輯運算子，()擁有更高優先順序，如：expr1 and (expr2 or expr3)，會優先計算(expr2 or expr3)

相關文章

最佳化數倉業務檢視：過濾條件傳遞
2023-02-08
java8 多條件的filter過濾
2024-05-22
JavaFilter
MySQL全面瓦解7：查詢的過濾條件
2020-11-09
MySql
《MySQL 入門教程》第 08 篇過濾條件
2022-01-30
MySql
[20210420]19c奇怪的過濾條件.txt
2021-04-20
Stream中filter過濾條件問題記錄
2020-12-04
Filter
34. 過濾條件、多表查詢、子查詢
2024-10-28
【TcaplusDB知識庫】條件過濾說明與更新
2021-11-23
odoo 為可編輯列表檢視欄位搜尋新增查詢過濾條件
2023-02-20
Odoo
ES 23 - 檢索和過濾的區別 (query vs. filter)
2019-07-31
Filter
檢視過濾
2024-05-15
【GreatSQL最佳化器-05】條件過濾condition_fanout_filter
2024-12-06
SQLFilter
mysql多條件過濾查詢之mysq高階查詢
2021-12-30
MySql
帶你讀 MySQL 原始碼：where 條件怎麼過濾記錄？
2023-04-25
MySql原始碼
SpamSieve for mac(郵件過濾器)
2020-11-03
Mac過濾器
SpamSieve for mac(郵件過濾工具)
2021-10-15
Mac
JS中的陣列過濾，從簡單篩選到多條件篩選
2018-10-15
JS陣列
SpringBoot整合Jpa對資料進行排序、分頁、條件查詢和過濾
2023-05-12
Spring Boot排序
AutoMapper如何全域性配置map條件過濾null值空值對所有對映起效
2019-04-16
APPNull
Oracle 檢視可以DML操作的條件
2018-04-28
Oracle
通過新增條件優化SQL
2019-03-15
優化SQL
CYmysql根據json欄位內容作為查詢條件(包括json陣列)檢索資料dvn
2022-03-01
MySqlJSON陣列
使用樸素貝葉斯過濾垃圾郵件
2020-02-03
如何在頁面跳轉後，再返回上級頁面時，保留檢索條件，重新整理內容
2018-12-13
ES：檢索
2018-11-07
pta檢索
2020-11-22
儲存過程WHERE條件不生效
2020-06-12
儲存過程
影象檢索：資訊檢索評價指標mAP
2018-12-26
指標
基於ElasticSearch實現商品的全文檢索檢索
2018-04-15
Elasticsearch
配置全文檢索
2019-07-20
資料檢索
2020-10-31
資訊檢索
2024-09-09
垃圾郵件過濾軟體：SpamSieve for Mac 3.0.2直裝版
2023-11-22
Mac
過濾
2024-07-30
記錄一篇關於條件查詢語句的用法:1.通過QueryWrapper進行條件構造2.通過Example進行條件構造
2020-11-09
APP
.NetCore下基於FreeRedis實現的Redis6.0客戶端快取之快取鍵條件優雅過濾
2023-01-15
NetCoreRedis客戶端快取
條件渲染
2024-08-29
PostgreSQL一複合查詢SQL優化例子-(多個exists,範圍檢索,IN檢索,模糊檢索組合)
2018-09-15
SQL優化