熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我們籌集了650萬美元來消滅向量資料庫。
今天的每個系統都以相同的方式檢索上下文:向量搜索將所有內容存儲為平面嵌入,並返回任何「感覺」最接近的內容。
相似,確實如此。相關性?幾乎從未。
如果語言足夠接近,嵌入無法區分Q3續約條款和Q1終止通知。
上週,我的一位朋友向他的AI詢問了一份合同,結果返回了一個詳細且完美製作的答案,這個答案來自完全不同客戶的檔案。
一旦你處理超過1000萬份文件,這種混淆隨時都會發生。
向量資料庫的準確性變得糟糕。
我們正是為此建立了@hydra_db。
HydraDB在你的數據上構建了一個以本體為首的上下文圖,映射實體之間的關係,理解文件背後的「為什麼」,並追蹤信息隨時間的演變。
所以當你詢問「Apple」時,它知道你指的是你作為客戶所服務的公司,而不是水果。
即使當向量資料庫的相似度分數顯示為0.94。
更多內容如下⬇️
熱門
排行
收藏
