我們籌集了650萬美元來消滅向量資料庫。 今天的每個系統都以相同的方式檢索上下文:向量搜索將所有內容存儲為平面嵌入,並返回任何「感覺」最接近的內容。 相似,確實如此。相關性?幾乎從未。 如果語言足夠接近,嵌入無法區分Q3續約條款和Q1終止通知。 上週,我的一位朋友向他的AI詢問了一份合同,結果返回了一個詳細且完美製作的答案,這個答案來自完全不同客戶的檔案。 一旦你處理超過1000萬份文件,這種混淆隨時都會發生。 向量資料庫的準確性變得糟糕。 我們正是為此建立了@hydra_db。 HydraDB在你的數據上構建了一個以本體為首的上下文圖,映射實體之間的關係,理解文件背後的「為什麼」,並追蹤信息隨時間的演變。 所以當你詢問「Apple」時,它知道你指的是你作為客戶所服務的公司,而不是水果。 即使當向量資料庫的相似度分數顯示為0.94。 更多內容如下⬇️