好不容易找了把尺子,結果尺子會隨機伸縮。
直接針對餘弦相似度訓練模型,可能需要藉助層歸一化等技術。 完全避免在嵌入空間中工作。相反,在應用餘弦相似度之前,先將嵌入投影回原始空間。 在學習過程中或之前應用歸一化或減少流行度偏差,而不是像餘弦相似度那樣僅在學習後進行歸一化。
歐幾里得距離:雖然由於對向量大小敏感而在文字資料中不太流行,但在嵌入經過適當歸一化時可以發揮作用。
點積:在某些應用中,嵌入向量之間的非歸一化點積被發現優於餘弦相似度,特別是在密集段落檢索和問答任務中。
軟餘弦相似度:這種方法除了考慮向量表示外,還考慮了單個詞之間的相似度,可能提供更細緻的比較。
語義文字相似度(STS)預測:專門為語義相似度任務訓練的微調模型 (如 STSScore) 有望提供更穩健和和更可解釋的相似度度量。
歸一化嵌入與餘弦相似度:在使用餘弦相似度之前,應用層歸一化等歸一化技術能有效提升相似度計算的準確性。