淺談基於Shapley值的資料融合反欺騙資料判斷相關

天翼雲開發者社群發表於2023-05-18

本文分享自天翼雲開發者社群《 淺談基於Shapley值的資料融合反欺騙資料判斷相關 》,作者 : z****n

https://www.ctyun.cn/developer/article/416084394414149

 

一、相關背景

多個資訊源的資料進行融合處理後的資訊具有較高準確性,同時具備互補性、及時性等特徵,在一定程度上能夠克服單資訊源獲取資訊的侷限性,能更加客觀地對目標形成認識,具有更高置信度和較強魯棒性。資訊融合技術隨著人工智慧及物聯網的發展,在人們日常生活中已被廣泛應用。然而,在透過該技術享受生活便利的同時,也承擔著其所帶來的決策的誤判、情報處理混亂等風險。

現代資訊融合技術擔當著越發重要的角色,其原理是透過感測器獲取對狀態、環境及目標的相關資訊,並根據特定的演算法對多個感測器所獲資訊進行處理,為得到用於評估戰場的狀態、敵方潛在的威脅以及自身相關方面的穩定性等重要資訊提供依據。欺騙資訊往往可以定義為故意或者無意操作產生的異常資料,比如假設一個欺騙者透過觀察使用者與感測器之間的通訊,然後傳送虛假資訊給使用者以干擾決策。

證據理論是由Dempster於1967年提出,之後由其學生Shafer對其進行了最佳化和改進,將之進一步發展,實現了相較於機率論等傳統方法更加有效的表示和處理不確定性資訊。此外,該理論將經典機率論中的基本時間空間拓寬為所有可能包含基本事件的冪集,也就是辨識框架的概念,同時在此基礎上建立基本機率指派函式(Basic Probability Assignment, BPA)。源於該理論有著較強的不確定資訊表示和處理能力,並且可以實現在無需先驗資訊的條件下進行融合等優點,在現代資訊融合系統中得到了廣泛的應用,是處理不確定資訊的經典理論工具之一。

Shapley值最早是由諾貝爾經濟學獎獲得者L. Shapley在合作博弈論中提出的,旨在針對如何合理分配收益的問題,同時考慮到整體活動中每個參與成員之間的平等性,將成本或者收益按照所有的邊際成本進行平均分配的原則,也就是說,每個參與者獲得的收益值等於該參與人對所有可能聯盟合作的邊際貢獻和的平均值。Yager將這種測量與變數相關的區分知識(不確定性-確定性)的想法擴充套件引入Shapley熵的模糊測度的情況,將Shapley值熵概念擴充套件到模糊度量方法,同時引入了模糊測度的基數指數,用它來定義模糊測度的態度特徵並稱之為Shapley熵,目前關於模糊信任函式討論最廣泛的轉換方法是Shapley值。

二、意義所在

管理虛假和來自可能故意欺騙的資訊一直以來都是資訊融合過程中的一個重要問題。如果不積極管理虛假和欺騙性資訊便相信基於組合來自多個不同來源的資訊的任何結論,當真實資訊與支援不真實可能性的欺騙性資訊相結合時,基於來自所有來源的資訊組合得出的結論可能會變得退化或錯誤。因此,提供有效可行的證據判定方案為高質量生成證據融合結果是有意義的。

三、問題與思路

僅是透過指標觀察潛在欺騙資料的影響,並未給出一個直觀可以理解的基礎框架探討一條證據是否應該融合或者是否存在欺騙證據的方法和方案,依舊存在值得進一步討論和發展的研究問題,試想一下,1)當面向一個證據源時,無法直接判斷即將融合的資料來源中是否存在欺騙資料,即判斷每條證據應不應該融合,其本質問題是討論證據的可用性問題,即如何有效的判斷證據是否可用;2)判斷證據之後的下一步操作--丟棄還是進一步處理;3)進一步處理的方法。總技術路線概述如下:

 

基於技術路線分析:主要為針對多源(多屬性)反欺騙資訊判定機制以及證據融合策略的關鍵問題,基於Shapley值方法從證據差異性研究、證據合作收益模型、欺騙證據判定規則、欺騙消解機制以及衝突消解機制五部分內容進行研究。

四、衝突與欺騙

不一致資訊往往由於資訊源受到了干擾,更多層面上表現為客觀資料的差異性,指標資料上表現為規律性或者自然噪聲干擾引起的非劇烈波動。這種情況下,我們認為該資訊雖然存在一定的差異性,但仍然具備有效資訊量,應被Dempster組合規則接收融合,即不一致證據。

欺騙證據更多的是面向同一個問題,由於辨識框架的不完整或者是源自刻意以真實情況為依託進一步杜撰的一種反事實資訊(Negative Information),資料上表現為無規律性,在一般情況下欺騙證據的數量應遠小於正常資料,或不超過正常資料的一半。在這種情況下,基於對欺騙證據的慎重判定和篩選,我們假設欺騙證據存在兩種情況,即強欺騙和弱欺騙。強欺騙是指完全欺騙,也就是對於其他BPA都高度支援的某一事件的基本分配機率為0,即對正確決策產生沒有貢獻和有效資訊量。弱欺騙是指即使該證據對於正確決策的產生有貢獻值(非0),但是基於證據判定規則依舊判斷為欺騙證據的證據(下文簡寫為欺騙證據)。

綜上,衝突證據包括不一致證據和欺騙證據,欺騙證據一定是衝突證據。因此,對待不一致證據和欺騙證據的處理方法應該不同。

五、小結

反欺騙一直是資料融合中的重要研究內容,現有的改變融合規則及證據折扣融合處理方法均基於需包含所有證據。然而,當前方法在確定所有證據的可用性的前提下,擴充套件了反欺騙方法的範圍。首先對欺騙證據與衝突證據的概念分析和討論了,透過欺騙證據判定模型實現對證據源中欺騙證據的有效判斷,以構建資料融合前對證據進行反欺騙處理的資料模型思路。此外,針對證據理論中證據之間往往存在的不一致導致的證據衝突問題,基於Shapley值制定證據融合策略以實現更好的證據衝突管理。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70014251/viewspace-2953017/,如需轉載,請註明出處,否則將追究法律責任。

相關文章