方圓系列報告會之《大資料分析與視覺化報告會》於4月4日清華大學內成功舉辦,現場邀請了清華大學副教授劉世霞、浙江大學教授陳為、同濟大學教授曹楠和中國人民大學講師張靜共四位嘉賓進行學術演講。
今天小編為大家帶來的是曹楠老師“Interactive Visual Anomaly Detection and its Applications”演講PPT分享。
曹楠
A Big Data Visualization Researcher Intelligent Big Data Visualization Lab (iDVx Lab) TongjiUniversity, Shanghai, China
同濟大學智慧大資料視覺化實驗室(智慧大資料視覺化實驗室,即iDV x實驗室)
曹楠老師演講關鍵詞之一:ANOMALY DETECTION(異常檢測),異常檢測是對不符合資料集中的預期模式或其他專案的專案,事件或觀察的識別。
面臨的挑戰
接下來是對社交媒體(以推特為例)的發展趨勢以及社交媒體使用者畫像的分析,引出“anonymous users are potential threats to the society ”,然後提出異常檢測的最終目標:捕捉到存在異常行為的使用者。
社交媒體使用者畫像和行為分析(附引用文獻)以及如何進行異常檢測捕捉到使用者的異常行為
微言
使用者行為主要有兩種,一是釋出,即建立訊息併發布給其他人;二是回覆和轉發,即轉播他人釋出的資訊。
通過功能捕獲使用者行為
時間區域性異常因子,TLOF通過識別與測試資料中的其他使用者明顯不同的特徵以及他自己的過去歷史,為每個使用者提供異常測量。
使用者行為分析,建立訊息和轉發回覆的傳播趨勢
使用者視覺化為由其重要性決定的圓圈,並按其異常分數著色
當使用者釋出或轉發推文時,我們在活動發生時繪製垂直於時間弧的相應活動執行緒
以下三個圓狀物,哪個才是表示較為正常的使用者行為呢?答案是第一個。第二個圓狀物黃色幾乎覆蓋了整個圓形,說明發文時間和發文頻率過於密集,不符合正常人類使用社交媒體的行為習慣,疑似bot;第三個同理。
視覺化使用者特徵
使用基線圓圈指示所有使用者的平均特徵值
沿著基線周圍的要素軸繪製使用者的要素值
特徵動態
bot異常檢測存在的挑戰
Voila:使用流式時空資料進行視覺異常檢測和監控
以上海外灘踩踏事件為例,提出我們如果能有一種用於跟蹤異常移動趨勢的技術,實時監測人群流動趨勢,當人群流動趨勢出現異常情況時,可及時做出反應以避免踩踏事故的發生。
該技術還在研究完善過程中,現主要研究目標是:Urban computing、 Meteorology、 Public Health Surveillance
即監控動態流時空資料、及時發現惡意事件和預測罕見的時空事件(未來工作)
駕駛員心電圖行為監測