聚焦創新性和實用性方法 近千支隊伍參與數字安全公開賽

Editor發表於2021-09-07

致力於打造計算智慧與數字安全領域“奧林匹克競賽”的數字安全公開賽正在火熱進行中。截至9月7日,這場由中國計算機學會(CCF)主辦,大資料協同安全技術國家工程實驗室、中國計算機學會大資料與計算智慧大賽(CCF BDCI)組委會聯合組織的賽事,已吸引了946支隊伍參賽,其中包括來自清華大學、北京大學、中國科學院大學、浙江大學、武漢大學、西安交通大學等高校的500餘名學生,以及來自網際網路、通訊、資訊系統、金融等行業的400餘名企業在職人員、科研院所研究人員。

 

大賽共設定三道來源於應對真實業務風險的賽題,分別是基於人工智慧的惡意軟體家族分類、面向黑灰產治理的惡意簡訊變體字還原、工業安全生產環境違規使用手機。目前,三道賽題分別吸引了441支、237支和268支隊伍參賽。

 

CCF大資料專家委員會副秘書長、中國人民大學教授、CCF大資料與計算智慧大賽工作委員會主席竇志成表示,希望參賽選手能夠勇於探索和創新,聚焦具有創新性和實用性的方法和技術。

 

大資料協同安全技術國家工程實驗室常務副主任、三六零(601360.SH,下稱“360”)集團副總裁、首席安全官杜躍進博士表示,對安全行業從業人員來說,數字時代的安全風險既是挑戰,也是機會,希望參賽選手能夠不斷尋找大安全風險最優解。


441支戰隊出動 用AI助力惡意軟體識別

 

截至9月7日,共有441支隊伍參加了基於人工智慧的惡意軟體家族分類賽題。

 

該賽題合作方為360高階威脅研究院,該研究院相關負責人指出,惡意軟體是一類危害資訊系統正常執行的計算機程式,包括計算機病毒、木馬、後門、蠕蟲、勒索軟體等,駭客或網路犯罪團伙可利用這些惡意軟體竊取使用者隱私,監控使用者操作,盜取賬戶、口令,加密使用者重要資料,甚至是發起高階可持續威脅攻擊(APT)。隨著社會資訊化的不斷深入,其危害不斷加深,小到個人隱私、財務安全損失,大到危機社會、國家安全。

 

以勒索攻擊為例,近期,全球財富五百強、諮詢行業巨頭埃森哲遭受勒索攻擊,6TB內部資料被竊取,2500臺裝置被加密,並被要求支付5000萬美元的贖金。

 

360一直致力於發現、攔截和處理惡意軟體。2020年,360安全大腦共截獲移動端新增惡意程式樣本450餘萬個,攔截釣魚網站攻擊1006億次;手機衛士共為全國使用者攔截惡意程式攻擊約52.8億次;360 反勒索服務共接收並處理了約3800 例勒索病毒攻擊求助,其中超過3700例確認遭受勒索病毒攻擊。最終幫助超過260 例反饋使用者完成檔案解密工作。

 

值得一提的是,在過去數年裡,360累計發現了46個其他國家背景的APT組織,監測到3000多次對中國的國家級網路攻擊。

 

但是,近年來,為逃避檢測,惡意軟體製作者在惡意軟體元件中引入了多型性,使得原本隸屬同一家族的檔案看起來像許多不同的檔案,降低了檢測識別的準確性。這也是目前識別和攔截惡意軟體面臨的主要挑戰。

 

本屆數字安全公開賽正是基於此挑戰設定任務,參賽團隊將設計演算法對惡意軟體進行識別和家族分類,選手需要透過分析訓練集中各家族惡意軟體的特點,構建AI模型,對測試集中各個家族的惡意軟體進行區分,以提升海量惡意軟體分析的高效性。

 

237支隊伍角力最難賽題 變體字還原打擊黑灰產

 

面向黑灰產治理的惡意簡訊變體字還原的賽題合作方為360手機衛士,目前,共有237支隊伍參加該賽題比賽。

 

據360手機衛士方面介紹,惡意簡訊一直是黑灰產引流的重要渠道,資訊中攜帶的微訊號、QQ號、網址更是非法資訊傳播的主要入口。

 

針對惡意簡訊,業界通常做法是利用違法或不良資訊檢測引擎在手機終端實現自動攔截。據360手機衛士、天樞智庫聯合釋出的《2021年上半年中國手機安全狀況報告》顯示,360 手機衛士上半年共攔截各類垃圾簡訊約 93.4 億條,其中詐騙簡訊和違法簡訊分別佔比 6.3%和0.1%。

 

360手機衛士透過長期的反詐實踐研究發現,不法分子為逃避檢測而使用變體字傳送惡意簡訊繞過攔截規則的情況越來越多。據測算,360手機衛士平均每天攔截約300萬詐騙簡訊,其中利用變體字生僻字實施簡訊詐騙的佔比約為64%。

 

而由於變體字變換方式多,變換速度快,單純透過規則進行變體詞發現的效果有限,配套人工稽核成本高且具有滯後性。

 

因此,如何精準和高效地還原變體字文字,提高非法資訊的抽取能力,以及新型變體字還原的泛化性和時效性,就成為了解決這一難題的關鍵。

 

針對這一難題,本屆數字安全公開賽要求參賽團隊對訓練集中的簡訊樣本進行分析,採用深度學習建模的方法將測試集中新出現的簡訊變體字還原為正常資訊文字,即不含有變體字、干擾字元,所有變體字部分應使用常見簡體漢字、字元來表示,同時需要保證不包含變體字的正常文字不受影響,助力提升詐騙資訊抽取率,進一步提升變體詞簡訊的攔截能力。不僅如此,該賽題還對模型大小和單條簡訊推理耗時提出較高的競爭要求,堪稱本屆公開賽最難賽題。

 

安全生產是紅線 159支隊伍參與違規使用手機識別比賽

 

共有159支隊伍參加了工業安全生產環境違規使用手機的識別賽題。

 

安全生產是工廠正常經營的基本紅線。但在工業生產環境中,工作人員在作業區違規使用手機已成為引發安全生產事故的一大隱患。因此,基於工業安全生產和員工人身安全考慮,越來越多的工廠建立起員工手機使用管理規範

 

傳統的管理手段主要是禁止將手機帶入廠區或者集中放置,或是人員監督抽查核查。但不僅存在耗費大量人力的問題,而且總有“空子”可鑽,難以做到事前預警、始終常態檢測、事後規範管理的全鏈條監管。

 

《中華人民共和國安全生產法(修正草案)》的說明中特別強調,要強化基礎保障能力,依靠法治力量推進安全生產治理體系和治理能力現代化。目前基於人工智慧技術的工廠安全生產監控預警系統逐漸應用部署起來,該系統透過對設定在生產工區內攝像頭採集的影片圖片進行分析,快速、準確識別員工違規使用手機的行為,並進行提示和規範,可有效加強安全生產監管,實現降本、提質、增效,加速數字化轉型程式。

 

基於此提煉的賽題任務,要求參賽團隊結合提供的資料訓練集,識別判斷圖片上的人物是否存在使用手機行為,提高識別的正確率。

 

據瞭解,上述三道賽題,是從大安全領域產業應用的真實場景中提煉而來,分別針對三個具體場景和問題。杜躍進表示,希望透過數字安全公開賽,發動社會力量,以互相促進的方式做創新,為真實場景下的安全問題提供更好的解決方案。


相關文章