解密:阿里巴巴公司根據截圖查到洩露資訊的員工的技術是?
本文作者 fuqiang liu,文章原載於知乎
一、綜述
本文提供的一種實現“阿里通過肉眼無法識別的標識碼追蹤員工”的技術手段。通過看其他答主的分析,阿里可能還沒用到頻域加水印的技術。
相對於空域方法,頻域加盲水印的方法隱匿性更強,抵抗攻擊能力更強。這類演算法解水印困難,你不知道水印加在那個頻段,而且受到攻擊往往會破壞影像原本內容。本文簡要科普通過頻域手段新增數字盲水印。對於web,可以新增一個背景圖片,來追蹤截圖者。
所謂盲水印,是指人感知不到的水印,包括看不到或聽不見(沒錯,數字盲水印也能夠用於音訊)。其主要應用於音像作品、數字圖書等,目的是,在不破壞原始作品的情況下,實現版權的防護與追蹤。
新增數字盲水印的方法簡單可分為空域方法和頻域方法,這兩種方法新增了冗餘資訊,但在編碼和壓縮情況不變的情況下,不會使原始影像大小產生變化(原來是10MB新增盲水印之後還是10MB)。
空域是指空間域,我們日常所見的影像就是空域。空域新增數字水印的方法是在空間域直接對影像操作(之所以說的這麼繞,是因為不僅僅原圖是空域,原圖的差分等等也是空域),比如將水印直接疊加在影像上。
我們常說一個音有多高,這個音高是指頻率;同樣,影像灰度變化強烈的情況,也可以視為影像的頻率。頻域新增數字水印的方法,是指通過某種變換手段(傅立葉變換,離散餘弦變換,小波變換等)將影像變換到頻域(小波域),在頻域對影像新增水印,再通過逆變換,將影像轉換為空間域。相對於空域手段,頻域手段隱匿性更強,抗攻擊性更高。
所謂對水印的攻擊,是指破壞水印,包括塗抹,剪下,放縮,旋轉,壓縮,加噪,濾波等。數字盲水印不僅僅要敏捷性高(不被人抓到),也要防禦性強(抗打)。就像Dota的敏捷英雄往往是脆皮,數字盲水印的隱匿性和魯棒性是互斥的。(魯棒性是抗攻擊性的學術名字)
二、頻域製作數字盲水印的方法
訊號是有頻率的,一個訊號可以看做是無數個不同階的正弦訊號的的疊加。
上式為傅立葉變換公式,是指時域訊號(對於訊號我們說時域,因為是與時間有關的,而影像我們往往說空域,與空間有關),是指頻率。想要對傅立葉變換有深入瞭解的同學,建議看一下《訊號與系統》或者《數字訊號處理》的教材,裡面系統介紹了傅立葉變換、快速傅立葉變換、拉普拉斯變換、z變換等。
簡而言之,我們有方法將時域訊號轉換成為頻域,同樣,我們也能將二維訊號(影像)轉換為頻域。在上文中提到,影像的頻率是指影像灰度變換的強烈情況。關於此方面更系統的知識,參見岡薩雷斯的《影像處理》。
下面以傅立葉變換為例,介紹通過頻域給影像新增數字盲水印的方法。注意,因為影像是離散訊號,我們實際用的是離散時間傅立葉變換,在本文采用的都是二維快速傅立葉變換,快速傅立葉變換與離散時間傅立葉變換等價,通過蝶型歸併的手段,速度更快。下文中傅立葉變換均為二維快速傅立葉變換。
上圖為疊加數字盲水印的基本流程。編碼的目的有二,一是對水印加密,二控制水印能量的分佈。以下是疊加數字盲水印的實驗。
這是原影像,尺寸300*240
之後進行傅立葉變換,下圖變換後的頻域影像,
這是我想加的水印,尺寸200*100,
這是我編碼後的水印,編碼方式採用隨機序列編碼,通過編碼,水印分佈到隨機分佈到各個頻率,並且對水印進行了加密,
將上圖與原圖的頻譜疊加,可見影像的頻譜已經發生了巨大的變化,
之後,將疊加水印的頻譜進行傅立葉逆變換,得到疊加數字水印後的影像,
肉眼幾乎看不出疊加水印後的影像與原圖的差異,這樣,數字盲水印已經疊加到影像中去。
實際上,我們是把水印以噪聲的形式新增到原影像中。
下圖是在空域上的加水印圖與原圖的殘差(調整了對比度,不然殘差調小看不見),
可以看出,實際上上述方法是通過頻域新增冗餘資訊(像噪聲一樣)。這些噪聲遍佈全圖,在空域上並不容易破壞。
最終,均方誤差(MSE)為0.0244
訊雜比(PSNR)為64.2dB
那麼,為什麼頻譜發生了巨大的變化,而在空域卻變化如此小呢?這是因為我們避開了影像的主要頻率。下圖是原圖頻譜豎過來的樣子,其能量主要集中在低頻。
水印提取是水印疊加的逆過程,
經提取後,我們得到如下水印,問:為什麼水印要對稱呢?嘿嘿,大家想想看。
三、攻擊性實驗
本部分進行攻擊性實驗,來驗證通過頻域手段疊加數字盲水印的魯棒性。
1.進行塗抹攻擊,這是攻擊後的圖片:
再進行水印提取:
2.進行剪下攻擊,就是網上經常用的截圖擷取一部分的情況:
進行迴圈補全:
提取水印:
3.伸縮攻擊(這個實驗明碼做的,水印能量較高,隱匿性不強):
提取水印(水印加的不好,混頻挺嚴重的):
4.旋轉攻擊(明碼):
提取水印:
5.JPEG壓縮後(這個實驗我好像是拿明碼做的,能量主要加在了高頻):
提取結果:
6. PS 4畫素馬賽克/均值濾波等,攻擊後影像
提取水印後影像:
7.截圖,
截圖後我手動摳出要測試的影像區域,並且抽樣或者插值到原圖尺寸:
測試結果:
8. 亮度調節(明碼):
水印提取:
9.色相調節(明碼):
水印提取:
10.飽和度調節(明碼):
水印:
11.對比度(明碼):
水印:
12. 評論區用waifu2x去噪後圖片:
解水印:
13.美圖秀秀,我對我女票一鍵美顏,美白,磨皮,加腮紅,加脣彩(有一種很羞恥的感覺,捂臉):
提取水印:
14. 對於背景純色的圖其實也是無所謂的
能量係數為10時加水印圖片:覺得太顯噪就把能量係數調低,不過水印的隱祕性和魯棒性是互斥的
最終提取出的水印:
15.我用將RGB>600的畫素設定成為(0,255,0)來模擬PS魔術手,
提取水印為:
16.屏攝,好吧,這個實驗我做哭了
屏攝圖:
實驗結果:
我把水印能量係數調整到2000都沒有用。
屏攝之後與原圖訊雜比為4dB左右,我用多抽樣濾波的方式試過,濾不掉屏攝引入的噪聲。屏攝不僅引入了椒鹽噪聲,乘性噪聲,還有有規律的雪花紋理(摩爾紋)。
四、總結
基於頻域的盲水印方法隱藏性強,魯棒性高,能夠抵禦大部分攻擊。但是,對於盲水印演算法,魯棒性和隱匿性是互斥的。
本文方法針對屏攝不行,我多次實驗沒有成功,哪位大神可以做一下或者討論討論。還有二值化不行,這是我想當然的,覺得肯定不行所以沒做實驗。其他的我試了試,用給出的方法調整一下能量係數都可以。
我想大家最關心的是什麼最安全,不會被追蹤。
不涉及影像的都安全,比如拿筆記下來。
涉及影像的屏攝最安全,截圖十分不安全。
相關文章
- 美國23.7萬政府員工的個人資訊遭到洩露
- 不讓資料隨員工走人:防止內部資訊洩露的策略
- 公司隱私洩露,原因竟然是...有員工沒看這種文章!
- SAP RETAIL 如何根據分配表查到根據它建立的採購訂單?AI
- 比起黑客,員工無意識的資料洩露可能更可怕黑客
- 涉密資訊的洩露方式
- 資訊洩露之web原始碼洩露Web原始碼
- 創新公司員工的資訊管理系統
- 為什麼61%的CIO認為員工會惡意洩露資料
- 大疆前員工洩露公司原始碼 被罰20萬、獲刑半年原始碼
- 曼聯遭黑客入侵,球員資訊恐洩露!黑客
- 遊戲巨頭動視暴雪疑似員工敏感資訊及遊戲資料洩露遊戲
- 三星電子核心技術遭洩露,涉事員工被解僱並移交調查
- 資訊洩露的後果很可怕
- 解密阿里巴巴安全技術體系解密阿里
- 以色列國防巨頭美國分公司遭駭客攻擊,部分員工資料洩露
- ChatGPT資料洩露,技術細節公佈ChatGPT
- 亞馬遜正調查員工因受賄而洩露資料的行為亞馬遜
- 【翻譯】卡通圖解DNS,你的資訊怎麼被洩露的?圖解DNS
- [技術分享]使用 iris 是根據 laravel 特色 搭建小架子Laravel
- 40萬條客戶資訊被洩露,企業如何有效防範員工成內鬼?
- Emlog漏洞————敏感資訊洩露
- 漏洞利用之資訊洩露
- 聯合國資料庫暴露,超10萬僱員資訊洩露資料庫
- 深度分析| 資料防洩露技術再次“翻紅”的思考與建議
- 松下承認嚴重資料洩露,涉技術檔案和客戶敏感資訊
- 波音6000名員工資料遭洩露,牽連美政府及軍方
- 什麼是資料洩露?哪些問題可導致資料洩露
- 資訊洩露事件頻發,下一個會是誰?事件
- DNS域傳送資訊洩露DNS
- JS敏感資訊洩露:不容忽視的WEB漏洞JSWeb
- 今晚19:30,直播揭秘資訊洩露的“面紗”
- 從狂熱玩家到公司員工,這是一些暴雪員工的故事
- 萬豪520萬客戶資料洩露;程式設計師45分鐘搞垮上市公司;騰訊打擊微信虛假截圖程式設計師
- 快遞員出售使用者資訊被判刑:如何防止快遞行業資訊洩露行業
- 根據專案用例圖用例點估算專案工時的方法
- 資料洩露的隱性成本
- 程式碼庫售價5萬美元,加拿大電信巨頭Telus員工資訊及原始碼遭洩露原始碼
- 解密阿里巴巴大廠裡的web前端技術體系,技術不斷迭代,我們如何突破?解密阿里Web前端