大資料對傳統輿情研究產生了深刻的影響,在這種大背景下,社會輿情研究需要進行如下相關轉向,以實現學科的除錯和適應,具體主要包括以下幾點。
1. 研究視角的轉向:從單向度的內容研究轉向“內容+ 關係”的多維度研究
隨著大資料時代的到來,傳統的輿情研究只重視網民話語表達的單向度研究必將改變,話語作為一種外在的社會表達,屬於淺表層面,不能夠有效地窺探出網民群體的社會行為、社會心理和社會訴求。藉助大資料,輿情研究的視角將更加多元化,未來輿情研究的視角將轉向為社會話語表達、社會關係呈現、社會心理描繪、社會訴求預測等多方面、多向度的研究,通過這樣的研究轉型,社會輿情研究將真正成為一門與多學科交叉的社會顯學,成為一門學科,改變目前輿情研究“策為上、術為主、學匱乏”的尷尬學術現實。
2. 研究方法的轉向:由輿情資訊採集轉向資料加工、視覺化等
由於輿情監測的前端介面呈現的方式上同質化程度較高,目前的輿情監測和輿情研究主要集中在輿情資訊的採集及資訊源的擴充套件方面。無論是北大方正輿情產品還是拓爾思(TRS),在對新聞網站、微博賬號進行監測時,都必須將網站地址和微博賬號的微號設定好,甚至新聞網站的網站設計樣板也要進行設定,被監測的網站一旦改版,後臺監測也必須調整相應的網頁樣板。各種輿情軟體之間的競爭主要集中在資訊採集源覆蓋的範圍以及資料分析後臺的演算法上,但呈現出來的前端頁面則是“千網一面”。大資料將目前輿情資訊採集的環節拉回到一個競爭層面上來,未來輿情監測和研究的資料來源可能來自同一個大資料庫支撐,輿情研究主體競爭的是各類演算法的精細化、準確化,並在呈現給使用者的前端介面上進行優化,增強前端介面的友好程度,整個競爭的鏈條就會不斷下移,更加適合使用者的需求。
3. 資料庫支援的轉向:由簡單的、有限的資料庫轉向非結構化的大資料庫
目前的輿情監測和研究所依據的資料庫相對來說比較簡單,結構單一、資料量有限,還停留在TB 級別,主要因為這些資料庫的資料來源要麼是基於抽樣進行資料抓取的,要麼僅抓取重點網路站點,資料量有限,資料庫標準相對較低,能針對小規模、有結構或類結構的資料進行分析,談不上深層次的資料探勘,現有的資料探勘演算法在不同行業中難以通用。大資料的資料體量巨大,從TB 級別,躍升到PB 乃至ZB 級別,因此大資料所涉及的資料量規模巨大到無法通過目前主流軟體工具進行處理和識別,需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力,這需要巨大的資料庫作為支撐。另外,大資料的資料資源相對駁雜,是一種非結構化的資料呈現,因此需要相應的非結構化的資料庫相對接。
4. 輿情研究主體的轉向:由小作坊式的單打獨鬥、面面俱到輿情監控轉向分工明確、高度聚合集約的輿情分析
目前實踐中的輿情監測和研究主體比較多,僅用於商業運營的軟體監測主體就有幾百家之多,這些輿情監測主體多半是軟體服務商,通過網路爬蟲技術、分詞技術和議題聚合等技術,開發出相關軟體,為企業、政府部門和科研院所安裝和維護,進行簡單的資料採集和分析,類似於小作坊式的輿情監測方法,這種運作方式急功近利,為了眼前的商業利益,不重視產品研發和資料來源的擴充,通過吃回扣等商業賄賂方式儘量多賣幾套“軟體”。各輿情主體之間的競爭顯得低層次化和粗放型。
未來大資料使得輿情研究主體在同一個層面上競爭,即資料處理和呈現的能力上,在大家可以獲得同一資料來源的前提下,雙方的競爭必將在資料處理、演算法精進、介面友好、視覺化等層面展開競爭,分工會進一步明晰,行業內部會進一步聚合集約,加速行業洗牌,行業有機化程度增強。
5. 輿情研究重點的轉向:由輿情監測轉向為輿情預警乃至預測,從單向度的危機應對、品牌營銷轉向各領域的綜合資訊服務
目前的網路輿情研究主要集中在監測,主要是對一些顯著性事件的輿情動態,包括傳播範圍、影響力等進行監測和研判,類似於相面術的“麻衣相”,只知道事件發展的過去,不知道事件發展的未來。大資料的核心是預測,可以通過分析處理整群資料,而不再大量依賴隨機取樣,通過自然語言處理、模式識別以及機器學習等人工智慧技術,結合人工經驗,未來實驗輿情的預警,研判未來輿情發展的態勢和影響,並在此基礎上實現超出人類經驗範疇之外的精準化預測。如國外研究人員已發現,Google 搜尋請求中諸如“流感症狀”和“流感治療”之類的關鍵詞出現的高峰要比一個地區醫院急診室流感患者增加出現的時間早兩三個星期(而急診室的報告往往要比瀏覽慢兩個星期左右);而在在經濟預測方面,Google 上房產相關搜尋量的增減趨勢相對於地產經濟學家的預測而言是一個更加準確的預言者。
另一方面,目前由於資料量和技術等限制,輿情研究還主要集中在危機應對和品牌營銷等方面,這種應用主要基於輿情監測和研判這一功能進行的,未來隨著大資料在輿情研究中的使用,輿情研究的功能指向必將更加多元化,為政府門、企業和個人提供更加綜合化的資訊挖掘服務部。