《科創板日報》（上海，記者黃心怡）訊，人工智慧已經走過了60多年的歷程，當前正處於第三次發展浪潮之中。各類科技企業、網際網路巨頭、初創公司等都紛紛投入人工智慧產業之中，也吸引了大量資本的湧入。但在人工智慧的熱潮之下，同樣需要冷思考。

近日，英特爾院士、大資料技術全球CTO戴金權接受了《科創板日報》記者的專訪，探討人工智慧和大資料的應用瓶頸、擴充方向以及數字經濟所帶來的機遇。

他表示，人工智慧當前還處於一個比較早期的階段， 從開發者和實驗室走到現實的生產環境，在這個過程中存在一定的脫節。如何針對不同的場景做適配，以及如何實現整個端到端的流水線打通，都有比較大的挑戰。

但戴金權依然對人工智慧未來表示看好。他認為，除了安防外， AI在製造業、資料中心智慧運維、網際網路業務等領域都有很大的應用空間。

在談到數字經濟的機遇時，戴金權認為，人工智慧和大資料是數字經濟的基石。在數字化之後，必然會產生大量的資料。首當其衝的是需要對這些資料進行管理。其次， 在擁有大量的資料資產後，便可以利用大資料、AI技術對其進行分析，並以此來進行一些預測，甚至幫助人們做出決策。

▍以下是《科創板日報》整理的專訪實錄：

人工智慧尚處於早期階段

《科創板日報》：當前，AI賦能各行各業的時候遇到了很多難點，例如，AI在中長尾場景的應用非常碎片化，這意味著需求大量的定製化，較難實現大規模應用，不知道您如何看待這個問題？

戴金權：我同意你的說法，今天AI還處於比較早期的階段，雖然我們看到在實驗室裡、研究環境裡有很多的創新成果出來。但這些技術要落到現實的應用裡，仍舊存在許多挑戰。

比如， 從資料到處理再到AI模型，怎麼實現整個端到端的流水線打通；AI模型能否更好地針對各種場景進行最佳化，以及 AI依賴於定製化的軟硬體平臺難以擴充套件，如何做到普適化，讓更多人方便地應用AI。這些都是目前我們所遇到的難點。

雖說挑戰很多，但是我們依然很有信心。AI是一種技術，也是一個產業發展的方向，在未來必定大有可為。

《科創板日報》：國內企業正在研發預訓練大模型，試圖解決上述問題，您多年在英特爾從事全球性技術研發工作，從全球角度來看，大家會有哪些應對舉措？

戴金權：這取決於不同的技術路線。比如您剛剛提到的預訓練大模型，這是最近兩三年大家非常關注的一個方向——首先利用像Transformer這樣的新模型架構，在大量的模型上進行預訓練，之後再在下游的任務上進行適配和調優。目前無論是國內還是國外，大家都在做很多這方面的探索，其範圍涵蓋了自然語言處理領域、計算機視覺領域等。

去年，我們和漢堡王有一個合作，利用Transformer架構做了推薦系統上的一些嘗試，也達到了很好的效果。當然，這其中存在技術難點。當模型越來越大，所需要的資料量和對計算的需求也越來越大。除此之外，在進行部署的時候，對資源和計算速度的高要求都造成很大挑戰。

為此，英特爾對模型進行了各種各樣的最佳化。例如把浮點數運算轉換為整型運算，並且利用諸如VNNI、DL Boost等加速指令來幫助模型進行量化，以提高它的速度；對模型進行稀疏化等，使其在各種不同的硬體平臺上，從筆記本到嵌入系統，到邊緣伺服器，再到雲端的大算力，都能夠很好地進行部署，真正拓寬其應用。我們希望，透過硬體的加速，訓練模型架構上的創新，以及軟體的最佳化，綜合起來達到更好的效果。

從實驗室走向產業應用存在脫節

《科創板日報》：在碎片化的AI應用場景，資料量比較少，是導致模型訓練存在困難的原因，您對此怎麼看？

戴金權：這其實存在兩個問題，一是資料量不多，我們可以透過預訓練，或者透過遷移學習、多工學習、元學習等各種方法來解決。

二是， 有資料但沒有標籤，這是經常會遇到的情況。我們和合作夥伴工作的過程中會發現有資料，但 給資料打標籤本身的代價非常高。迄今為止，我們本質上還處於“監督學習”，仍舊需要在標籤上做更多努力。

目前有很多探索方向，比如大家都在積極探索的“無監督學習”、“自監督學習”等技術。至於是否到了非常成熟的階段呢？可能還沒有，但是我們仍舊認為這個方向是大有可為的。

《科創板日報》：除了碎片化需求， AI在落地和實施方面還存在哪些痛點？

戴金權：從開發人員的角度來看，在開發機上完成開發後，要在大規模的資料叢集上試驗，進行生產化部署，整個過程在今天來說還是有非常大的瓶頸。

特別是 很多的開發人員，就是一個資料科學家，並非專門做高效能運算、分散式計算的開發人員。為了把AI成功應用到生產環境當中，這些 資料科學家就需要在分散式大規模的場景上進行實際的部署，在整個過程中是有一些脫節的。

在這方面我們做了一些初步的工作，包括推出開源大資料專案BigDL 2.0。透過構建“資料+AI”的可擴充套件平臺，把AI應用或者流水線，能從筆記本無縫地擴充套件到分散式大規模的雲叢集當中去，做到在筆記本開發和在雲上開發是一樣的體驗。

這樣，資料科學家可以更加集中在自己想做的模型、演算法的創新上，而不用管底層大規模分散式如何進行，也不用管怎麼從筆記本遷移到雲裡。

資料是數字經濟發展的關鍵要素

《科創板日報》：中國正在大力發展數字經濟，今年兩會的政府工作報告上也提出要培育人工智慧等數字產業。近年來，AI主要在安防、公共安全等領域有一定應用，大量的公司也都集中在這個領域競爭。您是否看到，AI在其他行業有新的機會？

戴金權：安防當然是非常重要的一塊。英特爾也有物聯網事業部，在智慧攝像頭、智慧攝像機方面做了非常多的工作。

同時，中國是一個製造業強國，如何將這些AI計算機視覺技術應用到製造業之中，比如在缺陷檢測等方面，存在較大的發展空間。

此外，在電信運營商和資料中心領域，無論是基站還是資料中心的時序資料，都可以利用時序分析對其進行智慧運維；在通訊網路或者資料中心裡，透過AI預測負載變化來省電，進行更合理的資源排程和任務分配等；在網際網路業務或者是線上服務當中，則可以利用AI進行各種各樣的推薦以及內容挖掘。這些都是非常重要的應用舞臺。

在我看來， AI開始把大量的資料處理分析和深度學習、機器學習技術結合在一起，對場景進行適配或應用，的確帶來很多不同的新應用機會。不管是針對更精準的匹配，還是更好的質量檢測，或是想要更加綠色、環保、節能的發展，AI都有著很多的可能性。

大資料分析也是應用非常廣泛的技術，無論在國內還是國外，各行各業都有非常廣泛的應用。從某種意義來說，大資料分析也是今天數字經濟的一個基石。

《科創板日報》：您剛剛講到，大資料和AI技術都是數字經濟的基石。現在大家都很關注數字經濟領域的機會。不知道您如何看待數字經濟所涵蓋的上下游產業鏈，以及哪些技術應用更為核心關鍵？

戴金權：首先， 無論是資產、運作、還是生產活動，都在越來越多地進行數字化。而數字化之後必然會產生大量的資料。比如一個大城市，會擁有幾十萬、上百萬的基站，這些基站中的裝置每隔幾秒鐘就會產生大量的資料。首當其衝的便是如何對這些資料進行管理，包括儲存、處理等。

第二，在擁有資料資產之後，利用大資料技術，結合機器學習、深度學習的技術進行挖掘，得到所謂的“洞見”，即我們說的“有什麼趨勢、模型是什麼樣的”。在此基礎上我們便可以做預測，甚至幫助人們做一些決策。

像在電信行業，隨著5G網路的發展，對網路運維的要求越來越高，如何更好地分配頻寬和頻譜？對於5G網路的功耗問題，如何透過智慧調整來進行節能省電？這些都是在網路數字化的基礎上可以做的事。

《科創板日報》：當下，人工智慧算力需求的增長速度大大超過了晶片算力的進步，算力不足成為普遍現象，驅動計算架構從單一通用架構（CPU+GPU）到混合異構架構（CPU+GPU+FPGA+XPU），您對此的看法是？

戴金權： 英特爾的策略是XPU。這是一個超異構的架構，包括像CPU的標量計算、GPU的向量計算、FPGA這樣的空間計算以及各種各樣的加速器。英特爾已經做了相應的技術規劃，在XPU超異構的架構上提供不同的計算架構來支撐不同的計算應用。

但是，當存在很多不同的異構架構時，對軟體開發人員來說是一個非常大的挑戰。所以，我們提出了oneAPI策略，希望從軟體層幫助使用者在跨不同架構時，都能進行同樣的程式設計。透過oneAPI這樣的工具加上底層的計算庫等，提供一個非常無縫的程式設計體驗。然後在上層，能夠在XPU硬體架構以及oneAPI的軟體支援下，構建一個可擴充套件的“資料+AI”的平臺，給使用者帶來計算效率、開發體驗、開發效率的多維度提升。

英特爾大資料技術全球CTO戴金權：人工智慧和大資料是數字經濟的基石

相關文章