上個星期,英特爾大資料技術全球 CTO、大資料分析和人工智慧創新院院長戴金權為我們分享了英特爾最近的工作。
「英特爾希望提供端到端全棧人工智慧產品和軟體的技術棧。」戴金權表示。「從硬體角度來說,我們擁有從 CPU、GPU、FPGA 到各種 AI 加速器,從邊緣到資料中心的全面佈局。從軟體層面上,我們也做了非常多的工作。」
從 oneAPI 到 OpenVINO、Analytics Zoo 等等軟體工具,英特爾一直以來都希望能夠透過軟硬協同來推動人工智慧和資料分析的創新。在去年 6 月份,這家公司設立了「大資料分析和人工智慧創新院」,希望透過統一的資料分析和人工智慧工具推動 AI 技術應用落地。
據介紹,大資料分析和人工智慧創新院總部設立在中國,現在它在中國和美國矽谷都有研究團隊協同工作。
「通常,資料科學家會在自己的筆記本上使用樣本資料構建原型,其可能是基於 Python 的文字,如果原型工作得不錯。下一步要做的就是利用大量資料進行實驗。」戴金權介紹道。而在大資料叢集環境中進行實驗與部署上線,一直是很多開發者們面臨的挑戰。
英特爾希望能夠讓人們能夠在筆記本上構建端到端的流水線,工具可以直接訪問生產資料,AI、大資料應用從筆記本到生產環境中、分散式環境中不需要做任何修改。
英特爾創新院致力於應用技術的研究,其主要方向由三部分組成:首先是前沿創新研究,近一年來,英特爾和內部、外部的研究機構聯合,一些研究成果已在線上學術會議上進行了展示。
第二部分是技術開源,這家公司已把技術研究透過開源軟體平臺的方式分享出來。在今天的科技領域,大資料分析、人工智慧等基礎架構基本都是基於開源軟體技術的。
此外還有應用落地。「當我們有了這樣的開源軟體和技術之後,我們會與自己的客戶、合作伙伴等等一起合作,將這些技術應用在他們的產品服務或者是應用系統當中,這是我們大資料分析和人工智慧創新院所做的三件事情。」戴金權說道。
最近的一年多時間裡,英特爾還推動了機器學習工作流的進一步擴充套件,戴金權還表示英特爾正在研究 AI 自動化構建工具:「我們進行了很多 AutoML 的探索。以及大規模分散式自動推理的服務。在 CVPR2020 上我們會展示如何在大規模分散式環境中進行自動化機器學習工作流程。」
這些前沿研究也會透過開源軟體平臺進行落地,包括 BigDL、AnalysisZoo 等。英特爾還會在即將進行的 CVPR 2020 大會上開辦活動介紹這些最新技術(Automated Machine Learning Workflow for Distributed Big Data)。
2018 年推出的 AnalysisZoo 被英特爾定義為存在於深度學習框架之上的高階平臺。「某種程度上來看,使用者對於使用哪種框架並不是非常敏感,」戴金權表示。「如何能夠使用最優方法實現最優效果才是最重要的。」
Analysis Zoo 構建於英特爾的 One API 之上,在這個基礎之上該工具還能透過 AutoML 的方法構建出自動化的流水線。
在活動中,英特爾向我們介紹了一系列合作案例,如阿里雲的 E-MapReduce 開源大資料服務上整合的 Analytics Zoo,可在其服務上直接執行深度學習應用。去年,英特爾也與阿里雲在 Flink 上進行了合作,在阿里天池大賽上利用 Flink、Analytics Zoo 實現了實時的垃圾分類檢測的工作。