IBM通過超級計算機使用大資料來解決大問題

翠花發表於2014-04-08

IBM喜歡大資料，獲取的越多，就越能向使用者銷售出更多的伺服器、儲存和服務。但是由於IBM獲取的大資料容量已經過大，導致這家公司的研發人員很難駕馭這些資料。

舉例來說，IBM位於矽谷阿爾馬登研究中心的專家勞拉·哈斯（Laura Haas）去年就曾詢問同事，她為什麼不能使用更大的資料集。哈斯當時就曾表示，單是準備資料就花費了他80%的時間。哈斯意識到，IBM研究時間被資料分析耗費的越多，該公司的專家就會耗費更多的時間和精力用於擴充套件資料集，從而放緩研發的步伐。

很明顯，這種事情應當交付給專業的資料科學家來解決，但是這樣的迴圈只能讓情況變得更加糟糕。還有，它似乎有悖於大資料的常規，因為依據儲存能力的擴充套件或是感測器成本的下滑，大資料的價值並不受摩爾法則或是克來德法則（Kryder’s Law，每10.5年硬碟驅動器的資訊密度就要增長1000倍，也就是說，每13個月儲存密度就要翻一番）支配。

當然，大資料更適用於“麥特卡夫定律” （Metcalfe’s Law）。該定律指出，網路的價值等於網路使用者數的平方數；增加網路和其他通訊技術的接入使用者數量，將獲得巨大效益。對IBM的研發人員而言，情況也確實如此。為解決這一問題，IBM矽谷阿爾馬登研究中心在去年秋季推出了“加速發現實驗室”（Accelerated Discovery Lab）。這個實驗室有著非常大、開放的空間，能夠裝配舒適的傢俱、白板以及許多的螢幕，更別提迴圈參與的專案團隊、系統管理員、訪問客戶、人類學家和IBM Watson超級計算機。正如這個實驗室的名稱所暗示的那樣，它的目標是使用多元化、鄰近、物理空間的最優組合破解程式碼。

目前擔任該實驗室技術和運營總監的哈斯對此表示，“我們把它稱為哺育‘戰略意外發現。’這就如同是在淋浴時或飲水機旁找到靈感一樣。我們希望把人們聚集在足夠寬闊的環境中，讓他們享受於此。通過利用房間的連線，資料的連線以及能夠掌握使用者正在做什麼的能力，培育意外發現。”

加速發現實驗室的第一個專案是利用Watson超級計算機在新領域的自然語言處理能力，藥物研究則是首選。通過與貝勒醫學院計算機生物學家的合作，IBM的資料科學家開始在數以百萬計的論文、專利和臨床研究中採集資料，並最終把他們的注意力集中在了腦腫瘤抑制基因TP-53上。在幾個月之內，研發團隊就找到了四個候選產品。“加速發現實驗室”展露額和專案開發總監傑夫·威爾瑟（Jeff Welser）表示，“通常找到一個產品就需要約一年的時間。”

這個速度確實已相當快，但能否更快一點？該實驗室的使命之一，便是對自有空間的研究假設。哈斯表示，“我們當前嘗試在專案開始就記錄下來，看看這些白板和螢幕能否會獲得明顯的成效。”

雖然IBM當前還沒有計劃在其它研發中心建造類似的實驗室，但是哈斯希望有朝一日能夠開發出一款軟體工具，幫助公司管理自有資源。

自：騰訊科技

邁阿密是如何通過大資料解決大難題的？
2014-05-04
大資料
函式計算因為資料量過大超時的解決方案
2018-03-06
函式
雲端計算大資料面試題，雲端計算大資料面試題集錦
2019-06-19
大資料面試題
使用Alluxio(前Tachyon)來加速大資料計算
2017-04-17
UX大資料
IBM:用大資料解決波士頓堵車難題
2012-06-30
IBM大資料
全球最快的十大超級計算機–資訊圖
2013-08-28
計算機
基於vue解決大資料表格卡頓問題
2019-03-19
Vue大資料
PHP 程式設計師解決問題 8 大級別的能力
2015-09-19
PHP程式設計師
解碼智慧治理用大資料解決民生小問題
2022-12-06
大資料
資料庫系列：大廠使用資料庫中介軟體解決什麼問題？
2024-03-05
資料庫
如何解決大資料安全問題
2021-01-09
大資料
全球頂級的超級計算機（附原資料表）
2020-12-25
計算機
解讀IBM超級計算機在預測分析領域的前景YE
2022-03-21
IBM計算機
大資料計算：結構化大資料計算的理想模式
2018-01-19
大資料模式
先進級！阿里雲大資料+AI平臺通過信通院資料平臺整體解決方案最高等級評測
2022-07-08
阿里大資料AI
解決超過會話數問題
2011-07-19
會話
通過註解完美解決混淆問題
2017-08-03
極光超級計算機將繪製人類大腦圖譜
2024-07-06
計算機
sbt配置——資料來源問題解決
2018-09-14
利用C語言小程式來解決大問題(轉)
2007-08-15
C語言
大資料面試問題
2021-12-24
大資料面試
【新聞】室溫超導體來了？可以在超級計算機上寫程式碼，用超級計算機打遊戲？
2024-03-27
計算機遊戲
大資料計算生態之資料計算（二）
2020-11-15
大資料
大資料計算生態之資料計算（一）
2020-11-15
大資料
轉：Oracle 臨時表空間過大問題解決
2008-09-18
Oracle
雲端計算和大資料
2017-12-29
大資料
大資料解決方案
2020-01-02
大資料
ElasticSearch第3篇大資料處理3大問題（“10000條”問題解決方案、hits total值統計總數不精確解決方案、大資料深度分頁效能問題3種最佳化方案）
2024-07-28
Elasticsearch大資料
通過Observable解決搜尋框問題
2018-10-22
通過 sysprocesses 解決Sql死鎖問題
2017-11-07
SQL
計算機小白大資料學習線路圖
2018-08-31
計算機大資料
超級詳細的闡述：大資料、雲端計算和人工智慧的關係
2018-12-29
大資料人工智慧
IBM、微軟聯合白宮部署超級計算機，對抗冠狀病毒
2020-03-23
IBM微軟計算機
快取過程存在的三大問題及解決方案
2019-08-27
快取
通過Oracle來輔助MySQL資料問題的恢復
2015-05-09
OracleMySql
【UNDO】使用重建UNDO表空間方法解決UNDO表空間過大問題
2009-11-23
大資料常見問題
2024-05-31
大資料
大資料實驗問題
2024-11-19
大資料

IBM通過超級計算機使用大資料來解決大問題

相關文章