Twitter如何使用自然語言查詢實現下一代資料洞察?
在 Twitter,我們實時處理大約 4000 億個事件並每天生成 PB 級資料。Twitter 的各個團隊可以透過不同的方式利用這些資料為每個人構建更好的 Twitter。
從廣義上看,我們可以將一個全面而強大的大資料平臺的基礎設施和工具分為三類——資料處理、資料儲存和資料消費。在整個行業中,我們擁有強大的基礎架構來處理 PB 級資料(例如 Spark、Cloud Dataflow、Airflow)和儲存海量資料,例如分散式 blobstore(GCS、S3、Hadoop、Columnar DB、BigQuery)。然而,在透過儀表板、視覺化和報告從這些 EB 級資料平臺收集及時、有意義和可操作的見解方面仍然存在重大挑戰。
問題
行業中當前使用的資料消費產品的最大障礙之一是需要後臺處理,工程師和分析師需要在消費前建立儀表板、報告等。這會帶來挑戰:
- 降低資料的時間價值,從而影響 Twitter 及時做出資料驅動決策的能力。
- 增加從新屬性、功能和儀表板生成洞察的總成本。由於不斷變化的業務需求,工程師/分析師必須投資於儀表板/報告的持續開發和維護。
- 錯失良機,因為當前的工具無法根據我們的內部業務客戶可能認為有用的資訊來預測和主動從 EB 資料中獲得洞察力。目前,問題是人為發起的,而不是人為和平臺發起的。
解決方案
在過去的 20 年中,洞察產品從交叉表報告(90 年代後期)和儀表板(2000 年代)到沉浸式視覺化(2010 年代)已經走過了漫長的道路。隨著自然語言處理和機器學習的最新進展,有一個獨特的機會來消費來自 exa-scale 平臺的資料,以獲得直觀和及時的見解。
如果我們要滿足資料庫的臨時使用者的需求,我們必須突破目前阻礙這些使用者用母語來表達他們想要什麼的障礙:
我們建立了一個名為Qurious的內部產品,它允許我們的內部商業客戶用他們的自然語言提出問題。然後,他們就可以實時獲得洞察力,而不需要建立儀表盤。該產品包括一個網路應用程式和一個Slack聊天機器人,兩者都與BigQuery和Data QnA APIs整合。
步驟:
- 使用者在以下其中一個地方輸入問題。
- Slack聊天機器人
- 網路應用程式 - 問題從Google Cloud Load Balancer或NgRoutes被路由到Google Kubernetes Engine。
- 問題請求被轉發到Data QnA
- 資料QnA返回包含使用者問題的建議SQL查詢翻譯的響應
- SQL查詢翻譯被髮送到BigQuery執行。
- 出口代理(Egress Proxy)將來自查詢執行的資料路由到Qurious Slack App。雲負載平衡將來自查詢執行的資料返回給Qurious網路應用。
- 使用者的問題和返回的響應被儲存在Google Cloud Storage/Cloud SQL中。此外,還啟用了日誌和身份管理
詳細點選標題
相關文章
- MySQL — 資料查詢語言MySql
- 資料庫查詢語言(DQL)資料庫
- 如何使用 Milvus 向量資料庫實現實時查詢資料庫
- 關係型資料庫查詢語言 SQL 和圖資料庫查詢語言 nGQL 對比資料庫SQL
- MySql中的資料查詢語言(DQL)三:連線查詢MySql
- Go語言專案實戰:基於開源資料的成語查詢Go
- SSH:hiberate實現資料的查詢(單查詢和全查詢)
- 使用cglib實現資料庫框架的級聯查詢CGLib資料庫框架
- SQL語言(結構化查詢語言)SQL
- prometheus之查詢語言Prometheus
- Kibana查詢語言(KQL)
- 使用sql語句查詢平均值,使用sql語句查詢資料總條數, not in 篩選語句的使用SQL
- 資料庫查詢語句資料庫
- 資料庫原理實驗指導(三)使用SQL語言進行簡單查詢【轉載csdn】資料庫SQL
- NLA自然語言分析,讓資料分析更智慧!
- Excel資料庫轉MySQL,實現查詢Excel資料庫MySql
- mysql多表查詢如何實現MySql
- 達觀資料王文廣:如何玩轉自然語言理解和深度學習實踐?深度學習
- 你應該瞭解的流行圖資料庫查詢語言資料庫
- MongoRepository查詢資料常用語法Go
- 例項講解hadoop中的map/reduce查詢(python語言實現HadoopPython
- C語言實現雙連結串列的(終端)新增和查詢C語言
- 自然語言處理背後的資料科學自然語言處理資料科學
- 如何使用Java Streams進行資料庫查詢?Java資料庫
- 自然語言處理(NLP)系列(一)——自然語言理解(NLU)自然語言處理
- 函數語言程式設計:如何高效簡潔地對資料查詢與變換函數程式設計
- JAVA 中使用 SQL 語句查詢 EXCEL 檔案資料JavaSQLExcel
- SQL語言基礎(子查詢)SQL
- C# LINQ (語言整合查詢)C#
- OQL(物件查詢語言)在產品實現中造成的RCE(Object Injection)物件Object
- 檢視 Laravel 查詢資料語句Laravel
- 自然語言處理的最佳實踐自然語言處理
- 如何使用 JavaScript 實現一門程式語言(1) : 前言JavaScript
- Go語言ORM包:使用worm構造查詢條件GoWorm
- 二叉查詢樹(查詢、插入、刪除)——C語言C語言
- 解析MSSQL跨資料庫查詢的實現方法SQL資料庫
- 《自然》證實:計算機語言更類似人類語言計算機
- “超越” SQL 的資料查詢語言“新秀”Top8:GraphQL、PRQL、WebAssembly上榜SQLWeb