百度自動內網流量排程進階實戰

天府雲創發表於2018-01-16

內網

從事服務管理、監控、平臺可用性建設相關工作。在分散式系統、大規模資料處理、可用性工程方向有廣泛的實踐經驗。

乾貨概覽

在前兩篇文章中，我們介紹了內網流量排程解決的核心問題，並以 qproxy 的實際使用場景進行了案例解析。

百度自動內網流量排程實踐

百度自動內網流量排程方案解析

0?wx_fmt=png

流量接入層根據從 BNS 獲取到的例項和相關配置資訊，實現流量排程功能。

本文將重點介紹配置分發和流量排程引擎的實現。

設計目標 – 通用的流量排程邏輯

由於百度各業務的複雜多樣，為了便於遷移和適配新的使用場景，我們需要通用、可擴充套件的執行框架來支援使用者自定義流量排程邏輯。例如，在例項列表中增加使用者自定義的標籤或配置資訊，實現定製化的功能。

通用的流量排程邏輯，可以讓我們適配儘可能多的流量接入方式。在實際的使用過程中，我們至少相容了以下流量接入方式：qproxy、nginx、rpc和其它使用者自研的流量接入層。

實現細節

為了降低實現複雜度以及接入成本，我們在 Naming Service 層增加了流量排程引擎的邏輯。

0?wx_fmt=png

Naming Service 負責配置分發。使用者通過 SDK 從本地服務端獲取服務單元和例項資訊。

上游服務呼叫 SDK 獲取例項列表，請求發給本地服務端，本地服務端通過遠端服務端獲取到原始例項列表，之後，由流量排程引擎根據原始例項列表和路由表中的路由規則，生成最終返回給 SDK的例項列表。

流量排程引擎

流量排程引擎是一組根據使用者使用場景實現的程式碼，它的功能是參考路由表和其它使用者配置，對例項資訊進行篩選和重組，最終返回給流量接入層，達到控制流量的目的。

它可以根據使用者的需求來自定義功能，例如：

參考上游請求的來源機房（可以是物理機房或邏輯機房）和路由表，決定返回上游來源所對應的下游機房中的例項。
根據流量接入層型別，在返回的例項列表中增加自定義的標籤資訊。

0?wx_fmt=png

路由表

下圖是一個實際的路由表，包含邏輯機房和物理機房的對映關係，路由規則，流量配比資訊：

0?wx_fmt=png

邏輯機房和物理機房的對映關係：為了便於管理，我們一般會將某個地域的叢集，按照邏輯機房的形式進行組織。用來規避物理機房的變更導致流量對映關係的頻繁調整。也便於批量配置和運維操作。
路由規則和流量配比：路由規則描述了上下游邏輯機房之間的對映關係，還有他們之間的流量配比。
流量配比的計算方法：在預設場景下，會根據流量配比計算出對應的例項數量。對於不同的邏輯機房，原始例項數量可能有相當大的差別。因此需要根據流量配比對例項進行補全或抽樣。

當然，以上描述的是理想情況。在實際的系統中，還存在例項數上限、按權值返回例項等場景和需求，需要針對這些場景進行處理。限於篇幅，這裡不詳細展開。

時效性

對於流量排程場景來說，排程生效時間是一個最關鍵的效能指標。它決定了從流量排程操作發起到流量實際生效之間消耗的時間。

以業務的止損場景為例，生效時間決定了止損操作的速度。更低的生效延遲意味著更快的止損和更低的收入損失。

在實現上，我們選擇了推拉結合的方式。即所有變更推送到客戶端，並保留輪詢服務端作為可用性保障的降級預案。這樣，在時效性指標的保障範圍內，實現了秒級別的變更延遲。

可用性

流量排程系統包含的配置分發和排程引擎都處於流量接入的核心環節。這部分系統的可靠性直接影響到上下游呼叫的成功率。

原則上，我們通過冗餘的方式，提升系統的整體可用性。在整個服務中，有多層次的快取。另外，在流量排程引擎方面，我們也實現了按機房的灰度釋出，縮小故障的影響範圍。

總結

通過以上三篇文章，我們為大家解析了百度內網流量排程系統。這是基於百度複雜的內網結構和多樣的業務，綜合考慮功能、成本、效能、可用性等指標的一種工程實踐。隨著DevOps 的不斷髮展，新的服務框架和方案不斷湧現。例如 istio，linkerd 等開源專案都為服務釋出、測試、追蹤等流量排程的典型場景提供了新的解決方案和思路。我們也將在這個方向上持續探索，後續會有更多的工程應用經驗與大家分享。

自動化測試進階課程——Selenium自動化測試通關實戰班
2020-01-08
UI自動化實戰進階後續
2021-02-07
UI
UI自動化實戰進階PO設計模式
2021-02-03
UI設計模式
實戰Docker容器排程
2020-09-23
Docker
Kubernetes Pod排程：從基礎到高階實戰技巧
2024-05-20
使用 K8s 進行作業排程實戰分享
2020-08-27
K8S
MySQL 進階實戰
2024-03-11
MySql
浪潮資訊助力國網浙江電力建成國內首家電網排程自動化模擬測試中心
2022-02-22
Python 爬蟲進階篇-利用beautifulsoup庫爬取網頁文章內容實戰演示
2020-09-14
Python爬蟲網頁
大資料排程器--單機版Apache DolphinScheduler 入門到實踐：進階
2024-10-16
大資料Apache
GitLab整合GPT進行自動化CodeReview實戰
2024-10-17
GitlabGPTView
程式猿進階之路“內網域名”
2018-08-31
內網
PostgreSQLrotatetable自動清理排程-約束，觸發器
2018-04-18
SQL觸發器
Go語言排程器之主動排程(20)
2019-05-28
Go
Elastic-job實戰(分散式作業排程框架)
2018-09-28
AST分散式框架
iOS AutoLayout進階(五)UITableViewCell自動高度
2019-03-04
iOSUIView
shell程式設計，實戰高階進階教學
2020-11-25
程式設計
TiDB 技術內幕 - 談排程
2018-03-08
TiDB
K8S 高階排程方式
2018-11-29
K8S
淺談APS生產排程在自動化排產考慮的約束
2024-10-30
Flink排程之排程器、排程策略、排程模式
2023-03-08
模式
Scala隱式轉換理論及進階實踐-Coding技術進階實戰
2019-01-10
Crane-scheduler：基於真實負載進行排程
2022-06-07
負載
網路攻防實戰演練前夕的實操秘籍：藍隊實戰技法進階班重磅來襲
2023-03-14
RobotFramework + Python 自動化入門四（Web進階)
2021-06-26
FrameworkPythonWeb
Oracle無法自動排程DBMS_JOB&DBMS_SCHEDULER案例分析
2022-12-08
Oracle
基於BGP協議的廣域網流量排程SDN控制器在銀行業的部署實踐
2018-06-13
協議行業
VIM 進階 —— 《VIM 8 文字處理實戰》
2020-03-06
Linux Capabilities 入門教程：進階實戰篇
2020-11-13
Linux
機器學習30天進階實戰
2020-04-04
機器學習
PassEncoder排程管線內的行為
2022-02-28
python進階（25）協程
2022-02-22
Python
python進階（17）協程
2021-04-25
Python
Kotlin協程快速進階
2019-01-01
Kotlin
CSS進階內容—浮動和定位詳解
2022-07-08
CSS
銳捷SAM+域名管理與多出口流量排程解決方案問世高校上網進入大資料時代
2018-05-10
大資料
測試進階高薪人才必備，分享Selenium自動化測試課程影片（23集）
2019-12-23
高薪
內網滲透—流量轉發
2020-07-12
內網
Python網路爬蟲進階：自動切換HTTP代理IP的應用
2024-01-16
Python爬蟲HTTP

百度自動內網流量排程進階實戰

相關文章