01 疫情下的線上需求與使用者體驗
弗裡德曼在《世界是平的》一書中提出,經濟全球化的發展程式中形成了三次浪潮,分別是勞動力密集型的全球化、資本密集型的全球化和知識密集型的數字全球化。數字化技術對全球商業環境帶來了深遠的影響,新冠疫情席捲全球,線上連線成為了溝通的主題,然而網路問題卻成為業務全球化的障礙。
由於疫情導致的實時線上需求暴漲,對於全球網路來說,首當其衝的流媒體和視訊會議的壓力劇增。為了防止網路出現擁堵和避免出現音視訊卡頓模糊的現象,YouTube、Netflix和Disney+等被迫降低使用者端解析度,以減輕頻寬壓力。而倉促上線的各類視訊會議服務更是一度集體崩潰。
由於疫情帶來的隔離和出行限制,線上文娛風口熱流湧動。據《南方週末》報導,中國人平均一天花在手機應用上的時間為196分鐘,有5億人以電競遊戲作為居家休閒的主要方式之一。但網路下載速度慢,遊戲掉線、卡頓等問題嚴重影響了使用者體驗。跨境電商購物遭遇訂單響應慢、支付失敗等問題,使用者流失將會非常嚴重。
02 網路問題制約著企業業務全球化的步伐
當前業務全球化成為了眾多主流網際網路公司的核心戰略。內容型業務也成為全球化的熱點,在中國企業的出海潮中也有很多體現。在以內容為潮流的出海網際網路企業中,遊戲、直播、線上教育、泛娛樂、辦公協作成為企業的熱門選項。
對於業務全球化,公司會將更多精力放到運營,底層的全球服務構建變得弱勢,然而往往很多業務在擴充中使用者體驗便是在底層基礎設施中卡殼。
在硬體配置高冗餘的當下,大多數互動、動作類遊戲應用考驗的不再是機器的配置,核心體驗在於操作反饋的及時性,全球不同地域的玩家是否能夠獲得實時暢快的體驗是遊戲運營方最基礎的保障。加之全球不同地域的區域同步、使用者每次登入遊戲的一次性成功率、連線的穩定性等多維的使用者訴求,遊戲運營商需要在籠統的“遊戲體驗”下做更精準的需求拆解和更優質的技術應對。
音視訊直播則更加考驗直播的清晰度、流暢度,曾經作為視訊網站的單選題,也在使用者體驗層次升級後變成了魚和熊掌兼得的選項。在全球不同地域覆蓋如何保障音視訊流暢訪問也成為關鍵,尤其是東南亞等電信基礎設施服務能力較弱的情況下依然能提供流暢的視聽體驗。
對於跨境電商、金融等場景,更加需要及時、穩定、快速資料同步的服務,這依然對網際網路出海應用的底層抗打擊能力提出了要求。
03 原生網際網路沒有QoS保障
網際網路提供的是Best-Effort(盡力而為)網路互聯服務,它的使命是盡最大可能地傳輸資料,因此它優先考慮的是連線性和可擴充套件性,但不保證將資料完整傳輸出去,也不保證使用者的時延、可靠性等QoS質量以及優先順序。
網際網路是由各個區域性網路組成的,沒有中心化管理和排程機制,全球性的網路傳輸需要跨多個網路。然而每個區域都由不同的ISP來運維,不同ISP根據服務提供規模和性質會有不同層級,不同層級ISP之間也有不同資料路由規則。
不同層級的ISP互聯
依託 BGP協議,ISP間的直連(Peering)和轉接(Transit)更加高效。這種組織方式保證了規模與可擴充套件性,但是作為代價降低了端到端網路通訊的可用性與質量。
一方面BGP沒有設計對持續擁塞、丟包、突發流量、延遲大等網路問題的檢測發現,只要還能通就繼續沿著原來路徑傳送,儘管從丟包延時抖動等引數上看網路已經嚴重惡化,大部分應用程式的體驗將會很糟糕,對實時性和質量敏感的應用則無法使用。假設上海電信到美國LA方向頻寬擁堵,造成丟包高達 30%,同時上海電信到香港方向頻寬富裕不丟包,BGP協議沒辦法做到捨棄直連,轉為從香港運營商轉接到美國LA從而改善質量。
另一方面當一條路徑確實不通時,BGP需要花費很長時間才能恢復,有實驗表明 10%的路徑無法實現 95%的可用性、35%的路徑可用性低於4個9(99.99%)、40%的路徑故障花費30分鐘以上才能修復、5%的路徑故障修復時間超過2小時45分鐘。
因此,Internet骨幹網的路由架構是為了相對簡單、高可擴充套件性優化的,它成功地支撐了過去幾十年Internet規模的幾何級數增長,背後的代價就是無法快速提供有 QoS 保障的網路傳輸。。
同時從使用者網路接入層面來看,WiFi、3G、4G、5G等多種接入方式,讓接入網路問題愈發複雜。3G、4G、5G無線訊號受區域影響不穩定,上下行頻寬有限。WIFI則受裝置限制,飽受效能參差不齊、訊號時好時壞、干擾嚴重等問題困擾。同時接入網的高複用比,高峰期流量擁塞問題顯著。
在使用網際網路提供的是Best-Effort(盡力而為)網路互聯服務時,取決於當前的負載情況會遇到不同程度的丟包、延時和頻寬限制。然而當前存在包括音視訊通訊、線上遊戲、移動金融、企業全球辦公、企業遠端協作、跨境電商、跨網跨區域的物聯網資料訊息同步,以及各類出海應用和海外使用者訪問國內源站等,都要求網路傳輸有確切定義的實時性與可用性,這些應用需要有更強大的QoS保障。
04 QoS保障背後的技術挑戰
我們對上文不同場景需求進行拆解中,可以將一些共性的訴求做一些歸納,看看業務全球化下網際網路應用QoS保障需要面對哪些挑戰。
挑戰一:全球網路基建參差不齊,跨網延遲大,弱網影響使用者體驗。
Speedtest釋出了2020年12月份全球網速排行榜,中國行動網路速率全球第四,是全球平均水平的三倍。而像印度,非洲,中亞,東南亞部分地區平均網速,只有中國的十分之一,相當於中國3G的年代。國內大部分的APP,出海都將面臨常見弱網問題。如頻寬受限,高峰期擁塞,丟包嚴重。對端側協議優化,業務優化提出更高的要求。
運營商間的資料互動介面複雜,導致跨運營商訪問延遲增加。在跨國連線中,國際海纜稀缺資源,跨大區服務頻寬有限,高峰期擁塞。同時運營商之間路由協商依賴人為配置,配置錯誤時有發生,導致流量黑洞。
挑戰二:分散式部署,跨區域高質量訪問構建成本高。
基於專線的跨區域訪問構建,單M成本千元以上,專線的計費模型,擴容方式也難以支撐業務快速的彈性擴充套件。在硬基礎設施的高成本下,需要更優的底層軟體技術降低成本,然而軟體的低成本帶來的是人力的大投入,這需要企業在業務發展中有更多的博弈。
挑戰三:公有云覆蓋有限,多雲複雜度高。
公有云通道往往受到網路頻寬、節點佈局等因素制約,跨境業務訪問還是面臨不少難題。出海企業所處行業不同,業務要求不一,加上出海的國家和地區在法律法規和IT基礎設施建設方面也存在很大差異。公有云大部分覆蓋的是已開發國家地區,在偏遠地區覆蓋則是空白,特別在非洲,南美,中亞地區。
多數企業選擇多雲的方式進行業務部署,這勢必又增加了複雜度。有些是跨地域的多個雲服務商,有些是同地域的多個雲服務商,還有背後更加複雜的運營商網路專線組合。複雜的電信運營商、雲服務商跨網問題成為區域覆蓋的挑戰。