音視訊技術開發週刊65期

LiveVideoStack發表於2018-09-04
版權宣告:本文為博主原創文章,未經博主允許不得轉載。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/82392657

640?wx_fmt=jpeg

音視訊技術開發週刊』由LiveVideoStack團隊出品,專注在音視訊技術領域,縱覽相關技術領域的乾貨和新聞投稿,每週一期。點選『閱讀原文』,瀏覽第65期內容,祝您閱讀愉快。


架構


51Talk音視訊技術實踐和獨特挑戰

本文來自51Talk技術總監陳靖在LiveVideoStackCon 2018熱身分享,並由LiveVideoStack整理而成。陳靖回顧了51Talk音視訊技術的演進路線,從最早的QQ、Skype到接入第三方SDK,最後實現大部分功能自研,每個階段都是根據業務需求、研發力量、資金投入等各種條件下的最優選擇。未來,51Talk還會繼續投入自研,完善功能。


李青源:高清體驗和頻寬節省,瞄準方向深耕

在LiveVideoStackCon 2018前夕,金山雲資深產品專家李青源接受了LiveVideoStack的採訪。他聊到了金山雲在“視訊+AI”和“編解碼”方向的探索,致力於為終端觀眾提供更高清的視覺體驗,為B端客戶最大化的節省傳輸成本。


基於WebRTC和Janus的多人視訊會議系統開發 – 釋出媒體流到Janus伺服器

本文詳細介紹了基於WebRTC和Janus的多人視訊會議系統開發中如何釋出媒體流到Janus伺服器。


七牛雲徐晶:低延遲互動時代看好WebRTC和SRT

在 LiveVideoStackCon 2018 前夕,七牛雲教育行業解決方案高階專家徐晶接受了 LiveVideoStack 的採訪,聊到了流媒體的技術發展與技術棧迭代。在當今的低延遲的互動時代,WebRTC、SRT 等技術得到了快速發展。


無需GPU,只用OpenCV和Python實現影像和視訊的風格遷移

本文中作者Adrian Rosebrock將教你如何用OpenCV、Python和深度學習技術對影像和實時視訊進行神經風格遷移。


AI時代的全鏈路監控,阿里工程師怎麼做?

全鏈路監控從業務的視角出發,監控整個業務流程的健康狀況,無需多個系統切換,直觀看到全域性和上下游,方便快速發現、定位問題。今天,我們一起來看看阿里基礎設施技術團隊在這方面的實踐經驗。


WebRTC+libwebsockets+Janus的秒開實踐

Janus作為SFU,使用WebSocket協議與客戶端通訊。客戶端在挑選開源庫時其實沒有太多選擇,C層主要是libwebsockets庫,這個也是Janus使用的庫,還有Boost的Beast庫。


音訊/視訊技術


Introduction to Digital Filters(數字濾波器簡介)

數字濾波器由數字乘法器、加法器和延時單元組成的一種演算法或裝置。數字濾波器的功能是對輸入離散訊號的數字程式碼進行運算處理,以達到改變訊號頻譜的目的。本文簡單介紹了數字濾波器理論,分析,設計和應用。


拋開Flash,自己開發實現C++ RTMP直播流播放器

RTMP是以Flash為客戶端播放器的直播協議,主要應用在B/S形式的場景中。本文介紹使用C++開發實現了RTMP直播流協議的播放器,結合RTMP直播採集端,可以將RTMP協議完全擴充套件到C/S形式的應用場景中。


實時音視訊SDK功能介紹

音視訊SDK可以嵌入App,Web應用及各種智慧硬體中,幫助企業快速實現音視訊功能,極大提高效率,讓企業可以集中時間在業務上。即構實時音視訊SDK經過多年開發積累,已廣泛應用在各種領域和應用場景中。


基於RTMP資料傳輸協議的實時流媒體技術研究

本文來自論文《基於 RTMP 協議的流媒體技術的原理與應用》,文中研究了基於 Flash 平臺的流媒體系統中使用的 RTMP 協議的原理和應用,並對網路上實時流媒體的各種傳輸方式的優缺點進行了分析。


編解碼


Android使用FFmpeg+OpenGL ES來解碼播放視訊(一)

本文主介紹使用FFmpeg解碼視訊然後用OpenGL ES來渲染。實現思路:1.首先通過JNI將視訊地址傳給C層;2.使用FFmpeg解碼視訊獲取到YUV資料;3.將YUV資料通過回撥的方式傳到Java層;4.使用OpenGL ES渲染YUV資料; 


使用FFmpeg 提取MKV檔案中的字幕

MKV封裝格式是萬能封裝格式,可以封裝幾乎所有的視訊和音訊編碼格式。可以包含多個視訊流、音訊流和字幕流。本文將介紹使用FFmpeg 解碼視訊檔案,提去字幕內容並儲存。這裡僅提取ASS格式的字幕檔案。


使用MediaCodec和RTMP做直播推流

目前開源的專案或市面上的Android直播客戶端主要是用ffmpeg來實現推流的。本文將介紹使用Android原生的視訊編碼類MediaCodec實現直播推流。


熵編碼:CABAC的上下文環境

在CABAC編碼中,對每一個符號(即經過二值化的語法元素中的每一個bit值),都會經過一個構建模型階段,即為該符號分配一個概率分佈模型。在隨後的編碼階段,算術編碼器核心會根據這個概率模型進行編碼,生成輸出的二進位制位元流。


AI智慧


深度學習中的Normalization模型

BN 是深度學習進展中里程碑式的工作之一,無論是希望深入瞭解深度學習,還是在實踐中解決實際問題,BN 及一系列改進 Normalization 工作都是繞不開的重要環節。


時序異常檢測演算法概覽

Statsbot CTO Pavel Tiunov簡要介紹了最流行的時序異常檢測演算法,並討論了它們的優點和缺點。


清華&商湯開源超高精度邊緣感知人臉對齊演算法

人臉對齊是找到人臉位置之後,再找出人臉特徵點的位置,比如鼻子左側,鼻孔下側,瞳孔位置,上嘴脣下側等等點的位置。可以理解成面部特徵點定位或者人臉五官定位。這項技術的應用很廣泛,比如自動人臉識別,表情識別以及人臉動畫自動合成等。


DenseNet詳解

作為CVPR2017年的Best Paper,DenseNet脫離了加深網路層數(ResNet)和加寬網路結構(Inception)來提升網路效能的定式思維,從特徵的角度考慮,通過特徵重用和旁路(Bypass)設定,既大幅度減少了網路的引數量,又在一定程度上緩解了gradient vanishing問題的產生。


一文看懂深度學習新王者「AutoML」:是什麼、怎麼用、未來如何發展?

AutoML和神經架構搜尋(NAS),是深度學習領域的新一代王者。這些方法能快糙猛地搞定機器學習任務,簡單有效,高度符合當代科技公司核心價值觀。


影像


乾貨——影像分類(上)

乾貨——影像分類(下)

影像分類,顧名思義,是一個輸入影像,輸出對該影像內容分類的描述的問題。它是計算機視覺的核心,實際應用廣泛。影像分類的傳統方法是特徵描述及檢測,這類傳統方法可能對於一些簡單的影像分類是有效的,但由於實際情況非常複雜,傳統的分類方法不堪重負。


HDR關鍵技術:色度學,顏色空間及轉換

本文中,我們將首先介紹人眼與色度學相關的生理特徵以及人類對顏色的識別方式,然後介紹顏色空間的概念,最後再回到HDR,介紹與HDR相關的顏色標準。


HDR關鍵技術:質量評價技術(續)

在上一篇HDR質量評價帖中,我們列舉了業內常見的HDR質量評估演算法,然而不同演算法有不同的應用領域。本文將結合重要的HDR技術,進一步描述HDR質量評價技術。本文評價物件將包括色調對映技術,逆色調對映技術,視訊壓縮與編碼技術。


相關文章