ASR專案實戰-任務佇列在檔案轉寫特性中的應用

jackieathome發表於2023-12-31

原文網址 : https://www.cnblogs.com/jackieathome/p/17935681.html

佇列

轉寫時長超出60秒的語音檔案，業界的競品通常會使用建立非同步轉寫任務的方式來提供支援。
一個簡單、直接的實現方案，即：

閘道器服務接收到來自客戶的轉寫請求時，將任務資訊持久化至任務佇列中。
由演演算法服務的例項從任務佇列中提取任務，並執行轉寫操作。
待執行完畢之後，將轉寫結果儲存至DB中，供呼叫方查詢。

本文主要針對介紹任務佇列的要求和選型。

在語音識別的檔案轉寫的場景下，對於任務佇列的常規訴求：

允許多個生產服務向佇列中增加任務。
允許多個消費服務從佇列中提取任務。
任務佇列自身具備可靠性，避免自身成為影響整體系統可靠性的單點。
任務佇列的讀、寫操作，效率滿足業務要求，避免成為影響整體系統效率的單點。
單個任務，僅支援由一個消費服務提取和處理。
消費方在處理某指定的任務時，假如超時或者失敗，則要求將任務重新放回到佇列中，由其它消費服務的例項完成任務的處理。
消費方的例項異常重啟後，該例項上當前正在處理的任務，需要重新被抓取至原例項或者新例項上，繼續處理。

對於5、6，一般可以理解為任務的事務性。

關於實現任務佇列的可選方案，一般有如下幾種：

Redis
Kafka
DB（比如MySQL）

一般而言，Kafka、Redis自身可以滿足上述要求中的1、2、3、4，實現並不困難，但5、6，則存在一定的困難。
而基於DB的方案，可以很好的滿足1、2、5、6，但在提供3、4時存在一定的困難。此外，當消費方的例項的數量增加時，由於需要採用輪詢的方式來提取任務，可能導致DB的CPU佔用率有所提升。當任務的併發度提升時，容易出現死鎖的現象，或者提升DB處理資料行鎖的開銷。

語音識別業務中檔案轉寫請求的特點：

當前的使用者呼叫總量相對比較低。
同一時間，來自客戶的請求的併發度比較低。
使用者對於時延的敏感度相對比較低。
使用者對轉寫任務的成功率有比較高的訴求。

綜合考慮專案組當前的人力情況、技術儲備情況、交付進度的要求，選擇了基於DB來實現任務佇列的方案。

在DB中新建任務佇列表，包含如下欄位：

任務ID，唯一標識。
建立時間，用於後續計算任務端到端轉寫時間。
任務結束時間，用於後續計算任務端到端轉寫時間。
任務狀態，當前任務處於排隊中、處理中、處理結束、失敗。對於失敗的任務，假如重試次數低於門限值，則需要重試。
鎖定時間，用於確定任務是否超時，超時的任務需要重試。超時時間的定義，需要綜合檔案轉寫的實時比和語音檔案自身的時長，給出恰當的定義，避免失敗後等待過長的時間才能觸發重試。
當前處理任務的例項的標識，用於確定任務當前由哪個例項在轉寫。當演演算法服務的例項重啟時，可以載入本例項相關的任務，執行重試操作。
重試次數，系統需要提供自動重試的能力，可以規避某特定例項自身的問題導致的失敗的現象，降低運維人員主動介入處理時的工作量。但不能無限制重試，需要定義重試的次數。

參考資料

[筆記] 關於任務佇列在專案中的使用
2018-09-15
筆記佇列
Redis 實戰 —— 09. 實現任務佇列、訊息拉取和檔案分發
2021-01-28
Redis佇列
專案實戰之gradle在實際專案中的使用
2018-05-09
Gradle
ASR專案實戰-交付過程中遇到的核心崩潰問題
2024-01-03
web開發實戰教程：Apache Shiro在web專案中的應用
2018-09-05
WebApache
如何寫一個任務佇列
2018-04-02
佇列
專案實戰之Rxjava、RxBinding在實際專案中的使用
2018-05-24
RxJava
Laravel Queues 佇列應用實戰
2021-02-22
Laravel佇列
Redis在Web專案中的應用與實踐
2019-02-17
RedisWeb
Redis 在 Web 專案中的應用與實踐
2019-02-21
RedisWeb
專案管理系統中的任務和專案
2023-03-29
專案管理
(轉)開源的任務佇列服務HTQ
2019-02-16
佇列
淺談設計模式在iOS開發實戰專案中的應用
2019-03-01
設計模式iOS
在專案管理中，專案成員不能及時完不成任務，應該怎麼做?
2018-09-20
專案管理
專案實戰！接入分散式定時任務框架
2022-03-25
分散式框架
延時佇列我在專案裡是怎麼實現的？
2022-06-06
佇列
JWT在專案中的簡單應用
2020-10-08
JWT
UI2 在專案中的應用
2024-07-14
UI
ASR專案實戰-交付過程中遇到的疑似記憶體洩漏問題
2024-01-03
記憶體
webpack實戰（二）：真實專案中應用系統配置
2018-06-22
Web
詳解ASR語音轉寫場景下的應用
2023-01-10
Celery任務佇列
2019-02-16
佇列
php解析mpp檔案中的前置任務
2018-04-10
PHP
go語言實戰教程：Redis實戰專案應用
2019-04-18
GoRedis
Python中任務佇列-芹菜celery的使用
2021-07-07
Python佇列
PFMEA在專案風險管理中的應用
2021-12-08
任務佇列,巨集任務與微任務
2020-04-05
佇列
C++檔案操作實戰：建立、寫入、讀取、修改檔案一應俱全
2024-03-17
C++
兩個專案用訊息佇列通訊
2020-03-15
佇列
研發專案如何配置看板的任務流轉
2021-10-05
QA在整個專案中的職責和任務情況
2020-11-21
靶場專案編寫實戰
2023-02-24
專案管理軟體在企業中的應用
2020-05-29
專案管理
Zustand：狀態持久化在專案中的應用
2024-08-25
持久化
關於 fontawesome 庫在 Spartacus 專案中的應用
2023-04-04
Jaeger鏈路追蹤在專案中的應用
2022-06-08
實戰專案 10: 貨物清單應用
2018-04-11
AI大模型+低程式碼，在專案管理中的應用實踐
2023-04-25
AI大模型專案管理

ASR專案實戰-任務佇列在檔案轉寫特性中的應用

參考資料

相關文章