記一次翻譯工具的開發-有了它，實現實時翻譯還遠嗎？

Al發表於2020-10-10

原文網址 : https://www.cnblogs.com/alchemystar/p/13791094.html

有了它，實現實時翻譯還遠嗎？

最近，某水果手機廠在萬眾期待中開了一場沒有釋出萬眾期待的手機產品的釋出會，釋出了除手機外的其他一些產品，也包括最新的水果14系統。幾天後，更新了系統的吃瓜群眾經過把玩突然發現新系統裡一個超有意思的功能——翻譯，比如這種：

奇怪的翻譯知識增加了！

相比常見的翻譯工具，同聲翻譯工具更具有實用價值，想想不精通其他語言就能和歪果朋友無障礙交流的場景，真是一件美事，不如自己動手實現個工具備用!一個同聲翻譯工具，邏輯大概可以是先識別，而後翻譯，翻譯能否成功，識別的準確率是個關鍵因素。為了降低難度，我決定分兩次完成工具開發。首先來實現試試語音識別的部分。

輕車熟路，本次的demo繼續呼叫有道智雲API，實現實時語音識別。

效果展示

先看看介面和結果哈：

可以選擇多種語音，這裡只寫了四種常見的：

偶分別測試的中文、韓文、英文。看著還不錯哦~

呼叫API介面的準備工作

首先，是需要在有道智雲的個人頁面上建立例項、建立應用、繫結應用和例項，獲取呼叫介面用到的應用的id和金鑰。具體個人註冊的過程和應用建立過程詳見文章分享一次批量檔案翻譯的開發過程

開發過程詳細介紹

下面介紹具體的程式碼開發過程。

首先是根據實時語音識別文件來分析介面的輸入輸出。介面設計的目的是對連續音訊流的實時識別，轉換成文字資訊並返對應文字流，因此通訊採用websocket，呼叫過程分為認證、實時通訊兩階段。

在認證階段，需傳送以下引數：

引數	型別	必填	說明	示例
appKey	String	是	已申請的應用ID	ID
salt	String	是	UUID	UUID
curtime	String	是	時間戳（秒）	TimeStamp
sign	String	是	加密數字簽名。	sha256
signType	String	是	數字簽名型別	v4
langType	String	是	語言選擇，參考支援語言列表	zh-CHS
format	String	是	音訊格式，支援wav	wav
channel	String	是	聲道，支援1（單聲道）	1
version	String	是	api版本	v1
rate	String	是	取樣率	16000

簽名sign生成方法如下：
signType=v4；
sign=sha256(應用ID+salt+curtime+應用金鑰)。

認證之後，就進入了實時通訊階段，傳送音訊流，獲取識別結果，最後傳送結束標誌結束通訊，這裡需要注意的是，傳送的音訊最好是16bit位深的單聲道、16k取樣率的清晰的wav音訊檔案，這裡我開發時最開始因為音訊錄製裝置有問題，導致音訊效果極差，介面一直返回錯誤碼304（手動捂臉）。

Demo開發：

這個demo使用python3開發，包括maindow.py，audioandprocess.py，recobynetease.py三個檔案。介面部分，使用python自帶的tkinter庫，來進行語言選擇、錄音開始、錄音停止並識別的操作。audioandprocess.py實現了錄音、音訊處理的邏輯，最後通過recobynetease.py中的方法來呼叫實時語音識別API。

介面部分：

主要元素：


root=tk.Tk()
root.title("netease youdao translation test")
frm = tk.Frame(root)
frm.grid(padx='80', pady='80')
# label1=tk.Label(frm,text="選擇待翻譯檔案：")
# label1.grid(row=0,column=0)
label=tk.Label(frm,text='選擇語言型別：')
label.grid(row=0,column=0)
combox=ttk.Combobox(frm,textvariable=tk.StringVar(),width=38)
combox["value"]=lang_type_dict
combox.current(0)
combox.bind("<<ComboboxSelected>>",get_lang_type)
combox.grid(row=0,column=1)

btn_start_rec = tk.Button(frm, text='開始錄音', command=start_rec)
btn_start_rec.grid(row=2, column=0)

lb_Status = tk.Label(frm, text='Ready', anchor='w', fg='green')
lb_Status.grid(row=2,column=1)

btn_sure=tk.Button(frm,text="結束並識別",command=get_result)
btn_sure.grid(row=3,column=0)

root.mainloop()

2、音訊錄製部分，引入pyaudio庫（需通過pip安裝）來呼叫音訊裝置，錄製介面要求的wav檔案，並通過wave庫儲存檔案：

def __init__(self, audio_path, language_type,is_recording):
    self.audio_path = audio_path,
    self.audio_file_name=''
    self.language_type = language_type,
    self.language=language_dict[language_type]
    print(language_dict[language_type])
    self.is_recording=is_recording
    self.audio_chunk_size=1600
    self.audio_channels=1
    self.audio_format=pyaudio.paInt16
    self.audio_rate=16000

def record_and_save(self):
    self.is_recording = True
    # self.audio_file_name=self.audio_path+'/recordtmp.wav'
    self.audio_file_name='/recordtmp.wav'

    threading.Thread(target=self.record,args=(self.audio_file_name,)).start()

def record(self,file_name):
    print(file_name)
    p=pyaudio.PyAudio()
    stream=p.open(
        format=self.audio_format,
        channels=self.audio_channels,
        rate=self.audio_rate,
        input=True,
        frames_per_buffer=self.audio_chunk_size
    )
    wf = wave.open(file_name, 'wb')
    wf.setnchannels(self.audio_channels)
    wf.setsampwidth(p.get_sample_size(self.audio_format))
    wf.setframerate(self.audio_rate)

    # 讀取資料寫入檔案
    while self.is_recording:
        data = stream.read(self.audio_chunk_size)
        wf.writeframes(data)
    wf.close()
    stream.stop_stream()
    stream.close()
    p.terminate()

3、翻譯介面呼叫部分：

def recognise(filepath,language_type):
    global file_path
    file_path=filepath
    nonce = str(uuid.uuid1())
    curtime = str(int(time.time()))
    signStr = app_key + nonce + curtime + app_secret
    print(signStr)
    sign = encrypt(signStr)

    uri = "wss://openapi.youdao.com/stream_asropenapi?appKey=" + app_key + "&salt=" + nonce + "&curtime=" + curtime + \
          "&sign=" + sign + "&version=v1&channel=1&format=wav&signType=v4&rate=16000&langType=" + language_type
    print(uri)
    start(uri, 1600)


def encrypt(signStr):
    hash = hashlib.sha256()
    hash.update(signStr.encode('utf-8'))
    return hash.hexdigest()



def on_message(ws, message):
    result=json.loads(message)
    try:
        resultmessage1 = result['result'][0]
        resultmessage2 = resultmessage1["st"]['sentence']
        print(resultmessage2)
    except Exception as e:
        print('')

def on_error(ws, error):
    print(error)


def on_close(ws):
    print("### closed ###")


def on_open(ws):
    count = 0
    file_object = open(file_path, 'rb')
    while True:
        chunk_data = file_object.read(1600)
        ws.send(chunk_data, websocket.ABNF.OPCODE_BINARY)
        time.sleep(0.05)
        count = count + 1
        if not chunk_data:
            break
    print(count)
    ws.send('{\"end\": \"true\"}', websocket.ABNF.OPCODE_BINARY)



def start(uri,step):

    websocket.enableTrace(True)

    ws = websocket.WebSocketApp(uri,
                                on_message=on_message,
                                on_error=on_error,
                                on_close=on_close)

    ws.on_open = on_open
    ws.run_forever()

總結

有道智雲提供的介面一如既往的好用，這次開發主要的精力全都浪費在了由於我自己錄製的音訊質量差而識別失敗的問題上，音訊質量ok後，識別結果準確無誤，下一步就是拿去翻譯了，有了有道智雲API，實現實時翻譯也可以如此簡單！

Translate Tab for Mac快速實時翻譯工具
2020-11-16
Mac
蝴蝶書-task2: 文字推理、摘要、糾錯 transformers實現翻譯 OpenAI翻譯 PyDeepLX翻譯 DeepLpro翻譯
2024-04-29
ORMOpenAI
有ppt文件翻譯軟體嗎？如何翻譯整篇ppt文件
2019-08-16
.net core 和 WPF 開發升訊威線上客服系統：呼叫有道翻譯介面實現實時自動翻譯的方法
2022-02-21
快速實現語音轉文字，還自帶翻譯
2019-06-25
[翻譯] 使用JavaScript實現自己的Promises
2018-12-26
JavaScriptPromise
.net core 和 WPF 開發升訊威線上客服系統：呼叫百度翻譯介面實現實時自動翻譯
2022-05-30
語音翻譯軟體怎麼用？怎麼實現語音的翻譯
2019-08-20
做好工作不可缺少的快速實時翻譯工具Translate Tab
2020-11-06
別開心太早，Python 官方文件的翻譯差遠了
2019-03-30
Python
記一次翻譯站經歷
2019-01-17
你想擁有《流浪地球》裡的及時翻譯神器嗎？
2019-06-18
實用的Word文件翻譯方法分享，讓Word文件快速翻譯
2019-08-12
《Node.js 開發實戰》翻譯歷程
2018-12-12
Node.js
隨心譯——無廣告的專屬實時翻譯神器
2021-02-05
如何用PaddlePaddle實現機器翻譯？
2019-05-28
使用 FastGPT 實現最佳 AI 翻譯工作流：全世界最信達雅的翻譯
2024-10-31
ASTGPTAI
微信翻譯大型翻車現場？機器翻譯到底有哪些不確定性
2019-03-05
分享一次批量文件翻譯的開發過程
2020-09-10
PHP 7:真實世界的應用開發（中文翻譯）
2020-10-04
PHP
[譯]記一次Kotlin官方文件翻譯的PR(內聯類)
2018-12-21
Kotlin
教你如何利用C#呼叫百度翻譯API實現一個翻譯功能
2021-07-13
C#API
Go 語言實現解析器翻譯
2018-05-13
Go
IDL封裝百度翻譯API實現自動翻譯和語種識別
2024-06-26
封裝API
該翻譯 laravel 10 了
2023-02-28
Laravel
翻譯
2020-12-29
用python實現簡單的線上翻譯程式
2020-09-23
Python
實用的線上翻譯工具：Translatium for Mac中文版
2024-01-23
Mac
騰訊互動翻譯的坑爹翻譯
2024-12-10
神經機器翻譯實戰
2018-12-22
Ubuntu安裝劃詞翻譯軟體Goldendict 單詞翻譯句子翻譯
2021-01-05
UbuntuGo
Laravel 配合 puppeteer 實現操作瀏覽器（以谷歌翻譯為例，免費翻譯無限量文字）
2020-02-18
Laravel瀏覽器谷歌
中國翻譯協會：2022中國翻譯人才發展
2022-04-01
如何完成中文翻譯日文線上翻譯
2019-09-23
Java實現Web操作介面以及返回資料的翻譯
2018-12-17
JavaWeb
[翻譯] 除錯 Rxjs（一）：工具
2018-12-17
除錯JS
翻譯：《實用的Python程式設計》InstructorNotes
2021-04-24
Python程式設計Struct
python 爬蟲簡單實現百度翻譯
2020-04-14
Python爬蟲

記一次翻譯工具的開發-有了它，實現實時翻譯還遠嗎？

有了它，實現實時翻譯還遠嗎？

效果展示

呼叫API介面的準備工作

開發過程詳細介紹

總結

相關文章