基於語音識別的會議記錄系統

silly_fox發表於2024-07-18

目錄
  • 核心功能頁面展示
  • 使用技術方案
  • 功能結構設計
  • 資料庫表展示

核心功能頁面展示

影片展示功能

1.建立會議

在開始會議之前需要管理員先建立一個會議,為了能夠快速開始會議,僅需填寫會議的名稱、會議舉辦小組、會議背景等簡要會議資訊即可成功建立。

2.語音識別會議記錄(最核心功能)

使用者選擇建立的會議參加,點選“開始識別”按鈕進行語音識別記錄會議內容。除此之外該頁面還提供停止識別、重置識別結果、選擇會議發言人、儲存結果等功能,幫助使用者應對不同的場景需求。

3.會議管理

使用者可以隨時檢視會議資訊,包括會議的名稱、主題、地點、主持人、出席人員、舉辦方、會議狀態、時間、會議記錄等詳細資訊,進行後續會議的回顧與整理。

4.會議資訊修改

使用者可以對已儲存的會議進行編輯,以糾正可能的錯誤或補充遺漏的資訊。同時在該頁面使用者可以查詢單個發言人的發言內容,以便提高會議的整理效率。

使用技術方案

1.語音識別技術方案(最核心)

在語音識別技術方面,我對比了科大訊飛實時語音識別、百度雲實時語音識別、騰訊實時語音識別以及Web Speech的API,最終在本系統中我選用了Web Speech API。Web Speech API的優勢在於它是瀏覽器原生支援的,無需額外安裝或配置任何外掛或SDK[22]。此外,Web Speech API是免費的,適用於各種Web應用,具有良好的跨平臺性。最主要是程式碼呼叫為最簡單的。

2.後端技術選擇

本系統後端部分採用Spring Boot作為主要框架,因為它簡化了Spring應用的初始搭建和開發過程,提供了開箱即用的配置方式,能夠讓開發者快速啟動專案[23]。MyBatis是一個持久層框架,它支援定製化SQL、儲存過程以及高階對映等功能,極大地減少了JDBC程式碼和手動設定引數以及結果集獲取的需求[24]。Shiro則是一個強大且易用的Java安全框架,為系統提供認證、授權、加密和會話管理等功能,為系統提供安全保障[25]。此外系統還採用了Redis提高系統的響應速度和使用者體驗。

3.前端技術選擇

本系統前端選擇Vue.js作為主要框架,它輕量級和靈活性的特點可以提高系統的前端開發效率,使開發者快速搭建系統頁面。Vue.js透過資料繫結和元件化的方式,可以高效地構建使用者介面[26]。Element UI是一套為開發者、設計師和產品經理準備的基於Vue 2.0的元件庫,它提供了豐富的介面元素,使開發者可以快速搭建出美觀且功能強大的前端頁面[27]。vue-element-admin是
一個基於Vue和Element UI構建的管理後臺前端解決方案,它提供了豐富的元件和功能模組,具有響應式佈局、多語言支援、動態路由、許可權控制等特性,幫助開發者快速搭建管理系統[28]。

4.資料庫選擇

資料庫方面,本系統選擇MySQL8.0和阿里雲OSS雲端儲存。MySQL是一個高效能、穩定可靠的資料庫管理系統,它支援多種儲存引擎,滿足不同的資料儲存需求[29]。並且Mysql8.0還提供了豐富的SQL函式和強大的查詢最佳化器,使資料處理更加高效[30]。阿里雲OSS可以提供安全、穩定且高效的海量資料雲存服務,因此本系統還選用阿里雲OSS儲存使用者頭像、會議室背景圖、檔案等非結構化的資料。

功能結構設計

“基於語音識別的會議記錄系統”透過語音識別技術,自動將會議中的語音內容轉換為文字記錄,從而提高會議記錄的效率與準確性。以下是系統的核心功能及其關係的簡要描述:

(1)使用者管理與許可權控制:這是系統的基礎功能,支援使用者註冊、登入和許可權管理,確保不同使用者根據其角色擁有相應的操作許可權,並且為其他功能提供使用者身份認證和訪問控制。

(2)部門與小組管理:允許企業管理員或具有相關許可權的使用者建立、編輯和刪除部門和小組。每個部門下可以設立多個小組,每個小組可以包含多個成員。使用者可以被分配到不同的部門和小組中,從而實現更加細緻的組織結構管理。在建立會議時,可以選擇特定的部門或小組作為參與者,從而簡化會議的組織和邀請流程。

(3)語音識別記錄:在會議進行時,透過語音識別技術實時將會議內容轉換為文字記錄,並顯示在介面上,使用者可以根據顯示內容進行實時地糾正和補充,還可以根據需要自行選擇暫停識別記錄、重置識別結果、儲存結果到資料庫等操作。此功能是系統的核心,它主要依賴於使用者管理和會議管理功能,使用者需要登入系統並建立或加入一個會議後,才能啟動該語音識別記錄功能。

(4)會議管理:會議管理主要由管理員使用者進行建立、編輯和刪除會議資訊,
包括會議的時間、地點、參與者等。會議管理是系統的核心功能之一,它與其他功能(如語音識別記錄、會議記錄檢視等)緊密相關,為使用者提供會議的基礎資訊管理。

(5)會議記錄檢視與編輯:使用者可以在會議結束後檢視語音識別轉寫的文字記錄進行會議的回顧與整理,也可以根據需要進行會議記錄的編輯和修正。這一功能是對語音識別記錄功能的補充和完善,使用者需要基於已有的會議記錄進行操作。會議記錄系統的功能結構框圖如圖2.1所示:

資料庫表展示

1.使用者資料表

2.部門資料表

3.小組資料表

4.會議資料表(核心)

5.許可權結構表

6.使用者許可權結構表

相關文章