分享程式代碼相關筆記
目前文章總數:157 篇
最後更新:2024年 12月 07日
進入分享此工具的Open Source Github
點擊右邊可以下載當前Release的Windows主程式
點擊下載WhisperDesktop.zip
到Hugging Face的whisper.cpp下載NLP(自然語言處理)模型,點我連結
推薦下載ggml-medium.bin ,因為我們翻譯中文,原因可參考第二、第三部分校能分析
將Step 2.下載的WhisperDesktop.zip解壓縮
會看到主程式WhisperDesktop.exe
並將Step3. 下載的模型放在一起
執行WhisperDesktop.exe,然後選擇框起來的地方載入下載的模型 ggml-medium.bin
然後選擇OK
以下依序選擇:
1. 選擇中文語言,Chineses
2. 選擇錄音檔案,我們測試用的是test001.mp3(一個30分鐘的mp3)
3. 輸出文字稿路徑(可設定或不設定)
4. 開始聲音轉文字稿
過一段時間會顯示執行結果。30分鐘的錄音檔大約花費3:14轉成文字。
備註:顯卡用 NVIDIA GeForce RTX 2060 12G
這是一個不錯的輔助工具,工具基本上可以讀懂中文
能會議紀錄的基本參考,更近一步可以提交給Notion AI做資料整理。
花費時間:02:10
花費時間:03:14
花費時間:07:39
最左邊是Large模型,中間是Medium模型,最右邊是tiny模型
使用WinMerge比較三個文字內容後
只有Medium完整翻完30分鐘,在Large中會過度解析、在Tiny中分析卻不精確
建議目前中文翻譯先使用【Medium模型】是最合適的
tiny | medium | large | |
---|---|---|---|
精確度 | 錯 | 完整 | 錯 |
耗費時間 | 02:10 | 03:14 | 07:39 |