无论是演講、訪談或 YouTuber 拍影片,上字幕齐是相當花時間的责任。雖然有些剪輯軟體如:剪映、威力導演齐提供自動上字幕的功能,不過識別效果、資料 (你的聲音)安透澈不诟谇常理念念。這篇著述和大家共享 WhisperDesktop,它使用最新的 Whisper 語音識別 AI 技術,不错快速、精準地幫你製作影片字幕,况兼還能成功在你的電腦完成轉換爷爱撸影院,不受檔案大小、時間長度领域,也无须擔心資料外洩唷!
推薦使用 WhisperDesktop 的事理:
✅ 使用最新的 Whisper AI 模子,轉換正確率更高✅ 單機就能用,不須聯網,不會產生任何費用✅ 相容性高,實測 5 年前筆電也能跑
使用 WhisperDesktop 高效率產生字幕 Step 1. 下載 WhisperDesktopWhisperDesktop 是一個開放原始碼的軟體,不错從 github 下載使用。
點這邊下載 WhisperDesktop (版块 1.11)
Step 2. 下載語音識別 AI 模子檔 (model)接著我們赶赴 Hugging Face 下載 AI 模子檔,稍後程式會使用這個模子檔進行運算。 這邊建議下載 ggml-medium.bin (1.5GB)不错獲得最佳的轉換品質;若是電腦遵守較差,也不错改用 ggml-small.bin (488MB) 替代,轉換品質左近,但會省下好多運算時間。

Whisper AI 模子下載頁
Step 3. 打開 WhisperDesktop,選擇模子檔接著打開步驟 1 下載的壓縮檔,執行 「WhisperDesktop.exe」,接著在畫面上點選右邊的【…】按鈕選擇剛剛下載的模子檔。接著確認「Model Implementation」選擇 「GPU」就不错按【OK】準備進入重頭戲。

接著要進行影音轉笔墨的相關設定,以下依序說明:
Language:影音檔使用的語言,若是是汉文影音就成功 Chinese。若是要將字幕翻譯成英文不错勾選右邊的【Translate】。 選擇要轉換的影音檔:不错使用 mp3 或 mp4、avi 這類聲音或影片檔。 選擇要輸出的秩序:轉換逐字稿可選 「Text file」 或 「Text with timestamps」(有時間標記),影片字幕則選擇「SubRip subtitile」。接著按下【Transcribe】就不错開始進行語音識別和轉換囉!

WhisperDesktop 對硬體的条目极度低,基本上只消救济 DirectX 11 的顯示卡齐不错運作。有多低?好手使用 2017 年購入的筆電也不错無痛使用!
不過不同的硬體遵守,當然也會影響轉檔速率,以下好手就實際以兩個影片進行轉換測試
影片長度轉檔時間 電腦 A (AMD Ryzen 7 3700X + NVIDIA RTX 3070 Ti)7分25秒57秒 電腦 B (Intel Core i7 8550U + UHD Graphic 620)2分03秒24分23秒 (ggml-medium) 7分05秒 (ggml-small) 電腦 C (Intel Core i9-13900KF + AMD RTX 6600XT)17分49秒2分39秒 (ggml-medium) 52秒 (ggml-small)從以上結果不错發現:顯示卡的遵守決定了一切!雖然電腦 B 唯一陽春的顯卡,但 2 分鐘的影片也只需要 7 分鐘就能完成轉換。若是你聽打的速率比它慢,省下來的時間即是你的!
WhisperDesktop 與其他轉字幕功能比較以下我們整理了现在常用的幾種字幕轉換 (產生) 器具的比較,你不错根據我方的需求,選擇最適合我方的器具。
吴梦菲 反差 WhisperDesktop威力導演剪映pyTranscriber 轉換速率尚可~快 (依電腦性能)快 (依電腦性能)快快 正確性高庸俗尚可尚可 語句分段正確性高高高庸俗 費用免費NT 166 起/月免費免費 資料安全开阔可上傳至中國伺服器上傳至 Google 伺服器 離線使用可須聯網須聯網須聯網 硬體条目顯示卡遵守越高越好無無 無 總結Whisper 是 OpenAI 推出的語音辨識模子,未來還會隨著官方訓練恶果的成長,進一步普及轉換的正確性 (雖然現在正確性已經很),若是你使用的電腦是用來剪片的話,频频遵守一定不错讓你順順的用 WhisperDesktop 轉換字幕,因此好手建議不错優先把它當作轉換字幕的首選器具,幫你省下更多持錯及上字幕的時間!