在數位教學的過程中,影音素材的應用已經是家常便飯。不過,阿剛我常發現,有些很棒的國外教學影片沒有中文字幕,或是影片本身的字幕無法直接匯出,這對於想要使用AI進行精確文本分析或翻譯教學的老師來說,確實有些不便。
軟體開發的初衷
這款工具的開發初衷很簡單:「讓影音與文本的轉換不再有阻礙」。以前我們可能要開好幾個網站、用不同的軟體來下載影片和字幕,現在我希望透過這支 Python 程式,將「下載」與「辨識」整合在一起。不管是官方提供的 CC 字幕,還是完全沒有字幕的影片,都能輕鬆取得逐字稿。
軟體操作教學
這款工具介面我設計得相當簡潔,操作步驟如下:
- 讀取影片:將 YouTube 連結貼上,按下「開始分析 / 讀取字幕」。
- 下載 CC 字幕:若影片內建字幕,右側會出現清單,勾選需要的語系(如繁體中文、英文),選擇格式(如
SRT)後按下載即可。 - AI 辨識生成:若影片沒有字幕,程式會自動提示開啟「辨識工具」。它會先下載音訊,接著調用
Whisper AI模型進行辨識。你可以根據電腦效能選擇模型(如medium或large)。辨識完成後,可直接「另存 SRT」或複製逐字稿。 - 影音下載:若單純需要影片檔或 MP3 音訊,切換到「影片/音訊」分頁,選擇畫質後即可下載。
立即下載使用
前往 GitHub 儲存庫取得最新工具程式。進入頁面後,請務必點擊右方的 Releases 區塊,並下載最新版本的 Source code.zip 進行解壓縮與使用。