2026年4月26日 星期日

Whisper 本地字幕生成工具,一鍵輕鬆搞定影片逐字稿

為什麼要開發這款軟體?

初衷很簡單:追求效率與隱私。我整合了目前辨識效率極高的 faster-whisper 引擎,並加上了圖形化介面(GUI)。這讓不熟悉指令碼的朋友,也能透過簡單的點擊,把電腦裡的影片或音檔轉換成精準的 SRT 字幕檔。

最重要的是,所有的運算都在你的電腦完成,資料不外流,這對於處理敏感內容或追求極致隱私的使用者來說,是不可替代的優勢。

軟體操作教學:簡單四步驟

Step 1. 環境檢查

開啟軟體後,建議先點擊「檢查環境」。它會自動偵測你的電腦是否有 NVIDIA 顯示卡(CUDA)支援。如果有,辨識速度會飛快;如果沒有,它也會乖乖用 CPU 幫你完成任務。

Step 2. 選擇媒體檔

點擊「選擇檔案」,支援常見的 MP4MP3WAVM4A 等格式。

Step 3. 參數設定

  • ● 模型:一般建議選 medium,辨識度跟速度最平衡。
  • ● 語言:可以選「自動判斷」,或是手動指定「中文」。
  • ● 切割粒度:我設計了「細緻、標準、寬鬆」三種模式,如果你希望每行字幕短一點,選「細緻」準沒錯。

Step 4. 開始辨識與匯出

按下「開始辨識」,稍等片刻,右側就會出現逐字稿與 SRT 預覽。最後點擊「另存 SRT」或「複製 SRT」即可直接使用。

立即下載使用

請點擊下方按鈕進入 GitHub 下載頁面。進入網頁後,請查看頁面右側的 Releases 區塊,點擊進去即可下載已經打包好的 .exe 執行檔,無需安裝 Python 環境即可直接執行。

2026年4月18日 星期六

從0到生成超有質感的有聲繪本只要幾分鐘?這個AI工具箱直接顛覆教學現場!

 

一、 軟體開發的由來

今天有幸參加了縣內數位學習推動辦公室舉辦的「Gemini + NotebookLM 繪本創作研習」。在研習過程中,看到許多老師運用 AI 生成了精采的故事情節與美緻的繪本草圖,心中深受觸動。

然而,我也觀察到一個教學痛點:當老師或學生完成繪本圖檔後,若要進一步製作成「有聲書影片」,往往需要操作複雜的剪輯軟體,這對許多親師生來說是一道不小的門檻。於是,阿剛我靈光一閃,想著如果能將我之前開發的幾個 AI 應用工具整合起來,並補上最後一塊「圖音合併」的拼圖,是否能讓創作流程更順暢?

於是,這款「有聲繪本影片創作工具箱」就這樣誕生了。

二、 課堂教學上的實際應用

低門檻敘事創作

學生只需專注於編寫故事與設計畫面,不需要學習專業的剪輯軟體,就能產出高品質的作品。

多元的呈現方式

除了能生成方便分享的影片檔,還能導出「互動式翻頁書」,讓繪本在網頁上就像真的書本一樣可以翻動,增加閱讀的趣味性。

語言學習利器

結合語音產生器,學生可以製作朗讀繪本,對於本土語言或英語教學中的「聽說能力」訓練非常有幫助。

成就感即時回饋

簡單幾個步驟就能看到自己的繪本「會說話、能翻頁」,大大提升了學生的學習動機。

三、 軟體使用詳細教學


這套工具箱的核心邏輯非常簡單,就是「1 ➔ 2 ➔ 3」的直線式操作:

1

第 1 步:簡報設計王 V3(生成圖檔)

  • 在「進階魔法設定」中輸入「設計成繪本形式」。
  • 利用 NotebookLM 輔助生成繪本內容規劃,最後從 Google 簡報導出為 PDF 檔案。
2

第 2 步:對話式語音產生器(生成聲音)

  • 將繪本每一頁的文字貼入工具。
  • 點擊生成每一頁的語音,確認無誤後下載成聲音壓縮檔 (ZIP)。
3

第 3 步:圖音合併工具(最後合成)

這是本次新整合的網頁工具。只需上傳步驟一的 PDF 與步驟二的 ZIP 檔。

  • 影片生成:系統會自動將每一頁圖片與對應的音檔對齊,生成 MP4 影片。
  • 翻頁書導出:除影片外,你也可以選擇下載成 HTML 翻頁書格式。下載後直接開啟網頁,就能擁有具備翻頁動效與語音播放功能的電子繪本。

2026年4月17日 星期五

提升簡報專業度!「簡報設計王 v3」強勢登場:精準引用原始教學圖表,讓 AI 簡報更具說服力

 

軟體開發的由來

過往我在使用 「簡報設計王」 規劃內容時,雖然 AI 能幫我們把文字脈絡理得很漂亮,但總有一個缺憾:如果原始教材(PDF 或圖片)裡有很精美的圖表、插圖或實驗照片,送到 NotebookLM 生成簡報時,AI 往往無法精確地「引用」這些原始圖片,導致最後生成的簡報雖然有字、有生圖,卻少了最關鍵的原始教學素材。

為了讓 AI 能更聰明地「對號入座」,我重新改寫了核心邏輯,推出了 v3 版本,重點就在於強化多模態的辨識與指令佈局。

課堂教學上的實際應用

在實際教學現場,我們手中的 PDF 講義往往包含許多不可替代的視覺資訊,例如:

  • 理化課:實驗器材的組裝示意圖。
  • 地理課:特定的地形等高線圖。
  • 數學課:複雜的幾何構圖。

透過 v3 版本的更新,老師們在上傳原始講義後,AI 會自動分析哪一頁有重要的圖表,並在「排版指南」中明確標記:「本頁請放置原始文件第 X 頁的 XX 圖」。這樣一來,後續銜接 NotebookLM 或其他生成工具時,就能確保這些珍貴的教學原件被完整保留在簡報中,大大提升了教材的專業度與準確性。

簡報設計王 v3 使用教學

操作起來依然維持我一貫追求的簡單、直覺,步驟如下:

1. 設定基礎需求:選擇您預計生成的簡報頁數。

2. 上傳原始文件:點選「選擇檔案」,將您的 PDF 講義或圖片上傳。

3. 開啟原圖引用開關(關鍵步驟):上傳檔案後,下方會出現一個 「保留原件中的圖片排版」 的開關,請記得將它開啟。

4. 挑選魔法風格:從 40 種內建風格中選一個您喜歡的視覺調性。

5. 施展 AI 魔法:點擊生成後,AI 會在每一頁的「排版指南」裡,自動安插引用原始圖片的指令。

6. 銜接 NotebookLM:將生成的規劃文字與您的原始 PDF 一併餵給 NotebookLM,一份圖文並茂、且精準引用原圖的簡報就完成囉!