2026年5月5日 星期二

多功能圖片影音製作器V4.3版-一堆照片快速轉影片神器

 你有沒有過這種時候——活動剛結束,手上有一大堆照片,卻不知道該怎麼快速做成一部超酷的成果影片?📸🎞️ 或者想幫家人、朋友製作回憶影片,結果發現市面上的軟體要嘛超貴、要嘛學習成本爆炸?

有一次去學校分享,主任問我:「阿剛老師,有沒有更快的方法能把一大堆圖片變成成果影片?」我當下建議他們用 PowerPoint,雖然可以,但步驟多得讓人頭大!🤯 我心裡想:「這應該可以更簡單吧?」

所以我一年多前用 AI 做了這個工具,最近又快到畢業季,又要製作學生的回憶影片了,所以我又把程式拿出來優化了一下,把本來要手動安裝 FFmpeg 的動作優化掉了,直接把程式也打包進 EXE 中,老師們直接下載開啟程式就可以直接使用。


🎓 課堂教學上的實際應用

這款工具在學校教學或行政作業上非常實用:

  • 數位繪本與有聲書製作:學生畫好繪本後,可針對每張圖上傳錄音,軟體會自動根據錄音長度調整圖片停留時間,輕鬆做出有聲書。
  • 活動快剪紀錄:匯入所有照片,選一首熱血音樂,設定好轉場特效,不到幾分鐘就能產出高畫質紀錄短片。
  • 教材多語化:利用新增的「手動字幕」功能,老師可以為圖片標註單字,幫助學生視聽同步。

🛠️ 軟體新功能與技術亮點 (V4.3版)

這次程式碼的更新,我特別針對「易用性」做了大幅度調整:

1. 免安裝 FFmpeg,開箱即用!
以前這類工具最麻煩的就是要使用者自己去下載 ffmpeg、設定環境變數。這次我直接把工具打包進 EXE 執行檔中。老師們下載後直接執行就好,不用再為了設定電腦而滿頭大汗。
2. 強大的字幕自訂系統
支援手動輸入、四種顏色切換(白、黃、淡綠、粉紅),且可自訂字體大小(20-40),確保視覺美觀。
3. 精準的音圖同步
上傳專屬配音後,程式會自動計算時長並鎖定,保證「聲音講到哪,圖片就換到哪」。
4. 專業轉場與多種比例
包含向左滑入、圓形展開、像素化、擦除等多種轉場特效。支援 16:9 或 4:3 比例,解析度最高可達 4K。

📖 使用教學步驟

  1. 匯入素材:點擊「匯入圖片/影片」選取素材,並可拖曳調整順序。
  2. 設定時間與字幕:手動設定秒數,或使用「設定全部」統一調整。勾選「啟用字幕」,輸入文字並調整顏色與大小。
  3. 加入音樂:匯入背景音樂並調整音量,可設定音樂起始與結束時間。
  4. 選擇輸出規格:選擇解析度(480P ~ 4K)與喜歡的轉場效果。
  5. 一鍵匯出:按下「匯出影片」,等待程式自動合成 MP4 檔案。


2026年4月28日 星期二

【AI自製工具分享】YouTube 多語系字幕下載與 AI 辨識產生字幕工具

 在數位教學的過程中,影音素材的應用已經是家常便飯。不過,阿剛我常發現,有些很棒的國外教學影片沒有中文字幕,或是影片本身的字幕無法直接匯出,這對於想要使用AI進行精確文本分析或翻譯教學的老師來說,確實有些不便。

軟體開發的初衷

這款工具的開發初衷很簡單:「讓影音與文本的轉換不再有阻礙」。以前我們可能要開好幾個網站、用不同的軟體來下載影片和字幕,現在我希望透過這支 Python 程式,將「下載」與「辨識」整合在一起。不管是官方提供的 CC 字幕,還是完全沒有字幕的影片,都能輕鬆取得逐字稿。

軟體操作教學

這款工具介面我設計得相當簡潔,操作步驟如下:

  • 讀取影片:將 YouTube 連結貼上,按下「開始分析 / 讀取字幕」。
  • 下載 CC 字幕:若影片內建字幕,右側會出現清單,勾選需要的語系(如繁體中文、英文),選擇格式(如 SRT)後按下載即可。
  • AI 辨識生成:若影片沒有字幕,程式會自動提示開啟「辨識工具」。它會先下載音訊,接著調用 Whisper AI 模型進行辨識。你可以根據電腦效能選擇模型(如 medium 或 large)。辨識完成後,可直接「另存 SRT」或複製逐字稿。
  • 影音下載:若單純需要影片檔或 MP3 音訊,切換到「影片/音訊」分頁,選擇畫質後即可下載。




立即下載使用

前往 GitHub 儲存庫取得最新工具程式。進入頁面後,請務必點擊右方的 Releases 區塊,並下載最新版本的 Source code.zip 進行解壓縮與使用。

2026年4月26日 星期日

Whisper 本地字幕生成工具,一鍵輕鬆搞定影片逐字稿

為什麼要開發這款軟體?

初衷很簡單:追求效率與隱私。我整合了目前辨識效率極高的 faster-whisper 引擎,並加上了圖形化介面(GUI)。這讓不熟悉指令碼的朋友,也能透過簡單的點擊,把電腦裡的影片或音檔轉換成精準的 SRT 字幕檔。

最重要的是,所有的運算都在你的電腦完成,資料不外流,這對於處理敏感內容或追求極致隱私的使用者來說,是不可替代的優勢。

軟體操作教學:簡單四步驟

Step 1. 環境檢查

開啟軟體後,建議先點擊「檢查環境」。它會自動偵測你的電腦是否有 NVIDIA 顯示卡(CUDA)支援。如果有,辨識速度會飛快;如果沒有,它也會乖乖用 CPU 幫你完成任務。

Step 2. 選擇媒體檔

點擊「選擇檔案」,支援常見的 MP4MP3WAVM4A 等格式。

Step 3. 參數設定

  • ● 模型:一般建議選 medium,辨識度跟速度最平衡。
  • ● 語言:可以選「自動判斷」,或是手動指定「中文」。
  • ● 切割粒度:我設計了「細緻、標準、寬鬆」三種模式,如果你希望每行字幕短一點,選「細緻」準沒錯。

Step 4. 開始辨識與匯出

按下「開始辨識」,稍等片刻,右側就會出現逐字稿與 SRT 預覽。最後點擊「另存 SRT」或「複製 SRT」即可直接使用。

立即下載使用

請點擊下方按鈕進入 GitHub 下載頁面。進入網頁後,請查看頁面右側的 Releases 區塊,點擊進去即可下載已經打包好的 .exe 執行檔,無需安裝 Python 環境即可直接執行。

2026年4月18日 星期六

從0到生成超有質感的有聲繪本只要幾分鐘?這個AI工具箱直接顛覆教學現場!

 

一、 軟體開發的由來

今天有幸參加了縣內數位學習推動辦公室舉辦的「Gemini + NotebookLM 繪本創作研習」。在研習過程中,看到許多老師運用 AI 生成了精采的故事情節與美緻的繪本草圖,心中深受觸動。

然而,我也觀察到一個教學痛點:當老師或學生完成繪本圖檔後,若要進一步製作成「有聲書影片」,往往需要操作複雜的剪輯軟體,這對許多親師生來說是一道不小的門檻。於是,阿剛我靈光一閃,想著如果能將我之前開發的幾個 AI 應用工具整合起來,並補上最後一塊「圖音合併」的拼圖,是否能讓創作流程更順暢?

於是,這款「有聲繪本影片創作工具箱」就這樣誕生了。

二、 課堂教學上的實際應用

低門檻敘事創作

學生只需專注於編寫故事與設計畫面,不需要學習專業的剪輯軟體,就能產出高品質的作品。

多元的呈現方式

除了能生成方便分享的影片檔,還能導出「互動式翻頁書」,讓繪本在網頁上就像真的書本一樣可以翻動,增加閱讀的趣味性。

語言學習利器

結合語音產生器,學生可以製作朗讀繪本,對於本土語言或英語教學中的「聽說能力」訓練非常有幫助。

成就感即時回饋

簡單幾個步驟就能看到自己的繪本「會說話、能翻頁」,大大提升了學生的學習動機。

三、 軟體使用詳細教學


這套工具箱的核心邏輯非常簡單,就是「1 ➔ 2 ➔ 3」的直線式操作:

1

第 1 步:簡報設計王 V3(生成圖檔)

  • 在「進階魔法設定」中輸入「設計成繪本形式」。
  • 利用 NotebookLM 輔助生成繪本內容規劃,最後從 Google 簡報導出為 PDF 檔案。
2

第 2 步:對話式語音產生器(生成聲音)

  • 將繪本每一頁的文字貼入工具。
  • 點擊生成每一頁的語音,確認無誤後下載成聲音壓縮檔 (ZIP)。
3

第 3 步:圖音合併工具(最後合成)

這是本次新整合的網頁工具。只需上傳步驟一的 PDF 與步驟二的 ZIP 檔。

  • 影片生成:系統會自動將每一頁圖片與對應的音檔對齊,生成 MP4 影片。
  • 翻頁書導出:除影片外,你也可以選擇下載成 HTML 翻頁書格式。下載後直接開啟網頁,就能擁有具備翻頁動效與語音播放功能的電子繪本。