Re: [問題] 有好用的影片即時翻譯軟體嗎?

看板japanavgirls (AV女優)作者 (slive)時間3周前 (2026/02/24 00:31), 2周前編輯推噓94(95146)
留言142則, 89人參與, 2周前最新討論串2/3 (看更多)
完全可以本地即時運算 先說前提:顯示卡需要 12GB VRAM 以上(或 24GB 以上的 Mac), 可以用本地 AI 模型做到「即時語音辨識 → 日文字幕 → 中文翻譯」 免費,全自動,完全不用上傳影片到雲端,也不用帳號。 原理分兩步: ① 聲音 → 日文字幕(用 Whisper) PotPlayer 內建 Whisper 語音辨識功能,可以即時把影片聲音轉成日文字幕: 右鍵 → 字幕 → 字幕生成有聲字幕(即時) (注意:選「即時」那個,不是另一個) 截圖參考:https://i.meee.com.tw/ePVl3CH.png
Whisper 模型有兩種版本可選,依你的 VRAM 決定: Whisper V3:需要約 6.5GB VRAM,品質較好 Whisper V3 Turbo:需要約 3.5GB VRAM,速度更快,推薦一般使用 這是 OpenAI 釋出的開源模型,目前仍是同類最強。 ② 日文字幕 → 中文翻譯(用 Ollama LLM) Ollama 是本地跑大語言模型的工具,超好安裝、免註冊、免費用, https://klab.tw/2025/09/ollama-tutorial/ 參考教學安裝 就是開啟powershell 輸入2-3行指令而已 我自己開發的OpenAver整理工具也是推薦用它。 安裝完後,在 PotPlayer 設定翻譯腳本: 右鍵 → 字幕 → 即時字幕翻譯 → 即時字幕翻譯設定 → 開啟資料夾 截圖參考:https://i.meee.com.tw/LScQaDF.png
把我寫好的腳本放進去: https://pastebin.com/yFGvgSx3 Download 之後 使用記事本打開 腳本第 4/10 行等等是模型名稱,批次改成你在ollama用的模型, 第 11 行是預設路徑通常不用動。 檔名存為 SubtitleTranslate - Ollama.as, 放到上面potplayer的翻譯工具資料夾,重開 PotPlayer 後啟用。 推薦翻譯模型(依 VRAM 選:) translategemma:12b:需要約 8GB,Google 開源的模型,品質很好 (google把gemma針對翻譯優化) qwen3:30b-a3b:需要約 16GB,綜合能力更強(要設定think false) (中國開源最強阿里巴巴的千問模型) 7B 以下的模型品質跟 youtube翻譯差不多,不建議用。 硬體限制的話建議用 translategemma:4b / qwen2.5:7b 最推薦組合:Whisper V3 Turbo + translategemma:12b (12gb極限使用 RTX3060/4070/5070/RX6700/7700) 效果完全屌打 YouTube 自動翻譯。 不只適用這類影片, 任何外語影片都通用—— 西班牙文足球直播、韓國輪椅奶台直播主都沒問題, 直接突破語言藩籬。 配個 VPN 完全就是運動迷天堂(這部分就離題了XD)。 真心推薦有設備的大大們試試看! --------------------------------------------------- 補充說明:私信和推文中的問題 Q1. 為什麼不直接用手機或平板翻譯? Windows 和 Android 都有內建「即時語音字幕」功能, 但背後是 Google / Bing 機器翻譯,語感生硬。 翻譯流暢度還輸給本地跑的小型 4B AI 模型 ——而 GTX 1060(約十年前的顯示卡)就能跑 4B 模型了。 Q2. 只是看片,真的需要這麼強的硬體嗎? 不需要。 原PO需求是即時翻譯,也就是每句話說完要即時出字幕,對硬體要求極高。 如果願意事先處理下載好的影片,6–8GB 顯示記憶體(VRAM)就夠用, 可以這樣做: PotPlayer 右鍵 → 字幕 → 字幕生成有聲字幕(等它慢慢跑) 字幕出來後,貼到 Gemini / ChatGPT 網頁翻譯 這樣翻譯品質反而比即時模式好,因為模型有時間看完整個句子和參考上下文。 補充:我個人主要是用這套系統即時看外語實況, 直播沒辦法預先下載,只能靠AI硬幹即時翻譯。 所以才需要高規格,這點跟原 PO 的需求略有不同。 Q3. 直接呼叫雲端 API(AWS / GCP / Azure)不就好了? 雲端方案有幾個問題: 雖然這些平台都有提供, 甚至有AssemblyAI 專門做語音轉錄, 效果比 Faster Whisper 強一些 但雲端來回至少有 0.5 秒網路延遲,後面翻譯模型還要再跑一次, 延遲疊加後感受很明顯 最關鍵是費用: 即時翻譯是「說一句話 → 呼叫一次 API → 收一次錢」, 你看實況一兩個小時,每一句話都在扣錢,長期下來非常貴。 本地跑 AI 則是完全免費爽看。 Q4. 我硬體頂天,還有更進階的 AI 玩法嗎? 以下四個功能可以同時開啟: 聲音轉字幕 Faster Whisper V3 beam_size=10,準確率更高但更吃資源 影片補幀 SVP Flow (30fps → 60fps甚至120/144) 懶得設定可用 Lossless Scaling(就是小黃鴨),比較容易上手 影片解析度提升 RTX VSR lv4超解析 升頻更清晰(2k/4k) 字幕翻譯 Ollama LLM(含上下文) 帶入前 10 句對話當記憶,專有名詞對照等等 ex 你正在翻譯歐冠足球比賽 使用下列球員名稱 你正在翻譯a片 忽略喘氣 狀聲詞 這邊硬體需求沒有極限 希望高手告訴用mac studio ultra跑gpt oss120b的效果 以上四個同時開, 就算你是 24GB 顯存的卡皇 RTX 4090 也會跑到滿載 (而且還沒辦法上4K)! 我自己的配置:RTX 4070 12gb 負責語音轉字幕 補幀和提升解析度, 翻譯則交給 Mac 用 MLX跑語言30b模型,兩台分工合作。 看實況真的是頂級享受! Q5. 我的顯示卡只有...,跑得動嗎? 沒有萬用答案,因為每個人的硬體組合不同。 建議用「分開測試再合併」的方式自己量一遍: Step 1:先確認 Whisper 能不能跑 單獨跑 Faster Whisper,播一段影片,確認字幕能正常產生、延遲在可接受範圍內。 打開 工作管理員(按 Ctrl+Shift+Esc → 效能 → GPU), 記錄它佔用了多少「GPU 記憶體(VRAM)」。 可以一個一個測試 v3 turbo / medium 越省資源效果越爛 Step 2:再單獨測試 Ollama 翻譯模型 不要同時開 Whisper,先單獨啟動 Ollama,跑你想用的語言模型, 同樣用工作管理員看它佔多少 VRAM, 以及 GPU 使用率是否長時間卡在 100%。 GPU 使用率 100% 本身正常,但如果長時間維持 100% 且字幕明顯延遲,代表這個模型對 你的顯示卡來說太重,需要換小一點的模型。 Step 3:兩個加起來,就是你需要的總 VRAM Whisper 佔用量 + Ollama 佔用量 <= 你的顯示卡 VRAM, 就能穩定同時跑。 超過的話,換較小的模型 或者是把我這篇文章 加上你的硬體規格拿去問AI ※ 引述《x111222333 (試驗者)》之銘言: : 是這樣啦 : 很多片都沒有中文版的,造成理解劇情上很困難 : 尤其像是MIAD-995這種精實的教學片 : 很想認真學習 : 但就聽不懂日文 : 只看動作,真的很難受 : 枉費男優女優認真教學 : 最近試了Chrome的影片即時翻譯功能 : 可以邊看影片,旁邊小視窗即時語音辨識,再翻譯成中文 : 還不錯! : 雖然有時不太到位,但勉強可以理解內容 : 那不知道板上大大們,還有試過哪些影片即時翻譯軟體 : 可以彌補這種沒有中文版的遺憾! : 感激 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.244.154 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/japanavgirls/M.1771864315.A.FD9.html

02/24 00:35, 3周前 , 1F
太神啦
02/24 00:35, 1F

02/24 00:36, 3周前 , 2F
推專業
02/24 00:36, 2F

02/24 00:44, 3周前 , 3F
神人!
02/24 00:44, 3F

02/24 00:59, 3周前 , 4F
雖然看不懂,但感覺很厲害
02/24 00:59, 4F

02/24 01:28, 3周前 , 5F
推分享
02/24 01:28, 5F

02/24 01:42, 3周前 , 6F
4樓搶了我的話,我也看不懂但覺得很厲害 XD
02/24 01:42, 6F

02/24 01:49, 3周前 , 7F
產生不出來的就跑不動嗎?3060Ti 8GB有建議的組合嗎
02/24 01:49, 7F

02/24 02:04, 3周前 , 8F
雖然看不懂 但先推再說
02/24 02:04, 8F

02/24 02:18, 3周前 , 9F
卡在存檔那邊 我存了.as 檔案,
02/24 02:18, 9F

02/24 02:20, 3周前 , 10F
也放到potplayer翻譯資料夾下面 但沒有跳 Ollama的選項出
02/24 02:20, 10F

02/24 02:20, 3周前 , 11F
02/24 02:20, 11F

02/24 04:37, 3周前 , 12F
02/24 04:37, 12F

02/24 07:46, 3周前 , 13F
好專業,看AV版學AI
02/24 07:46, 13F

02/24 08:35, 3周前 , 14F
好人一生平安
02/24 08:35, 14F

02/24 08:36, 3周前 , 15F
求圖文教學
02/24 08:36, 15F

02/24 09:03, 3周前 , 16F
太神啦,我的5070ti不只拿來玩遊戲了
02/24 09:03, 16F

02/24 09:14, 3周前 , 17F
有神快拜
02/24 09:14, 17F

02/24 09:25, 3周前 , 18F
太神了
02/24 09:25, 18F

02/24 09:29, 3周前 , 19F
太神了 推
02/24 09:29, 19F

02/24 09:49, 3周前 , 20F
AI菩薩是你
02/24 09:49, 20F

02/24 09:51, 3周前 , 21F
謝謝教學 我決定換顯卡了
02/24 09:51, 21F

02/24 09:58, 3周前 , 22F
結果不是為了遊戲要買顯卡了嗎?
02/24 09:58, 22F

02/24 10:34, 3周前 , 23F
不是,三星平板就已經內建這種服務了,最便宜的機
02/24 10:34, 23F

02/24 10:34, 3周前 , 24F
型都有,為什麼要自己去搞這一堆?
02/24 10:34, 24F

02/24 10:34, 3周前 , 25F
平板還可以帶到廁所用呢,隨時都可以屌屌!
02/24 10:34, 25F

02/24 11:36, 3周前 , 26F
雖然不知道是什麼,但是感覺很厲害
02/24 11:36, 26F

02/24 12:15, 3周前 , 27F
沒用過 但看AV也能學技術 真的猛
02/24 12:15, 27F

02/24 12:20, 3周前 , 28F
太神啦
02/24 12:20, 28F

02/24 12:22, 3周前 , 29F
12GB VRAM...我沒有
02/24 12:22, 29F

02/24 12:47, 3周前 , 30F
之前用potplayer內建的翻出來都覺得不夠好,常常整段台
02/24 12:47, 30F

02/24 12:47, 3周前 , 31F
詞不見,或出現莫名其妙的話。後來我記得好像有日本人
02/24 12:47, 31F

02/24 12:47, 3周前 , 32F
推一個專門識別AV台詞轉成日文字幕的,我用這個轉完,
02/24 12:47, 32F

02/24 12:47, 3周前 , 33F
然後丟給gemini轉成中文生成字幕檔我覺得更好,因為gem
02/24 12:47, 33F

02/24 12:47, 3周前 , 34F
ini會幫你修飾詞彙,倒是gpt一直檔我,虧我還有付費
02/24 12:47, 34F

02/24 13:03, 3周前 , 35F
不過...下載安裝模型那邊可能就勸退一堆人了
02/24 13:03, 35F

02/24 13:11, 3周前 , 36F
樓主的文章好 晚上來試試
02/24 13:11, 36F

02/24 13:17, 3周前 , 37F
推神人 是說樓主分享的腳本第11行是不是多打一個h了
02/24 13:17, 37F

02/24 13:38, 3周前 , 38F
大神感謝
02/24 13:38, 38F

02/24 13:40, 3周前 , 39F
哭啊3080 10G居然不是輸在遊戲是AV翻譯
02/24 13:40, 39F
還有 64 則推文
02/25 05:12, 3周前 , 104F
成功了,原來是第一次下載的時候他不知道下載到啥mod
02/25 05:12, 104F

02/25 05:12, 3周前 , 105F
了,後來再下載一次正確的mod就能用了!謝啦!
02/25 05:12, 105F

02/25 07:00, 3周前 , 106F
神人。被你這篇感動到了!
02/25 07:00, 106F

02/25 11:05, 3周前 , 107F
謝教學
02/25 11:05, 107F

02/25 12:13, 3周前 , 108F
幫推薦 不過講話或劇情太少的 大多也翻不出來就是XD
02/25 12:13, 108F

02/25 12:14, 3周前 , 109F
翻譯仰賴前後文 一些語助和助興的話翻不好或認不到
02/25 12:14, 109F

02/25 12:43, 3周前 , 110F
有夠麻煩 直接end
02/25 12:43, 110F

02/25 12:49, 3周前 , 111F
太神啦 看AV學AI
02/25 12:49, 111F

02/25 12:50, 3周前 , 112F
12G顯卡最便宜也要2萬多.....
02/25 12:50, 112F

02/25 13:10, 3周前 , 113F
回報一下,我翻譯大概三句只翻一句,然後vram大概只使
02/25 13:10, 113F

02/25 13:10, 3周前 , 114F
用6.5G,跟只使用即時日文字幕沒使用翻譯差不多@@!
02/25 13:10, 114F

02/25 13:12, 3周前 , 115F
顯卡 9070xt
02/25 13:12, 115F

02/25 16:33, 3周前 , 116F
我也是用這個辦法,但建議選較小的model翻譯(3b或4b)跑
02/25 16:33, 116F

02/25 16:33, 3周前 , 117F
起來比較即時,要不然很容易卡在Whisper日文字幕,但看
02/25 16:33, 117F

02/25 16:33, 3周前 , 118F
不到中文字幕的狀況
02/25 16:33, 118F

02/25 16:54, 3周前 , 119F
可是我架在nas用plex看 只好跳過了
02/25 16:54, 119F

02/25 18:56, 3周前 , 120F
嫌麻煩 把懶覺切掉 一勞永逸
02/25 18:56, 120F

02/25 19:29, 3周前 , 121F
神人感謝分享
02/25 19:29, 121F

02/25 19:33, 3周前 , 122F
nas也可以 我用Jellyfin mpv shim 就用外掛plugins
02/25 19:33, 122F

02/25 19:35, 3周前 , 123F
不然先提前翻譯好 放進nas裡面當字幕也可以
02/25 19:35, 123F

02/25 21:36, 3周前 , 124F
AMD5600,翻譯用qwen3-vl:30b-a3b-instruct-q4_K_M才夠快
02/25 21:36, 124F

02/25 21:39, 3周前 , 125F

02/25 21:40, 3周前 , 126F
狂 很厲害 想知道韓國台資訊
02/25 21:40, 126F

02/26 01:36, 3周前 , 127F
開啟即時字幕會約10秒順播後加速快轉1秒,有人也會嗎
02/26 01:36, 127F

02/26 09:04, 3周前 , 128F
專業推,看AV版學AI
02/26 09:04, 128F

02/26 17:36, 2周前 , 129F
推 但很好奇為什麼一堆人在意字幕 也沒有很艱深的詞吧
02/26 17:36, 129F

02/27 02:26, 2周前 , 130F
這就是仁勳把拔想要的AI世界嗎
02/27 02:26, 130F

02/27 11:29, 2周前 , 131F
雖然你寫的是中文,但是我完全看不懂
02/27 11:29, 131F

02/28 09:40, 2周前 , 132F
看來要換顯卡了
02/28 09:40, 132F

03/01 10:53, 2周前 , 133F
03/01 10:53, 133F

03/01 12:48, 2周前 , 134F
大神推
03/01 12:48, 134F

03/01 18:34, 2周前 , 135F
顯卡我有 可是感覺好難喔
03/01 18:34, 135F

03/01 18:42, 2周前 , 136F
Gimini 他願意手把手教學 改天試試看
03/01 18:42, 136F

03/02 02:53, 2周前 , 137F
我的5090終於有除了遊戲外的用途了
03/02 02:53, 137F

03/02 18:34, 2周前 , 138F
原來5090上ptt的功能在這裡學習
03/02 18:34, 138F

03/03 01:29, 2周前 , 139F
推 好專業
03/03 01:29, 139F

03/03 18:58, 2周前 , 140F
優質推一下
03/03 18:58, 140F
※ 編輯: crazy126 (114.34.244.154 臺灣), 03/04/2026 00:51:03

03/04 22:41, 2周前 , 141F
真神人耶
03/04 22:41, 141F

03/05 11:10, 2周前 , 142F
又有理由買新顯卡了~~~
03/05 11:10, 142F
文章代碼(AID): #1fd83x_P (japanavgirls)
文章代碼(AID): #1fd83x_P (japanavgirls)