Re: [問題] 有好用的影片即時翻譯軟體嗎?

看板japanavgirls (AV女優)作者 (水色)時間3周前 (2026/02/24 19:22), 3周前編輯推噓10(10030)
留言40則, 11人參與, 3周前最新討論串3/3 (看更多)
這邊倒是有非即時翻譯影片的方案,算是付費的方案,最好是用gemini、chatgpt的 api 我自己是用AI TranslateSRT來翻譯外文影片,靠AI寫專門的prompt來應對轉錄不同 的影片時,所需的聲音轉文字的需求。 不同影片可以設定成完全不同的prompt,可以專門優化成FC2、商業AV、動漫、電影 等pormpt,這些prompt靠chatgpt 、claude線上討論修改一下就能滿足需求。 例如whisper是沒辦法滿足我觀看FC2時,所需要的狀聲詞、氣音與修飾需求,但FC2 這類影片反而會因為這些破碎詞彙,而產生更有臨場感的體驗。 但我自架whisper時,發現它太容易將這些破碎詞當作無用的詞彙過濾掉,而且又要 去調用其他的LLM才達到可用程度。 但AI TranslateSRT可以透過調整prompt,可直接調用gemini 2.5 pro本身極為強大 的LLM能力,直接輸出可讀的字幕,直接少了本地硬體的需求。 AI TranslateSRT裡面的一些設定可以靠AI詢問來自行調整參數設定,避免遇到限流 、字幕缺少等問題。 當然缺點是你必須申請google ai studio,而且google cloud必須要有額度才能使 用,但現在有Google爸爸佛心的給大家300美元的額度,目前這活動還在,可以讓你現在免 費體驗。 不過我發現要調用gemini 2.5 pro的話,你必須將google cloud升級至付費帳戶, 並填寫信用卡,這樣AI TranslateSRT才能調用這類的高級模型。 但是我嫌AI TranslateSRT只能用gemini翻譯成中文,所以只讓AI translateSRT產 生原始語言的字幕檔,再將丟進subtitle-translator-electron來使用不同的AI來翻譯,當 然這程式也能使用自己調整過的prompt來翻譯字幕,以應對不同影片的需求。 這種流程算是目前不依靠顯示卡,完全依靠主流大模型來翻譯本地影片的簡單方法 ,而且能產生很精確的字幕、逐字稿等等 當然更省錢的翻譯方式就是直接將AI TranslateSRT的字幕檔丟進gemini、chatgpt線上版, 如果你有訂閱的話 ,基本上是可以讓你無限翻譯字幕,gemini甚至還能設定gem,專門設置翻譯用提示詞,讓 你連續輸出字幕翻譯。不過即使你有訂閱,線上版還是有流量限制,你可以設定提示詞,只 讓gemini只輸出字幕而不輸出時間戳,這樣更省token,之後將這些字幕透過subtitle edit 來直接合併回你原本用AI TranslateSRT產生的字幕,這樣更省錢 https://github.com/gnehs/subtitle-translator-electron https://github.com/suyanali/AI_TranslateSRT?tab=readme-ov-file -- Sent from my iPhone 17 Pro Max PiTT // PHJCI -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.47.139 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/japanavgirls/M.1771932124.A.70E.html

02/24 19:38, 3周前 , 1F
這工作流感覺不錯,感謝分享!
02/24 19:38, 1F
※ 編輯: luwatercolor (114.34.47.139 臺灣), 02/24/2026 19:44:41

02/24 19:50, 3周前 , 2F
AV版變AI版了
02/24 19:50, 2F
※ 編輯: luwatercolor (114.34.47.139 臺灣), 02/24/2026 20:03:53 ※ 編輯: luwatercolor (114.34.47.139 臺灣), 02/24/2026 20:04:46

02/24 20:20, 3周前 , 3F
剛丟字幕檔給Gemini,結果他說不能翻譯色情內容Q
02/24 20:20, 3F

02/24 20:33, 3周前 , 4F
先叫ai教你排版好嗎
02/24 20:33, 4F

02/24 20:47, 3周前 , 5F
手機發文的沒辦法
02/24 20:47, 5F

02/24 20:52, 3周前 , 6F
當然直接丟gemini是不行的,要給提示詞,而chatgpt
02/24 20:52, 6F

02/24 20:52, 3周前 , 7F
的話,會更寬鬆些,但都要提示詞
02/24 20:52, 7F

02/24 21:36, 3周前 , 8F
翻譯字幕會有些擔心內容會不會因為斷句的關係 或被時間
02/24 21:36, 8F

02/24 21:36, 3周前 , 9F
戳給切斷 而導致翻譯不正確、不通順 請問使用AI Transla
02/24 21:36, 9F

02/24 21:36, 3周前 , 10F
teSRT翻譯 會有讓你如此感覺嗎 謝謝 有看到能輸入提示詞
02/24 21:36, 10F

02/24 21:36, 3周前 , 11F
可不可以使用提示詞叫它先忽略時間戳 翻完再併回去
02/24 21:36, 11F

02/24 21:56, 3周前 , 12F
這程式理論上可以完全不輸出時間戳的,這可以靠pro
02/24 21:56, 12F

02/24 21:56, 3周前 , 13F
mpt來控制,但AI通常會有容易漂移的現象,若不讓字
02/24 21:56, 13F

02/24 21:56, 3周前 , 14F
幕有遵循的數列或是時間戳,AI很容易亂跳字幕,再
02/24 21:56, 14F

02/24 21:56, 3周前 , 15F
來這程式可以設定單行字數上限和重疊容忍 (秒):允
02/24 21:56, 15F

02/24 21:56, 3周前 , 16F
許相鄰字幕在時間上的重疊秒數,用於處理合唱或對
02/24 21:56, 16F

02/24 21:56, 3周前 , 17F
話緊湊的情境。這樣子能最低限度降低斷句問題,並
02/24 21:56, 17F

02/24 21:56, 3周前 , 18F
且gemini 2.5 pro的LLM能力是十分強大的,它的斷句
02/24 21:56, 18F

02/24 21:56, 3周前 , 19F
能力通常強於絕大多數模型,甚至我要求它特意轉錄
02/24 21:56, 19F

02/24 21:56, 3周前 , 20F
破碎語句,它都能很好的輸出我要的破碎感。當然這
02/24 21:56, 20F

02/24 21:56, 3周前 , 21F
需要你做一個嚴苛的prompt來約束
02/24 21:56, 21F

02/24 22:36, 3周前 , 22F
我是想要時間戳的呀~是怕時間戳影響到它的翻譯 才在想能
02/24 22:36, 22F

02/24 22:36, 3周前 , 23F
不能要求它翻完再加上去 因為以前看過一個大概2024年中
02/24 22:36, 23F

02/24 22:36, 3周前 , 24F
的AI評測影片 當時的模型看起來似乎是會影響到的 不過聽
02/24 22:36, 24F

02/24 22:36, 3周前 , 25F
到你的實測分享 那麼我就安心了~我感覺你好像就是作者
02/24 22:36, 25F

02/24 22:36, 3周前 , 26F
如果是的話很感謝你的分享
02/24 22:36, 26F

02/25 00:13, 3周前 , 27F
感謝分享讓我體會到科技的強大
02/25 00:13, 27F

02/25 00:24, 3周前 , 28F
翻譯不能色色 錢砸下去就讓你色色了呀
02/25 00:24, 28F

02/25 01:20, 3周前 , 29F
告訴gemini是哪個平台來的asr字幕檔,我沒遇過擋翻譯的
02/25 01:20, 29F

02/25 01:21, 3周前 , 30F
我問過gemini,安全規範是限制生成,把它當翻譯工具ok
02/25 01:21, 30F

02/25 03:18, 3周前 , 31F
怎麼感覺沒人知道WhisperJAV這個東西
02/25 03:18, 31F

02/25 09:24, 3周前 , 32F
我就是用whisperJAV轉出日文字幕檔再丟給gemini翻譯,
02/25 09:24, 32F

02/25 09:24, 3周前 , 33F
有一次whisperJAV聽錯成12歲,導致chatgpt一直不幫我翻
02/25 09:24, 33F

02/25 09:24, 3周前 , 34F
,gemini直接說應該是22歲寫錯,我回去聽還真的是,覺
02/25 09:24, 34F

02/25 09:24, 3周前 , 35F
得滿厲害的
02/25 09:24, 35F

02/25 09:47, 3周前 , 36F
可以自己試著比較whisperjav、gemini 2.5 pro誰轉
02/25 09:47, 36F

02/25 09:47, 3周前 , 37F
錄出的字幕比較好,gemini好處是自己可以寫prompt
02/25 09:47, 37F

02/25 09:47, 3周前 , 38F
,可以調整出你想保留或忽略的噪訊、氣音、破碎詞
02/25 09:47, 38F

02/25 09:47, 3周前 , 39F
彙,靈活性會更高,尤其是沒有固定台詞的素人片更
02/25 09:47, 39F

02/25 09:47, 3周前 , 40F
是如此,這得益於其極為強大的LLM能力
02/25 09:47, 40F
文章代碼(AID): #1fdOdSSE (japanavgirls)
文章代碼(AID): #1fdOdSSE (japanavgirls)