Re: [問題] 有好用的影片即時翻譯軟體嗎?

看板japanavgirls (AV女優)作者 (水色)時間6小時前 (2026/02/24 19:22), 5小時前編輯推噓5(5021)
留言26則, 6人參與, 2小時前最新討論串3/3 (看更多)
這邊倒是有非即時翻譯影片的方案,算是付費的方案,最好是用gemini、chatgpt的 api 我自己是用AI TranslateSRT來翻譯外文影片,靠AI寫專門的prompt來應對轉錄不同 的影片時,所需的聲音轉文字的需求。 不同影片可以設定成完全不同的prompt,可以專門優化成FC2、商業AV、動漫、電影 等pormpt,這些prompt靠chatgpt 、claude線上討論修改一下就能滿足需求。 例如whisper是沒辦法滿足我觀看FC2時,所需要的狀聲詞、氣音與修飾需求,但FC2 這類影片反而會因為這些破碎詞彙,而產生更有臨場感的體驗。 但我自架whisper時,發現它太容易將這些破碎詞當作無用的詞彙過濾掉,而且又要 去調用其他的LLM才達到可用程度。 但AI TranslateSRT可以透過調整prompt,可直接調用gemini 2.5 pro本身極為強大 的LLM能力,直接輸出可讀的字幕,直接少了本地硬體的需求。 AI TranslateSRT裡面的一些設定可以靠AI詢問來自行調整參數設定,避免遇到限流 、字幕缺少等問題。 當然缺點是你必須申請google ai studio,而且google cloud必須要有額度才能使 用,但現在有Google爸爸佛心的給大家300美元的額度,目前這活動還在,可以讓你現在免 費體驗。 不過我發現要調用gemini 2.5 pro的話,你必須將google cloud升級至付費帳戶, 並填寫信用卡,這樣AI TranslateSRT才能調用這類的高級模型。 但是我嫌AI TranslateSRT只能用gemini翻譯成中文,所以只讓AI translateSRT產 生原始語言的字幕檔,再將丟進subtitle-translator-electron來使用不同的AI來翻譯,當 然這程式也能使用自己調整過的prompt來翻譯字幕,以應對不同影片的需求。 這種流程算是目前不依靠顯示卡,完全依靠主流大模型來翻譯本地影片的簡單方法 ,而且能產生很精確的字幕、逐字稿等等 當然更省錢的翻譯方式就是直接將AI TranslateSRT的字幕檔丟進gemini、chatgpt線上版, 如果你有訂閱的話 ,基本上是可以讓你無限翻譯字幕,gemini甚至還能設定gem,專門設置翻譯用提示詞,讓 你連續輸出字幕翻譯。不過即使你有訂閱,線上版還是有流量限制,你可以設定提示詞,只 讓gemini只輸出字幕而不輸出時間戳,這樣更省token,之後將這些字幕透過subtitle edit 來直接合併回你原本用AI TranslateSRT產生的字幕,這樣更省錢 https://github.com/gnehs/subtitle-translator-electron https://github.com/suyanali/AI_TranslateSRT?tab=readme-ov-file -- Sent from my iPhone 17 Pro Max PiTT // PHJCI -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.47.139 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/japanavgirls/M.1771932124.A.70E.html

02/24 19:38, 5小時前 , 1F
這工作流感覺不錯,感謝分享!
02/24 19:38, 1F
※ 編輯: luwatercolor (114.34.47.139 臺灣), 02/24/2026 19:44:41

02/24 19:50, 5小時前 , 2F
AV版變AI版了
02/24 19:50, 2F
※ 編輯: luwatercolor (114.34.47.139 臺灣), 02/24/2026 20:03:53 ※ 編輯: luwatercolor (114.34.47.139 臺灣), 02/24/2026 20:04:46

02/24 20:20, 5小時前 , 3F
剛丟字幕檔給Gemini,結果他說不能翻譯色情內容Q
02/24 20:20, 3F

02/24 20:33, 4小時前 , 4F
先叫ai教你排版好嗎
02/24 20:33, 4F

02/24 20:47, 4小時前 , 5F
手機發文的沒辦法
02/24 20:47, 5F

02/24 20:52, 4小時前 , 6F
當然直接丟gemini是不行的,要給提示詞,而chatgpt
02/24 20:52, 6F

02/24 20:52, 4小時前 , 7F
的話,會更寬鬆些,但都要提示詞
02/24 20:52, 7F

02/24 21:36, 3小時前 , 8F
翻譯字幕會有些擔心內容會不會因為斷句的關係 或被時間
02/24 21:36, 8F

02/24 21:36, 3小時前 , 9F
戳給切斷 而導致翻譯不正確、不通順 請問使用AI Transla
02/24 21:36, 9F

02/24 21:36, 3小時前 , 10F
teSRT翻譯 會有讓你如此感覺嗎 謝謝 有看到能輸入提示詞
02/24 21:36, 10F

02/24 21:36, 3小時前 , 11F
可不可以使用提示詞叫它先忽略時間戳 翻完再併回去
02/24 21:36, 11F

02/24 21:56, 3小時前 , 12F
這程式理論上可以完全不輸出時間戳的,這可以靠pro
02/24 21:56, 12F

02/24 21:56, 3小時前 , 13F
mpt來控制,但AI通常會有容易漂移的現象,若不讓字
02/24 21:56, 13F

02/24 21:56, 3小時前 , 14F
幕有遵循的數列或是時間戳,AI很容易亂跳字幕,再
02/24 21:56, 14F

02/24 21:56, 3小時前 , 15F
來這程式可以設定單行字數上限和重疊容忍 (秒):允
02/24 21:56, 15F

02/24 21:56, 3小時前 , 16F
許相鄰字幕在時間上的重疊秒數,用於處理合唱或對
02/24 21:56, 16F

02/24 21:56, 3小時前 , 17F
話緊湊的情境。這樣子能最低限度降低斷句問題,並
02/24 21:56, 17F

02/24 21:56, 3小時前 , 18F
且gemini 2.5 pro的LLM能力是十分強大的,它的斷句
02/24 21:56, 18F

02/24 21:56, 3小時前 , 19F
能力通常強於絕大多數模型,甚至我要求它特意轉錄
02/24 21:56, 19F

02/24 21:56, 3小時前 , 20F
破碎語句,它都能很好的輸出我要的破碎感。當然這
02/24 21:56, 20F

02/24 21:56, 3小時前 , 21F
需要你做一個嚴苛的prompt來約束
02/24 21:56, 21F

02/24 22:36, 2小時前 , 22F
我是想要時間戳的呀~是怕時間戳影響到它的翻譯 才在想能
02/24 22:36, 22F

02/24 22:36, 2小時前 , 23F
不能要求它翻完再加上去 因為以前看過一個大概2024年中
02/24 22:36, 23F

02/24 22:36, 2小時前 , 24F
的AI評測影片 當時的模型看起來似乎是會影響到的 不過聽
02/24 22:36, 24F

02/24 22:36, 2小時前 , 25F
到你的實測分享 那麼我就安心了~我感覺你好像就是作者
02/24 22:36, 25F

02/24 22:36, 2小時前 , 26F
如果是的話很感謝你的分享
02/24 22:36, 26F
文章代碼(AID): #1fdOdSSE (japanavgirls)
文章代碼(AID): #1fdOdSSE (japanavgirls)