當(dāng)下軟件園 / 匯聚當(dāng)下最新最酷的軟件下載站!
當(dāng)下軟件園

您的位置: 首頁(yè) > 多媒體類(lèi) > 媒體其它 > 硬字幕提取工具 V10.0 官方最新版
硬字幕提取工具 硬字幕提取工具 V10.0 官方最新版 / 硬字幕提取工具10.0下載 版本

  硬字幕提取工具是一款小巧易用的字幕提取軟件,可以幫助用戶快速提取對(duì)應(yīng)視頻的字幕內(nèi)容,軟件覆蓋了VideoSubFinder、SubtitleEdit、以及百度訊飛搜狗OCR的一個(gè)工具,方便實(shí)用。軟件采用AI文字檢測(cè)+傳統(tǒng)的數(shù)字圖像處理技術(shù),提取字幕圖片和時(shí)間軸信息,然后利用百度訊飛有道OCR通用文字識(shí)別云引擎+離線ocr引擎識(shí)別出文字,在校對(duì)窗校對(duì)后生成srt字幕文件,最后還可選調(diào)用第三方工具APP做調(diào)軸補(bǔ)漏等工作,從開(kāi)始到結(jié)束,整個(gè)字幕提取流程一氣呵成,快速準(zhǔn)確、識(shí)別率高、省時(shí)省力。有需要的朋友歡迎下載使用!

【功能特點(diǎn)】

  支持“雙語(yǔ)字幕”識(shí)別、字幕翻譯、動(dòng)態(tài)字幕等功能

  支持字幕保存,導(dǎo)入等功能

  支持在線翻譯功能。

【使用方法】

  1、準(zhǔn)備百度OCR服務(wù)APP_ID / API_KEY / SECRET_KEY

  百度注冊(cè)獲取百度通用文字識(shí)別服務(wù)的APP_ID / API_KEY / SECRET_KEY,

  一個(gè)手機(jī)號(hào)碼注冊(cè)一個(gè)賬號(hào)(須實(shí)名認(rèn)證)。

  每賬號(hào)每天免費(fèi)識(shí)別次數(shù)有規(guī)定,如不夠用可多注冊(cè)幾個(gè)賬號(hào)。對(duì)于長(zhǎng)期需求用戶,建議購(gòu)買(mǎi)次數(shù)吧,價(jià)格不貴,還能支持國(guó)家高科技發(fā)展。

  注冊(cè)步驟很簡(jiǎn)單,可自行百度,獲得的APP_ID / API_KEY / SECRET_KEY信息先保存起來(lái)下面會(huì)用到。

  如果您現(xiàn)在沒(méi)時(shí)間注冊(cè),可以下載本工具支持離線OCR識(shí)別的版本,使用里面的離線ocr來(lái)識(shí)別,本步驟可略過(guò)。

  2、準(zhǔn)備工作流程中最后可能用到的APP2第三方軟件

  百度下載安裝Subtitle Edit 作為 APP2

  注:APP2 不指定,可以選用戶熟悉的其他軟件,例如SubtitleEdit可換成Aegisub或 ArcTime

  如果對(duì)提取的字幕不需要精調(diào),只是一般使用,本步驟可略過(guò)。

  如果是離線OCR版須安裝包內(nèi)的vlc-3.0.12-win64.exe,不然智能截圖不能工作。

  3、設(shè)置硬字幕提取工具

  打開(kāi)軟件

硬字幕提取工具1

  點(diǎn)擊‘系統(tǒng)設(shè)置’

  填入步驟1獲得的百度OCR服務(wù)APP_ID / API_KEY / SECRET_KEY(如使用離線ocr引擎則不用做此步)

  點(diǎn)Browse找到步驟2安裝好的AP2P的入口exe文件(如不需調(diào)軸補(bǔ)漏則不用做此步),然后Save保存設(shè)置。

硬字幕提取工具2

  4、用VideoSubFinder_5.50_x64生成RGBImages

  點(diǎn)擊主界面VideoSubF按鍵,將啟動(dòng)運(yùn)行VideoSubFinder_5.50_x64(旁邊的‘智能截圖’按鍵是類(lèi)似于VideoSubFinder的另一個(gè)截圖工具,采用AI文字檢測(cè)+傳統(tǒng)的數(shù)字圖像處理技術(shù),善于提取復(fù)雜動(dòng)態(tài)字幕并能做到100%不漏,高級(jí)用戶可學(xué)習(xí)第四章之-高級(jí)功能)

硬字幕提取工具3

  點(diǎn)擊左上角File -> Open Video(FFMPEG)(如不能打開(kāi)視頻,可換OPENCV),打開(kāi)要提取字幕的視頻文件(本例為:倚天屠龍記之魔教教主-中字.mp4)

  快速瀏覽全片,查看字幕區(qū)間矩形最大范圍(注意有些視頻是兩層字幕),用兩根豎線兩根橫線設(shè)置字幕截圖區(qū)間(四根線在視頻窗口邊緣不容易發(fā)現(xiàn),試著點(diǎn)擊選中可以移動(dòng)它)。注意:矩形邊框要比實(shí)際字幕稍大,不要為了節(jié)省圖片尺寸而把區(qū)間設(shè)置成緊貼字幕,如果字幕周邊余量太小,會(huì)影響后續(xù)百度OCR識(shí)別(當(dāng)然也沒(méi)必要設(shè)置得太大)。

硬字幕提取工具4

  點(diǎn)擊Search右邊的Settings,出現(xiàn)設(shè)置界面,我們只關(guān)心左邊這塊能影響Search字幕圖片的參數(shù)。

硬字幕提取工具5

  第一個(gè)參數(shù)‘Text Alignment’默認(rèn)設(shè)置是‘Center’,須點(diǎn)擊設(shè)置成‘Any’。

  其他眾多參數(shù)中,有一個(gè)參數(shù)至關(guān)重要,就是Use Filter Colors這項(xiàng),default值是空的,其他參數(shù)可以不設(shè),這個(gè)一定要設(shè)置上,特別是非純白字幕,例如黃色!如果不設(shè)置,有大幾率會(huì)漏字幕。

  我們需要取色字幕文字的骨干顏色(骨干外則是字幕輪廓顏色,不要取偏了),然后將顏色值填入,將有助于VideoSubFinder判斷字幕出現(xiàn)和結(jié)束的時(shí)間,生成正確的時(shí)間軸信息,并防止丟時(shí)間軸。常見(jiàn)字幕顏色可能有白色的、黃色的,或者其他顏色,本例電影的字幕是白色。如果是多色字幕,可以按VSF要求取色多色填入。

  具體的參數(shù)設(shè)置,可以參考Docs目錄下的readme_eng.txt,專(zhuān)業(yè)用戶精調(diào)參數(shù)可以提高Search字幕幀的準(zhǔn)確率,從而減少丟時(shí)間軸(少字幕圖片,致命)和假時(shí)間軸(空字幕圖片,影響不大)的情況,不過(guò)據(jù)筆者使用經(jīng)驗(yàn),如果沒(méi)弄明白參數(shù)含義和作用,隨意調(diào)整反而適得其反,普通用戶還不如不調(diào)的好。

  在右邊界面先點(diǎn)一下Pixel Color

硬字幕提取工具6

  然后點(diǎn)擊字幕白色文字中心骨干取色,點(diǎn)不準(zhǔn)可以多點(diǎn)幾下。

硬字幕提取工具7

  取到了顏色,會(huì)顯示出來(lái)

硬字幕提取工具8

  本例將Lab: l:245 a:127 b:129 拷貝后雙擊填入U(xiǎn)se Filter Coloers,一般做了這步就可以基本保證不會(huì)有時(shí)間軸丟失的情況,算是完成了Search的設(shè)置。

硬字幕提取工具9

  點(diǎn)擊Search -> Clear Foders 清空RGBImages目錄,

  然后點(diǎn) OCR Search,程序開(kāi)始掃描視頻文件,生成RGBImages。

硬字幕提取工具10

  幾分鐘后掃描完成,可以關(guān)掉VideoSubFinder_5.50_x64,這時(shí)工具將顯示RGBImages目錄下的所有字幕截圖:

硬字幕提取工具11

  初次使用我們可以在文件列表區(qū)按鼠標(biāo)右鍵菜單,選‘Open folder’打開(kāi)RGBImages目錄看一下:

硬字幕提取工具12

  這些是剛才VideoSubFinder_5.50_x64 Search生成的1000多個(gè)字幕切片圖片文件,說(shuō)明這個(gè)電影有1000多條字幕呢。文件名前段為時(shí)間軸信息。

  可以打開(kāi)文件看看,是RGB原色字幕截圖切片,很適合AI訓(xùn)練過(guò)的OCR引擎做識(shí)別。

硬字幕提取工具13

  5、清理空字幕圖片

  我們可以在‘刪合窗’中清除RGBImages目錄中的空字幕圖片。

  由于VideoSubFinder 的Search算法還沒(méi)做到100%準(zhǔn)確,所以會(huì)誤生成少量無(wú)字幕空?qǐng)D片(假時(shí)間軸),有時(shí)還會(huì)把廣告也截圖下來(lái),我們?cè)?lsquo;刪合窗’中用鼠標(biāo)滾輪快速翻頁(yè)瀏覽RGBImages目錄,把發(fā)現(xiàn)的空字幕、廣告水印圖片打上刪除標(biāo)記,標(biāo)記完最后統(tǒng)一刪除,讓后續(xù)百度OCR識(shí)別不用浪費(fèi)每月有限額度,同時(shí)在校對(duì)階段不用再頻繁做刪除工作。

  一頁(yè)可以顯示20~300張圖片(默認(rèn)90張),瀏覽、標(biāo)記、刪除非常方便。

  翻頁(yè):點(diǎn)擊<<<、>>>按鍵,或鍵盤(pán)PgUp/PgDn鍵、↑/↓鍵,或?qū)?a href="http://virtualinsta360.com/zhuanti/68.html" target="_blank" class="keylink">鼠標(biāo)指針停留在圖片區(qū),滾動(dòng)鼠標(biāo)滾輪,可以翻頁(yè)。

  標(biāo)記:鼠標(biāo)左鍵點(diǎn)擊可以標(biāo)記選中圖片,再次點(diǎn)擊可以去選中。Shift+鼠標(biāo)左鍵可以連續(xù)多選、連續(xù)去選(可跨頁(yè))。

  刪除:直到最后一頁(yè)標(biāo)記完成,點(diǎn)<<面板上的‘全刪合’按鍵會(huì)彈出刪除提示,確認(rèn)后將刪除所有標(biāo)記過(guò)的空?qǐng)D片。

  更多方便的功能(例如合并重復(fù)字幕)可以看“第四節(jié)之 視頻截圖、刪合窗(刪除合并)”

  如下圖一處為廣告,可以選中標(biāo)記它:

硬字幕提取工具14

  如下圖幾處為空字幕圖片,可以選中標(biāo)記它:

硬字幕提取工具15

  一直標(biāo)記到最后一頁(yè):

硬字幕提取工具16

  然后點(diǎn)‘全刪’,

硬字幕提取工具17

  確認(rèn)后將會(huì)把剛才標(biāo)記過(guò)的所有空字幕、廣告水印圖片刪除掉(如果發(fā)現(xiàn)不能刪除,多半是系統(tǒng)權(quán)限問(wèn)題,請(qǐng)不要將本工具安裝在C盤(pán)或桌面):

硬字幕提取工具18

  清理完空字幕圖片后,點(diǎn)擊面板上的‘去OCR’按鍵,將切換到OCR校對(duì)窗。

硬字幕提取工具19

  6、運(yùn)行百度OCR識(shí)別

  百度高精度每月免費(fèi)識(shí)別額度較低,如不采用疊圖技術(shù) --- 將多張字幕圖片合成一張大圖來(lái)識(shí)別以節(jié)省額度,每月只能識(shí)別較少字幕圖片,因此,如果用戶沒(méi)有購(gòu)買(mǎi)額度,應(yīng)該在面板上勾選‘疊圖’。

硬字幕提取工具20

  如果沒(méi)有注冊(cè)百度,而是采用離線識(shí)別引擎可選tr并去掉勾選疊圖。

  點(diǎn)擊主界面的OCR按鍵,程序?qū)⑦B接百度OCR服務(wù)器,對(duì)RGBImages目錄中的所有字幕圖片從頭到尾按順序做識(shí)別,只需等待完成即可。

硬字幕提取工具21

  OCR識(shí)別完成了! (細(xì)心的用戶可能會(huì)留意到:在識(shí)別過(guò)程中有少量圖片會(huì)有自動(dòng)標(biāo)注‘X’,這是因?yàn)槌绦蛟贠CR識(shí)別過(guò)程中會(huì)自動(dòng)標(biāo)注空字幕圖片,因?yàn)樯蟼€(gè)手動(dòng)刪空步驟遺留了少量空字幕圖片,所以呢,如果你額度充足,是可以不用做手動(dòng)刪空步驟的)

  這時(shí)在RGBImages目錄下已經(jīng)為每個(gè).jpeg文件生成了一個(gè)同名的 .txt字幕文件,以及檢測(cè)框坐標(biāo)文件_boundingbox.txt,初次使用可以看一下。

硬字幕提取工具22

  7、校對(duì)字幕

  如果希望在SubtitleEdit等字幕軟件中做校對(duì),可以略過(guò)這個(gè)步驟,直接到下個(gè)步驟

  校對(duì)窗顯示一頁(yè)1~4列、1~10行(默認(rèn)1列6行)圖文。用戶可根據(jù)需要在系統(tǒng)設(shè)置里設(shè)置。

硬字幕提取工具23

  編輯:可以用輸入法進(jìn)行常規(guī)的輸入、刪除、鼠標(biāo)左鍵/右鍵插入空格、回車(chē)等操作。

  查找替換:除了支持簡(jiǎn)單的批量替換,還支持* ?通配符、反斜杠轉(zhuǎn)義等擴(kuò)展找替換、正則表達(dá)式匹配替換等。

  翻頁(yè)自動(dòng)保存:點(diǎn)擊<<<、>>>按鍵,或鍵盤(pán)PgUp/PgDn鍵,或?qū)⑹髽?biāo)指針停留在圖片區(qū),滾動(dòng)鼠標(biāo)滾輪、或↑/↓鍵,都可以進(jìn)行翻頁(yè)。翻頁(yè)將自動(dòng)保存校對(duì)修改過(guò)的文字。

  選中標(biāo)記:ctrl+鼠標(biāo)左鍵 可以標(biāo)記刪除圖片,shift+鼠標(biāo)左鍵 可以標(biāo)記合并圖片,再次點(diǎn)擊可以去選中。

  刪除合并:如果有選中的圖片,這時(shí)<<按鍵盤(pán)<Delete>按鍵會(huì)彈出刪除合并提示,OK確認(rèn)或<Enter>將執(zhí)行刪除、合并。

  刪除合并范圍:當(dāng)前頁(yè)+后1頁(yè)=2頁(yè)內(nèi),后向跨頁(yè)合并是可能的。

  校對(duì)完成后,按面板上的‘生成SRT’按鍵,將在RGBImages目錄下生成123.srt文件:

硬字幕提取工具24

  可以大概瀏覽一下,然后關(guān)掉。

  生成SRT文件后,如時(shí)間軸不需要再調(diào)整、字幕不需要比對(duì)原視頻做補(bǔ)漏(要求不高),則至此字幕提取工作完成。

  更多方便的功能(例如‘精準(zhǔn)對(duì)齊’,‘鼠標(biāo)左右鍵自定義功能’,‘字體選擇’,‘字號(hào)調(diào)整’,‘每行字號(hào)單獨(dú)調(diào)整’)可以看“用戶手冊(cè)之第四章之 校對(duì)窗”

  生成SRT文件后,如需調(diào)整時(shí)間軸、比對(duì)原視頻做補(bǔ)漏,點(diǎn)擊面板上的‘SubtitleE’按鍵,將打開(kāi)SubtitleEdit工具編輯123.srt字幕文件。

硬字幕提取工具25

  8、用SubtitleEdit編輯字幕文件

  之所以前面在校對(duì)窗做過(guò)校對(duì),這里又用到APP2來(lái)做編輯,是因?yàn)橛行┯脩簦ɡ缱帜唤M)對(duì)字幕要求高,還需要做調(diào)軸、補(bǔ)漏等進(jìn)一步校對(duì)工作。

  在波形圖窗口里,“點(diǎn)擊以添加波形”,打開(kāi)視頻文件,本例是‘倚天屠龍記之魔教教主-中字.mp4’,將生成波形數(shù)據(jù):

硬字幕提取工具26

  在波形圖窗口,勾選‘選擇當(dāng)前播放時(shí)刻的字幕’,設(shè)定播放速度,例如200%,然后開(kāi)始播放視頻,字幕會(huì)同步顯示在播放窗口,可隨時(shí)暫停播放,進(jìn)行字幕校對(duì)、補(bǔ)漏、調(diào)軸。

  該刪除的刪除,該修正的修正,該替換的替換,改補(bǔ)漏的補(bǔ)漏、該調(diào)軸的調(diào)軸,注重細(xì)節(jié)的用戶還是認(rèn)真過(guò)一遍吧。

  完成字幕校對(duì)后,點(diǎn)擊“文件->另存為” 保存校對(duì)好的字幕文件,SubtitleEdit會(huì)自動(dòng)將123.srt重命名為跟視頻文件同名的srt文件“倚天屠龍記之魔教教主-中字.srt”,并保存在視頻文件所在目錄下,方便大多數(shù)播放軟件播放視頻文件時(shí)自動(dòng)加載同名字幕文件。

硬字幕提取工具27

  至此,整個(gè)硬字幕提取流程就走完了。

軟件特別說(shuō)明

標(biāo)簽: 字幕提取

其他版本下載
網(wǎng)友評(píng)論
回頂部 去下載

關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們

Copyright ? 2005-2025 virtualinsta360.com.All rights reserved.

浙ICP備2024132706號(hào)-1 浙公網(wǎng)安備33038102330474號(hào)