1.支持多個(gè)語種語音識(shí)別能力:根據(jù)需要提供中文、英文、日語、韓語等語種,支持藏語、維語兩種少數(shù)民族語言,支持四川方言、粵語的語音識(shí)別能力。
2.支持命令詞識(shí)別的能力,基于語法規(guī)則和結(jié)果置信度,準(zhǔn)確識(shí)別指令轉(zhuǎn)寫結(jié)果,可用于語音控制。
3.支持錄音文件轉(zhuǎn)寫能力:要能夠?qū)崿F(xiàn)對(duì)中文普通話、英文等語種的音頻文件轉(zhuǎn)寫文字功能,支持 MP3 、WAV、PCM 、M4A 、WMA 、MP4 、OPUS 、AMR 、3GP、AAC 、FLAC 等音頻文件格式;。
4.上傳音視頻轉(zhuǎn)文字:可以上傳錄制的音視頻文件,然后對(duì)音視頻轉(zhuǎn)文字,形成對(duì)應(yīng)的 AI 字幕文件。
5.支持語氣詞過濾,可手動(dòng)添加語氣詞過濾規(guī)則,開啟語氣詞過濾后在識(shí)別結(jié)果中自動(dòng)刪去匹配的語氣詞。
6.實(shí)時(shí)識(shí)別支持自定義說話人,可配置說話人信息用于角色分離功能開發(fā)。
7.語音增強(qiáng):系統(tǒng)要具備高效的語音增強(qiáng)能力,以滿足在多種環(huán)境中應(yīng)用,引擎要內(nèi)置降噪模塊,要能夠降低一定范圍內(nèi)噪音對(duì)識(shí)別的干擾。
8.支持實(shí)時(shí)語音識(shí)別能力:通過調(diào)音臺(tái)、聲卡等設(shè)備采集實(shí)時(shí)音頻流,并實(shí)時(shí)轉(zhuǎn)寫成文字。
9.支持一句話語音識(shí)別能力:支持不超過一分鐘的音頻流轉(zhuǎn)成文本。
10.支持自動(dòng)智能標(biāo)點(diǎn),智能判斷對(duì)識(shí)別的文本添加標(biāo)點(diǎn)。
11.支持敏感詞過濾:可手動(dòng)配置敏感詞,可用于敏感詞進(jìn)行屏蔽、標(biāo)注或刪除等功能開發(fā)。
12.轉(zhuǎn)寫支持自動(dòng)關(guān)鍵詞提?。簩?duì)中文普通話語種,上傳錄音文件時(shí)指定關(guān)鍵詞數(shù)量上限,系統(tǒng)將自動(dòng)提取不超過該數(shù)量的關(guān)鍵詞,并可根據(jù)相關(guān)性和詞頻進(jìn)行排序。
13.字幕編輯功能:能夠?qū)σ曨l字幕進(jìn)行人工微調(diào)修正,形成正確的字幕文件。
14.支持開啟詞級(jí)別的對(duì)齊結(jié)果,可以用于音字同步精確到毫秒(ms)級(jí)別。
15.視頻與文字同步功能,可以根據(jù)展示的字幕結(jié)果,選中具體的字幕,然后視頻跳轉(zhuǎn)到對(duì)應(yīng)位置。
16.錄音文件轉(zhuǎn)寫支持文稿模式和字幕模式兩種輸出格式。
18.實(shí)時(shí)字幕:可以實(shí)時(shí)語音轉(zhuǎn)文字,并形成實(shí)時(shí)的字幕功能。
17.智能化檢索:可以在所有視頻中檢索知識(shí)點(diǎn)和重點(diǎn)內(nèi)容,實(shí)現(xiàn)知識(shí)點(diǎn)在視頻中的精準(zhǔn)定位。
18.視頻播放字幕功能:視頻播放的時(shí)候, 自動(dòng)加載 AI 字幕。
19.支持語音檢出(VAD)能力:系統(tǒng)要能夠?qū)斎氲匿浺粑募M(jìn)行分析,能夠確定音頻的起始和終止的處理過程。
20.支持逆文本標(biāo)準(zhǔn)化,將語音識(shí)別結(jié)果中的日期、數(shù)字等對(duì)象以標(biāo)準(zhǔn)化格式展示。
21.支持 16kHz/8kHz 采樣率,16bit 位深,單通道音頻。
22.識(shí)別熱詞管理:中文熱詞導(dǎo)入及編輯,例如涉及到人名、地名、公司名等特殊易錯(cuò)的詞匯,可以作為熱詞直接替換并提供熱詞接口。
23.錄制音視頻轉(zhuǎn)文字:可以對(duì)錄制的音視頻進(jìn)行語音轉(zhuǎn)文字,并自動(dòng)生成字幕。
24.敏感詞管理:可根據(jù)引擎開發(fā)敏感詞相關(guān)功能,例如敏感詞屏蔽、報(bào)警等。
25.熱詞管理:可在界面開發(fā)熱詞設(shè)定功能,對(duì)熱詞進(jìn)行效果加強(qiáng)。
26.數(shù)據(jù)分析:可以根據(jù)字幕文件,對(duì)教學(xué)視頻內(nèi)容進(jìn)行處理和分析。
27.語氣詞管理:可根據(jù)引擎開發(fā)出語氣詞管理和過濾功能。
28.識(shí)別結(jié)果響應(yīng)時(shí)間標(biāo)準(zhǔn)測(cè)試集≤500 毫秒。
29.部署要求:為了保證數(shù)據(jù)安全性和相應(yīng)速度,可提供所有的 AI 引擎、后臺(tái)軟件本地離線部署和使用,所使用的技術(shù)和軟件自主可控。