先前筆者曾介紹過RetroArch將透過光學文字系統(OCR)自動辨識遊戲字幕,並透過語音引擎將文字唸出來的功能,別急,這個功能還在開發中,不過從進度更新中,我們可以看到朗讀的流暢度明顯提升,而且官方也表示將會整合翻譯功能,協助玩家跨越語言隔閡。
OCR辨識立大功
OCR由Optical Character Recognition縮寫而來,中文翻譯為光學字元辨識,指的是將圖像中的字辨識成電腦的文字檔,舉例來說用掃瞄器掃瞄文件後,再將文件圖檔轉換成文字檔,就是利用這種技術。
而RetroArch的作法則是在模擬遊戲的過程中,辨識畫面中出現的字,並將這些字以圖檔的型式送到辨識系統,再轉換成文字檔。有了文字檔之後,我們就能輕鬆處理這些遊戲中出現的字,比方將它們送到語音合成系統、翻譯系統,將文字朗讀出來或翻譯成其他語言。
先前RetroArch開發團隊所展示的開發進度,需要在遊戲執行過程中不斷暫停,等待系統完成辨識,才會朗讀文字並繼續遊戲,這樣會大幅影響遊戲的流暢度。而在這次的進度更新中,可以看到辨識的效率大幅提升,雖然語音會比字幕晚幾秒出現,沒辦法達到即時朗讀的理想目標,但已經不需暫停遊戲,能讓玩家在不受干擾的情況下享受遊戲內容。
▲從影片中可以看到,系統不需暫停遊戲也能將文字朗讀出來。
還能外掛翻譯軟體
先前筆者就曾推測RetroArch在加入OCR功能後,下一步應該就是劍指翻譯功能,在這次的更新中,RetroArch開發團隊證實了這個猜測。
開發團隊表示正在研究將VGTranslate輕量級翻譯伺服器導入RetroArch,玩家可以在Windows或Linux電腦上架設伺服器,並透過網路將RetroArch擷取的文字資料送至伺服器,以達到翻譯遊戲內文字的效果。
這樣做的好處是可以將翻譯過程的運算需求與資料庫,從執行RetroArch的裝置轉移到另1台電腦,如此一來即便是Raspberry Pi等效能相對貧弱的單板電腦,也能享受翻譯功能。
然而開發團隊也提到OCR的困難之處,比方OCR引擎難以辨識遊戲標題畫面中的標誌(通常都是圖像化的特殊字體),而且如果日文遊戲的文字框採用半透明設計的話,在辨識日文字的時候就容易受到背景圖像干擾,產業準確度不理想的問題。
從目前的開發進度來看,這個功能已經可以在許多遊戲中正常運作,但有些遊戲的效果則受文字顯示方式影響而比較不理想。即便如此,開發團對仍表示會持續改善,並提升OCR、翻譯功能的相容性。
加入T客邦Facebook粉絲團
没有评论:
发表评论