youtuber社群: RetroArch萬用模擬器語音朗讀功能再進化，自動翻譯呼之欲出

先前筆者曾介紹過RetroArch將透過光學文字系統（OCR）自動辨識遊戲字幕，並透過語音引擎將文字唸出來的功能，別急，這個功能還在開發中，不過從進度更新中，我們可以看到朗讀的流暢度明顯提升，而且官方也表示將會整合翻譯功能，協助玩家跨越語言隔閡。

OCR辨識立大功

OCR由Optical Character Recognition縮寫而來，中文翻譯為光學字元辨識，指的是將圖像中的字辨識成電腦的文字檔，舉例來說用掃瞄器掃瞄文件後，再將文件圖檔轉換成文字檔，就是利用這種技術。

而RetroArch的作法則是在模擬遊戲的過程中，辨識畫面中出現的字，並將這些字以圖檔的型式送到辨識系統，再轉換成文字檔。有了文字檔之後，我們就能輕鬆處理這些遊戲中出現的字，比方將它們送到語音合成系統、翻譯系統，將文字朗讀出來或翻譯成其他語言。

先前RetroArch開發團隊所展示的開發進度，需要在遊戲執行過程中不斷暫停，等待系統完成辨識，才會朗讀文字並繼續遊戲，這樣會大幅影響遊戲的流暢度。而在這次的進度更新中，可以看到辨識的效率大幅提升，雖然語音會比字幕晚幾秒出現，沒辦法達到即時朗讀的理想目標，但已經不需暫停遊戲，能讓玩家在不受干擾的情況下享受遊戲內容。

▲從影片中可以看到，系統不需暫停遊戲也能將文字朗讀出來。

▲ 在《雷神之鎚》中，系統可以辨識並朗讀出現於畫面中央與左上的文字，而且不需中斷遊戲。