語音越來越成為一種與我們的設備進行交互的方法,它是需要此類可訪問性方法的人們的唯一方法。 在任何情況下,都可以說出口授文字或簡單地將語音命令輸入到我們的系統中,這樣他們就可以不用手就可以進行某種操作。 問題是 語音識別 它們基於使用數學算法來識別語音的引擎,並且並非100%可靠。
技術的進步越來越多地帶來了 可靠性 到完美,人工智能和大數據系統也極大地幫助改善了語音識別程序。 近來,人們進行了許多努力以最大程度地改善這些系統,並且許多研究都集中在其上,以改善控制並使其成為未來的接口。 請記住,當前的界面對人來說不那麼自然,而且比語音的速度還差。
語音識別系統的價值將在未來幾年內達到約10億美元,這就是為什麼大型公司將重點發展諸如Apple的Siri,Microsoft的Cortana或 Mycroft Linux版,除了變得越來越受歡迎和頻繁使用的產品(例如家庭用的Amazon Echo,Google Home或Apple HomePod)之外,還將先進的語音識別系統集成到了聯網汽車中。
那說, 我們針對Linux的語音識別工具列表 聲音:
- 朱利葉斯:是功能強大的連續語音識別引擎,具有大量詞彙。
- 深度語音:是百度DeepSpeech架構的TensorFLow實現。
- 西蒙:一個相當靈活的語音識別軟件。
- 卡爾迪:是用於語音識別研究的C ++設計工具包。
- ph魚:在這種情況下,它是用於移動應用和服務器的語音識別引擎。
- deepspeech.python:是使用Python並使用百度Warp-CTC的DeepSPeech的實現。
很好,Linux是否會有好的TTS(文本到語音)?
在Windows和Android中,有質量很好的聲音,例如Loquendo,Ivona或NeoSpeech,但它們不適用於Linux。 在Linux上,我嘗試了mbrola和picoTTS語音,但是它們非常機器人化。
Cepstral為Linux提供了免費的Alejandra語音,這相當不錯,但我不知道如何安裝。
如果你能得到很好的分享,我會走同樣的路
您可以在Linux上將loquendo與wine一起使用。 我推薦這部影片...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
我試圖安裝一個助手,我的意思是說Google助手,但是我不能,我留在註冊表文件中,我認為它叫做。 太糟糕了,Alexa真是可惜...
espeak程序可在debian apt install espeak控制台上運行。 並加入例如espeak -ves«Hello World»
-ves是v =聲音是=西班牙語
您可以選擇許多選項來讀取文本文件,並將結果寫入wav文件。
問候
事實是非常糟糕,窗戶是另一個世界...在這裡,他們落後了10年
3年後,是的! 這仍然是遲到的。