TTS的全稱為Text To Speech,即“從文本到語音”。
它是同時運用語言學和心理學的杰出之作,在內(nèi)置芯片的支持之下,通過神經(jīng)網(wǎng)絡的設計,把文字智能地轉(zhuǎn)化為自然語音流。 TTS技術(shù)對文本文件進行實時轉(zhuǎn)換,轉(zhuǎn)換時間之短可以秒計算。
在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺自然,毫無機器語音輸出的冷漠與生澀感。TTS語音合成技術(shù)即將覆蓋國標一、二級漢字,具有英文接口,自動識別中、英文,支持中英文混讀。
所有聲音采用真人普通話為標準發(fā)音,實現(xiàn)了120-150個漢字/秒的快速語音合成,朗讀速度達3-4個漢字/秒,使用戶可以聽到清晰悅耳的音質(zhì)和連貫流暢的語調(diào)。
很多海洋食品中毒事件都與TTX 有關(guān),河豚中毒是魚類中毒中最為嚴重的一類,患者病死率高達60%。
TTX中毒的主要臨床表現(xiàn)為知覺麻痹、運動障礙、頭暈頭痛、惡心嘔吐、血壓下降、呼吸困難、嚴重者因呼吸衰竭而死亡。TTX 還是麻醉劑,其局部麻醉作用是普魯卡因(procaine)的4000倍,可作為癌癥后期的緩解藥。
TTX 的作用機理與陸地發(fā)現(xiàn)的毒素不同,極低的濃度就能選擇性地抑制鈉離子通過神經(jīng)細胞膜,但卻允許鉀離子通過,TTX 是一種電壓敏感的鈉通道(voltage gated sodium channels ,VGSC)外口特異性阻滯劑,神經(jīng)、肌肉、心肌傳導纖維等可興奮細胞膜生的鈉通道,并具有高度專一性,其作用機制是通過與膜上的專一受體結(jié)合,再通過關(guān)啟機制關(guān)閉通道,從而阻滯神經(jīng)細胞的興奮與傳導。 TTX 分子中1 ,2 ,32胍氨基及其附近的C4 ,C9 ,C10 碳上的羥基為活性基團。
胍氨基在生理條件下通過質(zhì)子化形成正電活性區(qū)域,與專一受體蛋白的負性羥基結(jié)合,其周圍羥基以氫鍵形式與受體結(jié)合,受體位于膜外層離子孔附近。 TTX 是神經(jīng)生物學和藥理學研究極為有用的工具藥。
TTX 還是一種較強的鎮(zhèn)痛藥,除對術(shù)后疼痛無效外,對其他疼痛均有效,作用緩慢且持久,沒有成癮性的報道。 。
[編輯本段]TTS概述 TTS是Text To Speech的縮寫,即“從文本到語音”。
它是同時運用語言學和心理學的杰出之作,在內(nèi)置芯片的支持之下,通過神經(jīng)網(wǎng)絡的設計,把文字智能地轉(zhuǎn)化為自然語音流。TTS技術(shù)對文本文件進行實時轉(zhuǎn)換,轉(zhuǎn)換時間之短可以秒計算。
在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺自然,毫無機器語音輸出的冷漠與生澀感。TTS語音合成技術(shù)即將覆蓋國標一、二級漢字,具有英文接口,自動識別中、英文,支持中英文混讀。
所有聲音采用真人普通話為標準發(fā)音,實現(xiàn)了120-150個漢字/秒的快速語音合成,朗讀速度達3-4個漢字/秒,使用戶可以聽到清晰悅耳的音質(zhì)和連貫流暢的語調(diào)?,F(xiàn)在有少部分MP3隨身聽具有了TTS功能。
TTS是語音合成應用的一種,它將儲存于電腦中的文件,如幫助文件或者網(wǎng)頁,轉(zhuǎn)換成自然語音輸出。TTS可以幫助有視覺障礙的人閱讀計算機上的信息,或者只是簡單的用來增加文本文檔的可讀性。
現(xiàn)在的TTL應用包括語音驅(qū)動的郵件以及聲音敏感系統(tǒng)。TTS經(jīng)常與聲音識別程序一起使用。
現(xiàn)在有很多TTS的產(chǎn)品,包括Read Please 2000, Proverbe Speech Unit,以及Next Up Technology的TextAloud。朗訊、Elan、以及 AT&T都有自己的語音合成產(chǎn)品。
除了TTS軟件之外,很多商家還提供硬件產(chǎn)品,其中包括以色列WizCom Technologies公司的 Quick Link Pen,它是一個筆狀的可以掃描也可以閱讀文字的設備;還有Ostrich Software公司的Road Runner,一個手持的可以閱讀ASCII文本的設備;另外還有美國DEC公司的DecTalk TTS,它是可以替代聲卡的外部硬件設備,它包含一個內(nèi)部軟件設備,可以與個人電腦自己的聲卡協(xié)同工作。 [編輯本段]TTS解析 TTS文語轉(zhuǎn)換用途很廣,包括電子郵件的閱讀、IVR系統(tǒng)的語音提示等等,目前IVR系統(tǒng)已廣泛應用于各個行業(yè)(如電信、交通運輸?shù)龋?/p>
TTS所用的關(guān)鍵技術(shù)就是語音合成(SpeechSynthesis)。早期的TTS一般采用專用的芯片實現(xiàn),如德州儀器公司的TMS50C10/TMS50C57、飛利浦的PH84H36等,但主要用在家用電器或兒童玩具中。
而基于微機應用的TTS一般用純軟件實現(xiàn),主要包括以下幾部分: ●文本分析-對輸入文本進行語言學分析,逐句進行詞匯的、語法的和語義的分析,以確定句子的低層結(jié)構(gòu)和每個字的音素的組成,包括文本的斷句、字詞切分、多音字的處理、數(shù)字的處理、縮略語的處理等。 ●語音合成-把處理好的文本所對應的單字或短語從語音合成庫中提取,把語言學描述轉(zhuǎn)化成言語波形。
●韻律處理-合成音質(zhì)(Qualityof Synthetic Speech)是指語音合成系統(tǒng)所輸出的語音的質(zhì)量,一般從清晰度(或可懂度)、自然度和連貫性等方面進行主觀評價。清晰度是正確聽辨有意義詞語的百分率;自然度用來評價合成語音音質(zhì)是否接近人說話的聲音,合成詞語的語調(diào)是否自然; 連貫性用來評價合成語句是否流暢。
要合成出高質(zhì)量的語音,所采用的算法是極為復雜的,因此對機器的要求也非常高。算法的復雜度決定了目前微機并發(fā)進行多通道TTS的系統(tǒng)容量。
TTS在CTI的應用中的基本構(gòu)架 在一般的CTI應用系統(tǒng)中,都會有IVR(交互式語音應答系統(tǒng))。IVR系統(tǒng)是呼叫中心的重要組成部分,通過IVR系統(tǒng),用戶可以利用音頻按健電話輸入信息,從系統(tǒng)中獲得預先錄制的數(shù)字或合成語音信息。
具有TTS功能的IVR可以加快服務速度,節(jié)約服務成本,使IVR為呼叫者提供7*24小時的服務。 目前常見的IVR系統(tǒng)大都是通用的工控機平臺上插入語音板卡組成,并支持中文語音合成TTS等技術(shù)。
一個典型的包含TTS服務的電話服務流程可分為: 用戶電話撥入,系統(tǒng)IVR響應,獲得用戶按鍵等信息。 IVR根據(jù)用戶的按鍵信息,向數(shù)據(jù)庫服務器申請相關(guān)數(shù)據(jù)。
數(shù)據(jù)庫服務器返回文本數(shù)據(jù)給IVR。 IVR通過其TCP通訊接口,將需要合成的文本信息發(fā)送給TTS服務器。
TTS服務器將用戶文本合成的語音數(shù)據(jù)分段通過TCP通訊接口發(fā)送給IVR服務器。 IVR服務器把分段語音數(shù)據(jù)組裝成為獨立的語音文件。
IVR播放相應的語音文件給電話用戶。 一般的公網(wǎng)接入(IVR)大都采用工控機+語音板卡,而合成的語音數(shù)據(jù)則通過局域網(wǎng)傳給IVR。
這種結(jié)構(gòu)只適用于簡單的應用場合。 [編輯本段]中文TTS系統(tǒng) 包括中文語音處理和語音合成,利用中文韻律等相關(guān)知識對中文語句進行分詞、詞性判斷、注音、數(shù)字符號轉(zhuǎn)換,語音合成通過查詢中文語音庫得到語音。
目前中文TTS系統(tǒng),比較著名的有:IBM,Microsoft,Fujitsu,科大訊飛,捷通華聲等研究的系統(tǒng)。目前比較關(guān)鍵的就是中文韻律處理、符號數(shù)字、多音字、構(gòu)詞方面有較多的問題,需要不斷研究,使得中文語音合成的自然化程度較高。
[編輯本段]TTS與CTI CTI技術(shù)使電信和計算機相互融合,克服了傳統(tǒng)電信和計算機服務相對單一的缺點,將兩者完美結(jié)合了起來。其應用領域非常廣泛,任何需要語音、數(shù)據(jù)通信,特別是那些希望把計算機網(wǎng)與通信網(wǎng)結(jié)合起來完成語音數(shù)據(jù)信息交換的系統(tǒng)都會用到CTI技術(shù)。
TTS即語音合成技術(shù)(Text To Speech),它涉及聲學、語言學、數(shù)學信號處理技術(shù)、多媒體技術(shù)等多個學科技術(shù)。
TTS是指一項語音合成技術(shù)。
語音合成是將人類語音用人工的方式所產(chǎn)生。若是將電腦系統(tǒng)用在語音合成上,則稱為語音合成器,而語音合成器可以用軟/硬件所實現(xiàn)。
文字轉(zhuǎn)語音系統(tǒng)則是將一般語言的文字轉(zhuǎn)換為語音,其他的系統(tǒng)可以描繪語言符號的表示方式,就像音標轉(zhuǎn)換至語音一樣。
擴展資料:
發(fā)展歷史
1、17世紀法國人研發(fā)機械式的說話裝置,直到19世紀,貝爾實驗室對于電子語音合成技術(shù)的研究,才開啟近代語音合成技術(shù)的發(fā)展。
2、貝爾實驗室在1939年制作出第一個電子語音合成器VODER,是一種利用共振峰原理所制作的合成器。
3、1960年,瑞典語言學家G. Fant則提出利用線性預測編碼技術(shù)(LPC)來作為語音合成分析技術(shù),并推動了日后的發(fā)展。
4、1980年代Moulines E和Charpentier F提出新的語音合成算法PSOLA,此技術(shù)可以合成比較自然的語音。
參考資料來源:百度百科-TTS
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡傳播權(quán)保護條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學習鳥. 頁面生成時間:3.233秒