- 作者: 李琳山; 鄭秋豫
- 作者服務機構: 臺灣大學資訊工程學系及電機工程學系; 中央研究院歷史語言研究所及資訊科學研究所
- 中文摘要: 本文是一篇回顧性論文,嘗試簡要的整理並概述近年來在中華民國臺灣省所進行的一系列有關中文電腦的國語語音輸出入技術的研究,同時綜合歸納到1987年春天為止的最新研究成果。今日即使是將中文輸入電腦的最有效的方法,其效率也比其他拼音文字的普通輸入方法差得太多;這顯然是中文社會資訊化最大障礙之一,也是我們認為研究國語語音輸入技術一定有其價值的主要理由,雖然我們尚不知道語音輸入是否有潛力克服這個難題。另一方面,雖然將中文輸出電腦的技術已發展得十分成熟,但國語語音輸出的技術一定可以為中文電腦開拓出另一片豐富而靈活的應用天地。這些是推動本文所描述的這些研究的基本理由。就中文電腦的國語語音輸出技術而言,雖然用電腦合成有限數目的固定內容的國語語句的技術早已成熟,但這裡所說的是可以將無限多的任意內容的中文文句直接轉換成國語語句的技術,就像由一個人來朗讀文句一樣,故稱為“中文文句翻語音系統”;因為我們假設,中文電腦的輸出是任意內容都有可能的。在本文中會說明,這樣的系統已很成功的發展完成,並獲得很好的測試結果;據我們的瞭解,這應是全世界第一套會“說”國語的中文電腦。就中文電腦的國語語音輸入技術而言,雖然用電腦辨認有限數目的國語詞彙的技術也早已成熟,但這裡所說的是希望發展出一種可以將無限多的任意內容的國語語句直接轉換成文字輸入電腦的技術,就像由一個人聽寫下來一樣,故稱之為“國語聽寫機”;因為我們假設,中文電腦的輸入也是任意內容都有可能的。在本文中會說明,雖然這樣的聽寫機目前尚不存在,但是已有很豐富的研究在進行中,基本架構已建立完成,而所有需要的相關技術都在積極研究中,且有初步成果。據我們的瞭解,這也是全世界第一個全力研究教電腦“聽”國語的大型研究計劃。這裡的“中文文句翻語音系統”及“國語聽寫機”二者,在設計時均仔細考慮了國語、中文的結構特性,而選擇了“音節”作為合成與辨認的基本單位,與現有英文的系統完全不同;這事實上是近年國內資訊科技界與中文語言學界的研究人員密切合作才獲致的成果。本文將就這兩種系統的基本原理及運作方法作簡要而清楚的介紹,但因限於篇幅,很多艱深的理論或技術層面將不得已必須略去。
- 英文摘要: This paper is a tutorial survey which very briefly reviews and explains the research efforts recentlymade in Taiwan, Republic of China on the Mandarin speech input/output techniques for Chinese compu-ters, and tries to summarize the current results as of the spring of 1987. Today, even the best methods forthe input of Chinese characters into computers are much less efficient than those for alphabetic languages.This is definitely one of the key barriers for the fast development of computerized information processingin the Chinese community, and is why we believe the research efforts towards Mandarin speech input tech-niques are worthwhile, although there is no answer at this moment whether this approach has the potentialto solve the problem. On the other hand,although the output of Chinese characters from computers hasbeen successfully developed, Mandarin speech output can definitely provide an additional alternative formore flexible and versatile applications of Chinese computers. These are the motivations for the researchwork described in this paper. For the Mandarin speech output, although the technique to synthesize Man-darin speech sentences with fixed, given text has been available for many years, the purpose here is insteadto develop a Chinese text-to-speech system which can transform unlimited number of unrestricted Chinesesentences with arbitrary text into the corresponding Mandarin speech, as if read by a person, because in
- 中文關鍵字: --
- 英文關鍵字: --