"

亚博电子拥有全球最顶尖的原生APP,每天为您提供千场精彩体育赛事,亚博电子更有真人、彩票、电子老虎机、真人电子竞技游戏等多种娱乐方式选择,亚博电子让您尽享娱乐、赛事投注等,且无后顾之忧!

"
首頁 > Word“中文簡繁轉換”存在的問題與解決對策

Word“中文簡繁轉換”存在的問題與解決對策

互聯網 2021-03-06 18:29:18

摘要:由于目前兩岸四地還沒有實現“書同文”,在相互的文字交流中就要不斷地進行漢字簡化字和繁體字的轉換。使用電腦書寫的人群,普遍借助于微軟公司(Microsoft)文字處理軟件Word中的“中文簡繁轉換”這一功能。因為不是所有的簡體字繁體字都是一一對應的,漢字中還存在相當一部分的“非對稱簡繁字”,加之軟件設計本身的某些缺陷。在中文簡繁字轉換的過程中就出現了諸多的問題,給我們的文字交流帶來不便。

本文以大量具體例證,從多個角度指出Word軟件“中文簡繁轉換”存在的問題,并提出了幾點解決的對策。

關鍵詞:word軟件;中文簡繁轉換; 問題; 對策

1. 導言

隨著兩岸四地(大陸、臺灣、香港、澳門)的政治、經濟、文化交流的日益發展和擴大,文字的交流也越來越頻繁,而且數量也越來越大。盡管人們呼吁書同文已經多年,專家學者研究書同文也有十幾個年頭了(周勝鴻 2003),但是,到目前為止,兩岸四地尚未實現書同文。而且,在可以預見的將來,書同文的實現,還有很長的一段路要走。

雖然使用簡化漢字是我國的語文政策,但是由于目前的現實狀況,大陸使用的是簡化字,而港澳臺使用的是繁體字,而且這種狀況還會長期存在。因此,在大陸同胞與港澳臺同胞交流的過程中,必然要面對漢字簡繁轉換的問題。例如,筆者參加過兩屆“兩岸四地翻譯與跨文化交流研討會”,其中一屆在大陸的清華大學舉行,要求所有與會者都要提供論文的簡化字版,大陸以外的學者要把他們用繁體字寫的論文轉換為簡化字;另一屆是在臺灣的輔仁大學舉行,與會者的論文要用繁體字。大陸學者一般都是用簡化字書寫,這就涉及一個中文簡繁字轉換的問題。從轉換的目的看,簡繁轉換大體可以分為簡轉繁和繁轉簡兩種;從轉換的操作界面來說,則有人工界面和電腦界面兩種。人工界面的簡繁轉換,不管是簡轉繁,還是繁轉簡,都可以通過學習獲得有關的知識。

用電腦進行寫作的人,通常是使用Microsoft Word提供的 “中文簡繁轉換”功能來實現漢字簡繁轉換。Word 是美國微軟公司的一個文字處理器應用程序?,F在一般使用的版本是Word 2003(下面簡稱Word),這個版本通過具有高影響力的圖形進行有效的交流。在Word 的圖標欄中有一個名為“中文簡繁轉換”的圖標( 簡 / 繁 ),通過點擊這個圖標來實現簡化字與繁體字的相互轉換。

2. 基本狀況

2.1 對稱的簡繁字——轉換正確

因為漢語具有悠久的歷史和豐富的文化內涵,加之數量巨大,所以在對漢字進行簡化的過程中,沒有能夠做到,或者說不可能做到,簡化字和繁體字一一對應。在《現代漢語通用字表》所收錄的7000個通用字中,根據1964年文字改革委員會出版的《簡化漢字總表》,簡化漢字共有2238個(因“簽”,“須”兩字重見,實際為2236字)。在這兩千多個簡化漢字中,絕大多數的簡化字和繁體字是一一對應的,稱之為“對稱的簡繁字”。Word 中的“中文簡繁轉換”功能,對這部分對稱的簡繁字來說,一般是不成問題的,能做到正確轉換。例如:

(簡)語言→(繁)語言 (繁)語言→(簡)語言

(簡)對稱→(繁)對稱 (繁)對稱→(簡)對稱

(簡)蘇聯→(繁)蘇聯 (繁)蘇聯→(簡)蘇聯

(簡)實踐→(繁)實踐 (繁)實踐→(簡)實踐

(簡)由上海炎黃文化研究會漢字書同文專業委員會和漢字書同文研究學術沙龍聯合舉辦的第十二次漢字書同文學術研討會,決定于2009年8月1日—3日在秦皇島市舉行。本次研討會的主題是“非對稱繁簡字”研究。歡迎海內外專家學者和各界朋友參加;歡迎各位賜寄論文。我們將在今冬明春編輯出版會議論文集《漢字書同文研究》第八輯。

(繁)由上海炎黃文化研究會漢字書同文專業委員會和漢字書同文研究學術沙龍聯合舉辦的第十二次漢字書同文學術研討會,決定於2009年8月1日—3日在秦皇島市舉行。本次研討會的主題是“非對稱繁簡字”研究。歡迎海內外專家學者和各界朋友參加;歡迎各位賜寄論文。我們將在今冬明春編輯出版會議論文集《漢字書同文研究》第八輯。

以上摘自“上海炎黃文化研究會漢字書同文專業委員會·漢字書同文研究學術沙龍”于今年3月1日發的會議通知。原文共147個漢字,其中含有47個簡化字(包括重復出現的),這些簡化字基本都是簡繁對稱的。由Word 進行自動簡繁轉換后,這47個簡化字全部準確無誤地轉換為繁體字。需要注意的是,在電腦上輸入漢字一般默認的字體是宋體,轉換后默認的字體是臺灣的PMingLiu(明柳)。

2.2非對稱簡繁字——固定詞語中轉換基本正確

在總數為2238個簡化字中,有117組(此說根據馮壽忠先生的《“非對稱繁簡字”對照表》)的簡化字與原來的繁體字不是一一對應的。習慣稱為“非對稱簡繁字”。它包括兩種類別:一類是“一簡對多繁”,一類是“一繁對多簡”。而絕大多數是“一簡對多繁”,而“一繁對多簡”數量較少(根據陳明然先生的統計有10組)。這里主要論述“一簡對多繁” 的轉換問題。在論述前,我們先看幾組“一簡對多繁”的例子:

序號

簡體

繁體

例證

1

發展?? 發怒?? 出發? 奮發圖強??

頭髮?? ??令人髮指??? 千鈞一髮?

2

?必須?? 須臾? 無須

? 鬍鬚?? 鬚眉?? 觸鬚

3

?歷史??? 經歷? ??歷歷在目

? 農曆??? 曆書?? 曆法

4

?? 面貌??? 鐵面無私??? 千人一面

?? ?麵包?? 麵湯?? 蕎麥麵???

5

?系統? ??外語系?? 太陽系

? 關係 ??難脫干係

? 聯繫?? ?維繫?

從上表我們可以看出,這類“一簡對多繁”的情況,主要是一個簡化字對應兩個繁體字,少數情況是一個簡化字對應三個繁體字。

Word 對這部分漢字的簡繁轉換,在它們處于固定詞語的情況下,總體來說是能正確地進行轉換的。例如:

簽 → (簽,籤):

(簡) 簽名 簽署 簽收; 牙簽 標簽 求簽 抽簽兒

(繁) 簽名 簽署 簽收; 牙籤 標籤 求籤 抽籤兒

贊 →(贊,讚)

(簡) 贊助 贊成 大使館參贊; 夸贊 盛贊 贊美詩 贊不絕口

(繁) 贊助 贊成 大使館參贊; 誇讚 盛讚 讚美詩 讚不絕口

發 →(發,髮)

(簡)借題發揮 先發制人; 怒發沖冠 削發為尼

(繁)借題發揮 先發制人; 怒髮衝冠 削髮為尼

歷 →(歷,曆)

(簡)夏文史先生是著名的歷史教授,生于一九一九年農歷三月五日。

(繁)夏文史先生是著名的歷史教授,生於一九一九年農曆三月五日。

須 →(須, 鬚)

(簡)書同文是21世紀必須實現的目標。 ——周有光

(繁)書同文是21世紀必須實現的目標。 ——周有光

(簡)老人雪白的長長胡須飄灑在胸前,一派道骨仙風,煞是好看。

(繁)老人雪白的長長鬍鬚飄灑在胸前,一派道骨仙風,煞是好看。

(簡)在學校召開的“落實科學發展觀”座談會上,九十高齡的夏教授的出席,特別引人注目。他一頭銀發,目光炯炯,端坐在主席臺上。輪到他發言時,他先捋了捋胸前的胡須,以他特有的語言風格,反復強調了科學發展觀的重要性。最后,用一句“我再重復一遍:必須堅持科學發展觀,絕不動搖!”結束了發言。

(繁)在學校召開的“落實科學發展觀”座談會上,九十高齡的夏教授的出席,特別引人注目。他一頭銀髮,目光炯炯,端坐在主席臺上。輪到他發言時,他先捋了捋胸前的鬍鬚,以他特有的語言風格,反復強調了科學發展觀的重要性。最後,用一句“我再重複一遍:必須堅持科學發展觀,絕不動搖?!苯Y束了發言。

在以上這段文字中,“發”,“臺”,“復”和“須”這4個簡化字都是“一簡對多繁”的。但是它們出現在“發展,發言,銀發,主席臺,反復,重復,胡須,必須”這樣的固定詞語中,Word 基本能正確地對它們進行簡繁轉換。

根據以上例證,我們可以把在固定詞語中,Word進行簡繁轉化的功能概括為:“有路標,能走對”。

3. 存在的問題

3.1 轉換錯位

當“一簡對多繁”的簡化字不是出現在固定詞語中,Word 有時就不能正確地把“一簡對多繁”的簡化字,轉換成我們所需要的它對應的那個繁體字,而轉換成我們并不需要的,它所對應的另一個繁體字。也就是說,出現了轉換錯位的現象。主要有以下兩方面的原因造成轉換錯位。

3.1.1 信息不清

因為需要轉換的簡體字不是包含在固定詞語中,而是處于某些臨時性的搭配中,或是孤立的一個字,沒有語境的制約,換句話說,就是提供的信息不清。這時Word 就辨認不清,轉換中就會出現錯位的情況。例如:

(簡)輪到他發言時,他先捋了捋胸前的長須,以他特有的語言風格……

(繁)輪到他發言時,他先捋了捋胸前的長須,以他特有的語言風格……

因為“長須”不像“胡須”那樣是一個固定的詞語,所以Word發生了轉換錯位,本來應該轉換成“鬚”,而轉換成“須”。

(簡)劉唐左耳畔發際間有一片紅記,生出幾綹紅頭發,故人送綽號“赤發鬼”。

(繁)劉唐左耳畔發際間有一片紅記,生出幾綹紅頭髮,故人送綽號“赤發鬼”。

這個短句中有3個簡化的“發”字,它們對應的繁體字都是“髮”。通過Word 轉換后,只有第二個是我們需要的,是正確的。第一個和第三個都轉換成它對應的另一個繁體字“發”。原因很明顯,就是因為,“頭發”是固定詞語。而“發際”和“赤發”是臨時搭配。Word 不能辨認,所以出現了轉換錯位的情況。

3.1.2 前后干擾

有時,某個獨立的簡化字碰巧與它前面或后面的某個字構成一個固定詞語,這時Word 就會錯誤地按照那個詞語來轉換這個簡化字,其結果自然是轉換錯位。例如:

(簡)孫維系外語系的教授,畢業于天津外國語學院;孫干系中文系教授,畢業于南開大學;孫偉系哲學系教授,畢業于……

(繁)孫維繫外語系的教授,畢業于天津外國語學院;孫干係中文系教授,畢業于南開大學;孫偉系哲學系教授,畢業于……

三個“系”字對應的繁體字都應該是“系”,但由于第一個受前面“維”字的干擾,第二個受前面“干”字的干擾。Word 誤以為是“維系”和“干系”兩個詞,所以,發生轉換錯位。

再如:

(簡)夏文史教授有兩個兒子,老大叫夏歷文,老二叫夏歷史。歷文性格外向,歷史性格內向。

(繁)夏文史教授有兩個兒子,老大叫夏曆文,老二叫夏曆史。曆文性格外向,歷史性格內向。

這個句子中的4個簡化字“歷”對應的是同一個繁體字,或為“歷”,或為“曆”。但是一個受“歷”字前面的“夏”字的干擾,轉換成“曆”,另一個受后面的“史”字的干擾,轉換成“歷”。結果夏教授兩個兒子有了“曆文”,“曆史”和“歷史”三個名字。

3.2 不該轉換而轉換

漢字簡化的方法之一是同音代替。 把讀音相同的一組字,取最簡單的一個,字意由簡化字代替。如,后(後、后)、干(幹、乾、干)、云(雲、云)臺(颱、臺、臺)等。有時在沒有一個語境的情況下,Word 會把本來沒有繁體形態的字,轉換成它同音代替的那個繁體字。例如:

(簡)秦檜唆使萬俟卨向宋高宗誣陷岳飛擁兵不救、放棄陣地。最后岳飛被處死?!裨里w墳前有萬俟卨的鐵鑄跪像。(繁)秦檜唆使萬俟卨向宋高宗誣陷嶽飛擁兵不救、放棄陣地。最後嶽飛被處死?!駧[飛墳前有萬俟卨的鐵鑄跪像。

“萬俟”是一復姓,其中的“萬”字沒有繁體字形;同樣“岳”作為姓氏也沒有繁體字形。而Word 卻把這兩個本不應該轉換的簡化字轉換成它們同音代替的另一個繁體字,實屬自作多情。再如:

(簡)算命先生給他們兩個的八字批的是“干支不合”。第二天,小芹娘就對小芹說:“你與拴柱干不符支不合,不能成婚?!?/p>

(繁)算命先生給他們兩個的八字批的是“干支不合”。第二天,小芹娘就對小芹說:“你與拴柱幹不符支不合,不能成婚?!?/p>

句中有兩個“干”字,意思都是“天干”,都不應該轉換。因為前一個包含在“干支不合(符)”這個常見詞語中,所以沒有轉換;而第二個是孤立的,被錯誤地轉換成它代替的另一個毫不相干的繁體字“幹”

3.3 詞語變形

我們使用的Word 文字處理器中的繁體字字形是PMingLiu(明柳)字體,它是臺灣通行的字體。字體實際上代表了一種符號系統,而這種符號系統又與語言文化相關。由于兩岸的長期隔絕,漢語詞匯的發展也出現了一些細微的差異,特別是新興的或外來的詞匯,有些有所不同。在使用Word 進行簡繁轉換中,有的詞語被轉換成完全不同的詞語。例如:

(簡)前綴——(繁)首碼 (簡)詞組——(繁)片語

(簡)激光——(繁)鐳射 (簡)公元——(繁)西元

(簡)這個公司產品的質量比你們的好。

(繁)這個公司產品的品質比你們的好。

(簡)每年的12月25日,是基督教徒紀念耶穌誕生的日子,稱為圣誕節。

(繁)每年的12月25日,是基督教徒紀念耶穌誕生的日子,稱為耶誕節。

(簡)大連交通大學信息工程學院于2002年7月經遼寧省教育廳批準正式成立。是由大連交通大學和大連陽光世紀教育產業投資有限公司共同舉辦的獨立學院。

(繁)大連交通大學資訊工程學院於2002年7月經遼寧省教育廳批準正式成立。是由大連交通大學和大連陽光世紀教育產業投資有限公司共同舉辦的獨立學院。

盡管這種詞語變形的情況不是太多,但也給Word 的使用者造成許多麻煩。

4. 解決對策

4.1 提高智能

從以上的例證可以看出,有些簡繁字轉換的準確程度與這個字的語境復雜性緊密相關。所以提高Word 智能化程度是避免轉換錯誤的基本對策。使其增強對語境的判斷能力,從對個別字,固定詞語的判斷,提高到對語言片段,乃至整個語篇的判斷。此外,還要提高對詞性,詞義的判斷能力?!胺菍ΨQ簡繁字”中,有一類是按照不同詞性相互對應的。此類簡繁字的特點是在它們作不同詞性用時,對應不同的簡化字形或者繁體字形。最典型是簡化字“斗”,作動詞,對應的繁體字是“鬥”;作名詞,對應的繁體字是“斗”。這類“一簡對多繁”的簡化字有近10組。如果Word 能對簡繁字做出詞性判斷,僅此一項改進,就會大大減少差錯率。

4.2 擴大詞庫

有些簡繁字動態組詞能力很強,能臨時生成許多詞語。如“面”字,在表示“食物、粉末”義項時,對應的繁體字形是“麵”;在表示其它義項時,對應的繁體字形是“面”。而含有“面”的詞語非常之多,如“面粉”,“面積”,“佛面”,“后面”,“牛肉面”,“擔擔面”,“面談”,“會面”等等,可以說是無法窮舉。而其中很大部分,是不會收入詞庫的詞語中。這也是簡繁轉換出現錯誤的一個重要原因,Word 可以通過擴大自己詞庫的方法,減少簡繁轉換中的錯誤。

4.3 精心校對

基于目前的現狀,Word 用戶還得靠自己來糾正“非對稱簡繁字”在轉換中造成的錯誤。首先是要熟悉這些“非對稱簡繁字”,把它們爛熟于心。如果是短小的文檔,在Word自動轉換后,進行認真校對,對其中的轉換錯誤,再進行人工轉換。如果是長的文檔,而且某些“一簡對多繁”漢字反復出現,這時,可以用自己規定的符號或數碼來代替這類漢字,Word自動轉換后,再使用菜單欄中“編輯”里面的“替換”功能,把所有的符號和數碼一次性轉換為所需要的漢字,然后再精心校對。這樣既可以避免轉換錯誤,又可以節省時間。

5. 結語

Word 中文簡繁轉換中的問題由來已久,是長期困擾兩岸四地交流的一個瓶頸,這種漢字的簡繁轉換不知浪費了多少資源,精力和時間。許多專家學者為此提出了種種有益的建議和解決辦法。但是,在兩岸四地沒有實現書同文之前,再好的策略也只能是臨時的,局部的,是治標不治本的。而最徹底,最根本的解決策略是實現兩岸四地的書同文。一旦兩岸四地實現書同文,這個問題就隨之煙消云散,不復存在。

主要參考文獻

1. 國家語言文字工作委員會:《現代漢語常用字表》,語文出版社,1988年。

2. 李行?。骸冬F代漢語規范字典》,語文出版社,1998年。

3. 傅興嶺、陳章煥:《常用構詞詞典》,中國人民大學出版社,1982年。

4. 顧雪楓:《校編本》,蘇州大學出版社,2005年。

5. 李大遂:《速查簡化字》,語文出版社,1997年。

6. 蘇培成:《簡化字與繁體字的對應》,《語文現代化論叢》(第二輯),語文出版社,1996年。

7. 蘇培成:《語言文字應用探索》,商務印書館,2004年。

8. 周勝鴻:《愿為漢字“書同文”鞠躬盡瘁》,上海漢字研究史料館印行,2001年。

9. 陳明然: 《民間漢字書同文研究十周年紀念文集》,鷺達文化出版公司,2007年。

10. 沈克成:《漢字“書同文”研究》(第一輯),氣象出版社,2001年。

11. 戚桐欣:《漢字“書同文”研究》(第二輯),中易系統工作室,2002年。

12. 李祿興:《漢字書同文研究》,鷺達文化出版公司,2003年。

13. 馮壽忠:《漢字書同文研究》,華夏文化出版有限公司,2002年。

14. 詹鄞鑫:《試論“非對稱繁簡字”》,《語文建通訊》,2005年10月第82期。

15. 馮壽忠:《字形整理與轉換對應》,《語文建設通訊》,2000年第65期。

作者簡介:

李樹德 廊坊師范學院、北航大學北海學院 教授。畢業于天津外國語學院。中國翻譯協會專家會員,河北省翻譯協會理事,廊坊市作家協會會員。

教學之余主要從事翻譯、語法和英漢修辭比較的研究,已出版專著、譯著30多部。發表論文、譯文700余篇。多次應邀出席國際學術會議。獲省、市級科研獎3項,1995年被河北省政府授予“優秀教師”稱號;1997年獲“曾憲梓獎”。

除了專業的教學和研究外,對中國文學情有獨鐘,常有文學作品問世,發表中篇小說《生活從這里開始》,《悲劇時代三女性》等以及大量詩歌。近年來轉向散文和文學評論的創作,在《中國政協報》、《世界》、《世界文化》、《文學自由談》、《老照片》、《文史精華》、《中國消費者報》、《河北日報》、《廊坊日報》等報刊發表作品數十篇,2000年獲“《人民日報(海外版)》征文”三等獎。

免責聲明:非本網注明原創的信息,皆為程序自動獲取互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,并提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件12小時內刪除。
亚博电子