Next
Previous
Contents
libtabe 將中文的處理分成幾個階段,由小到大分別是:
- 注音符號(ZuYin Symbols):
每一個中文字都由一個或多個的注音符號加上一個聲調符號所組成。
注音符號加上聲調符號的總數是四十二個
(三十七個注音符號加上五個聲調符號)
- 讀音(Yin):
一個讀音是由一個或多個的注音符號加上一個聲調符號組成。
每個讀音都是具有意義的,可以代表一個中文字。當然,
不同的中文字也許會有相同的讀音。一個字也可能有數種讀音。
- 字(Zhi):
也就是中文字。
- 詞音(TsiYin):
一個詞的讀音。一個詞可能有數種讀音。
- 詞(Tsi):
由一到數個字所組成。在中文語言上,是最基本又具有意義的單位。
- 句(Chu):
一個句子可以表達一個完整的概念,由一到數個詞所組成。
libtabe 針對以上各個處理階段都有提供一些函式。也在相臨的處理階段之間,
提供轉換的函式。往後的章節,將一一介紹每個處理階段中所提供的函式,
及與相鄰處理階段間的轉換函式。
使用不同的編碼處理中文時,可能會有不同的性質,
所以這個函式庫採用 Big5 碼做內碼,需要轉換成其他中文碼時,
可以使用轉換的函數。
Next
Previous
Contents