|
マルチバイト文字(マルチバイトもじ)とは、 *1文字を複数バイトで表す体系 *1文字のバイト数が可変であるような体系 *そのような体系で表される文字 を指すが、文脈により意味合いが異なる。 ==文字集合におけるマルチバイト文字== ISO 2022の体系を前提とした図形文字集合において、1文字が1バイトの文字集合〔、94文字集合または96文字集合〕に対して、1文字が2バイト以上の文字集合を、マルチバイト文字集合という。94×94文字集合(2バイト)、96×96文字集合(2バイト)、94×94×94文字集合(3バイト)などがこれに該当するが、実際には94×94文字集合以外はまれである。 特に、1文字が2バイトの文字集合を2バイト文字集合といい、以下のようなものがある。 * GB 2312 * ( C 6226) * * * KS X 1001(KS C 5601) * KPS 9566 * CNS 11643 なお、2バイト文字集合の文字のことを2バイト文字と呼ぶことがある。しかし、1バイト文字集合の文字であっても、EUC-JPにおけるJIS X 0201カタカナなどのように、符号化方式によっては一見1文字あたり2バイトであるかのような符号化をされることがある。また近年では、 で処理することも多い。そのため、文字集合でなく個々の文字を指して1バイト文字・2バイト文字と表現することは、混乱を招くことがある。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「マルチバイト文字」の詳細全文を読む 英語版ウィキペディアに対照対訳語「 Variable-width encoding 」があります。 スポンサード リンク
|