|
ISCII (Indian Script Code for Information Interchange 、情報交換用インド文字符号 IS13194:1991) はインドの各種書記系を表現するための符号化方式である。主要なインド系文字とローマ字転写を符号化する。対応している用字系は以下の通り: アッサム文字、ベンガル文字、デーヴァナーガリー、グジャラーティー文字、グルムキー文字、カンナダ文字、マラヤーラム文字、オリヤー文字、タミル文字、およびテルグ文字。ISCIIはアラビア文字に基づく書記系を符号化しないが、それにもかかわらず、カシミール語、シンド語、ウルドゥー語、ペルシア語、パシュトー語およびアラビア語の書記系切り替え符号が提供されている。アラビア文字に基づく書記系は、その後PASCII文字コードで符号化された。 ブラーフミー文字から派生した書記系はそのほとんどが類似した構造を持つが、文字の形状が異なるため、ISCIIは同じ音価の文字を同じ符号位置に符号化して、各種の用字系を重ね合わせている。たとえば、ISCII符号0xB3 0xDBはを表す。これはデーヴァナーガリーではのように、グルムキー文字ではのように、そしてタミル文字ではのように描画される。書記系はリッチテキストではマークアップによって選択され、プレーンテキストでは後述のATRを用いて選択される。 単一の符号化を使用する動機の1つは、ある書記系から他のものへの翻字が容易になることである。しかしながら、あまりに非互換性が大きいためこれは実際には現実的な考えではない。ISCIIについて (英語) を参照。 ISCIIは固定長の8ビット符号である。下位128個の符号位置はASCIIそのままで、上位128個の符号位置がISCII特有である。 ISCIIではデフォルトで使われる「デフォルト書記系」を指定する手段は提供されていない。 == ATR符号 == 文字を表現する符号位置に加え、ISCIIは略号がATR(0xE0)と呼ばれる符号位置が提供されている。ATRは書記系またはフォント属性の切り替えを指定する。 ATRに引き続き、0x42~0x4Bが指定された場合は、デーヴァナーガリー(0x42)、ベンガル文字(0x43)、タミル文字(0x44)、テルグ文字(0x45)、 アッサム文字(0x46)、オリヤー文字(0x47)、カンナダ文字(0x48)、マラヤーラム文字(0x49)、グジャラーティー文字(0x4a)、グルムキー文字(0x4b)へ切り替えられ、ふたたびATRによるデフォルト指定(0x40)または改行か別の書記系指定がくるまで続く。これらの指定が為されている間は、ASCIIの数字もまた、各書記系の数字で表示される。また、0x41が指定された場合は、ローマ字転写が表示される。 ATRに引き続き0x71~0x76が指定された場合は、アラビア語(0x71)、ペルシア語(0x72)、ウルドゥー語(0x73)、シンド語(0x74)、カシミール語(0x75)、パシュトー語(0x76)などのアラビア文字系が表示されることになっているが、ISCIIではそれらの詳細を規定していない。 ATRに引き続き、0x30~0x39が指定された場合は、太字や斜体、下線付き、倍幅などの表示モードを指定する。ATRの詳細な用法はISCIIの附属書Eに規定されている。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「ISCII」の詳細全文を読む スポンサード リンク
|