翻訳と辞書
Words near each other
・ KOI-707
・ KOI-74 b
・ KOI-74b
・ KOI-94
・ KOI-961
・ Koi-con
・ KOI3154
・ KOI7
・ KOI8
・ KOI8-R
・ KOI8-U
・ KOIBUMI
・ KOICA
・ KOICHI DOMOTO Endless SHOCK Original Sound Track
・ Koichiro kimura
・ Koidz.
・ KoIGoRoMo/Eternal Snow
・ KOISHI
・ Koizumi Chansonnier
・ KOJ


Dictionary Lists
翻訳と辞書 辞書検索 [ 開発暫定版 ]
スポンサード リンク

KOI8-U : ウィキペディア日本語版
KOI8-U
KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語ブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字ҐЄІЇの大文字と小文字双方に置き換えている。
有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはWindows-1251である。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。
ロシア語で、KOI8は () の略で、"情報交換用符号、8ビット" という意味である。
KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、ASCIIのラテン文字と対応する符号位置に疑似ローマ字順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは不自然に見えるかもしれないが、8ビット目が落ちて文字化けしても、、大文字小文字を入れ替えた翻字をすることで通常のASCII端末上で文章をまだ読める (もしくは少なくとも解読できる) という役に立つ特性である。たとえば、KOI8-Uの ""(ルスキー・テクスト、ロシア語のテキストの意) は8ビット目を落とすと になる。その一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。
上記の表において、20は通常の空白 (SPACE) 文字であり、9Aはノーブレークスペース (NO-BREAK SPACE) である。
KOI8-Rとの違いは位置 0xA4; 0xA6; 0xA7; 0xAD; および 0xB4; 0xB6; 0xB7; 0xBD; にある。これらはロシア語に存在しない追加の文字からなる。
RFC 2319では文字95がU+2219 (∙) であるべきだと言っているが、Windows-1251のビュレット文字に合わせるためU+2022 (•) が使われる場合もある。
いくつかの参考文献には誤植があり、文字B4はU+0403であると誤って述べている (正しくはU+0404)。この誤植はRFC 2319のAppendix Aにも存在する (ただしRFC本文の表には正しいマッピングが示されている)。
== 関連項目 ==

* ウクライナ文字

抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)
ウィキペディアで「KOI8-U」の詳細全文を読む




スポンサード リンク
翻訳と辞書 : 翻訳のためのインターネットリソース

Copyright(C) kotoba.ne.jp 1997-2016. All Rights Reserved.