|
===================================== 〔語彙分解〕的な部分一致の検索結果は以下の通りです。 ・ 漢 : [かん] (suf) man (negative nuance) ・ 漢字 : [かんじ] 【名詞】 1. Chinese characters 2. kanji ・ 字 : [じ, あざな] 【名詞】 1. character 2. hand-writing
拡張漢字(かくちょうかんじ)とは、文字コード(漢字コード)において何らかの形でもとから含まれていた漢字に追加された漢字をいう。 == ユニコードにおける拡張漢字 == ユニコードにおける拡張漢字とは、最初(1993年5月)に制定されたユニコードの規格であるUnicode 1.0に存在したCJK統合漢字、20,902字に対してまとまった形で追加されていった漢字集合のことを言い、以下のものがある。 ;CJK統合漢字拡張A (CJK Unified Ideographs Extension A) :1999年9月制定のUnicode 3.0(ISO/IEC 10646-1:2000に対応)において基本多言語面のU+3400-U+4DBFのブロック(Unicode 1.1までハングルを定義していた場所)に追加された6,582字。当初は6,584文字の予定であったが、そのうち2文字が互換漢字領域にあったため、互換領域の2文字を拡張Aとして扱うことにして、この2文字は追加集合からは削除された。主として使用頻度の低い漢字が含まれ、JIS X 0213に一部対応しており、地名や人名などに用いられる漢字が含まれている。 ;CJK統合漢字拡張B (CJK Unified Ideographs Extension B) :2001年3月制定のUnicode 3.1(ISO/IEC 10646-2:2001に対応)において追加漢字面のU+20000-U+2A6FFのブロックに追加された漢字42,711字。Unicodeの拡張漢字集合では最も字数が多く、その大部分は日常ではまず用いられない漢字であるが、JIS X 0213に一部対応しており、地名や人名などに用いられる漢字が含まれている。また拡張B以降の集合には、かつてベトナムで用いられていたチュノムも含まれる。非常に膨大な漢字集合を極めて短期間のうちに定めたため、漢字の重複が多数見られる。 ;CJK統合漢字拡張C (CJK Unified Ideographs Extension C) :2008年12月に発行されたISO/IEC 10646:2003 (UCS) の追補5に含まれており、Unicode 5.2(2009年10月制定)から対応。符号位置は、追加漢字面のU+2A700-U+2B7FFの範囲が予約されていたが、実際に追加されたのはU+2A700-U+2B734の4,149文字。 ;CJK統合漢字拡張D (CJK Unified Ideographs Extension D) :2010年に発行されたISO/IEC 10646ではISO/IEC 10646:2010に含まれており、Unicode 6.0(2010年10月制定)から対応。符号位置は、追加漢字面のU+2B800-U+2F7FFの範囲が予約されていたが、実際に追加されたのはU+2B740-U+2B81Dの222字。 ;CJK統合漢字拡張E (CJK Unified Ideographs Extension E) :2014年9月に発行されたISO/IEC 10646:2014に含まれており、Unicode 8.0(2015年6月制定)から対応。符号位置は、追加漢字面のU+2B820-U+2CEA1の5,762字。 ;CJK統合漢字拡張F (CJK Unified Ideographs Extension F) :拡張E以降に追加されることが計画されている漢字。Unicode、ISO/IEC 10646ともにどのバージョンから対応するのかは現時点では未定。文字基盤整備事業から提案された約1,800字や大蔵経テキストデータベース委員会から提案された約4,000字の収録が予定されている〔「JIS X 0221:2014 解説 5 懸案事項」『JIS X 0221:2014』日本規格協会、2014年、p. 169。〕。また拡張Fには、チワン語やプイ語で用いられている伝統的な古壮字も含まれる予定。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「拡張漢字」の詳細全文を読む スポンサード リンク
|