|
IETF言語タグ()は、BCP 47(現在は RFC 5646 と RFC 4647 )により定義される技術仕様である。これは HTTP〔RFC 2616: Hypertext Transfer Protocol -- HTTP/1.1, section 3.10 〕、HTML〔HTML 4.01 Specification, section 8.1 〕、XML〔Extensible Markup Language (XML) 1.0 (Fourth Edition), section 2.12 〕、PNG〔Portable Network Graphics (PNG) Specification (Second Edition), section 11.3.4.5 〕、のような多くの技術標準において使われている。 == 書式 == 言語タグは、ハイフンによって分けられる、1つ以上の「下位タグ 」から構成される。一般には下位タグは次の順番で書かれる。 * (言語) * (文字体系) * (地域) * (異体) * (拡張) * (私用) よって、書式はおおよそ次のようになる。(このうち タグのみ必須) それぞれの下位タグは以下の規格から派生している。 * : ISO 639-1、ISO 639-2 * : ISO 15924 * : ISO 3166-1 alpha-2、UN M.49 * : (独自のものにつき派生元の規格なし) * : (将来の拡張のための予約領域につき派生元の規格なし) * : (私的利用部分につき派生元の規格なし) IANA によって管理されている Language Subtag Registry(言語下位タグレジストリ) には、現在公開されている有効な下位タグの一覧がある。 下位タグにおいてはアルファベットの大文字小文字を区別しないが、仕様では言語下位タグレジストリと同じ方法で、つまり 下位タグについてはすべて大文字で、 下位タグについては頭文字のみを大文字で、その他すべての下位タグについては小文字で、記すよう推奨している。 言語タグの使い方としてよく見られるスタイルは、単に 下位タグのみを使うか、 下位タグと 下位タグを使う方法である。例えば、 en は単一の 下位タグ(ISO 639-1より)から構成され、英語を表す。一方、en-CA は、 下位タグの後に 下位タグ CA (ISO 3166-1 より)をくっつけて構成され、カナダ英語を表す。抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「IETF言語タグ」の詳細全文を読む スポンサード リンク
|