Ideographic Variation
About IVS
IVD/IVSとは
IVS(Ideographic Variation Sequence/Selector)は、文字符号としては同一視される漢字の、細かな字形の差異を特別に使い分けるための仕組みです。IVSは文字符号の国際規格であるISO/IEC 10646(2008年版以降)に規定されています。また、IVSと、それに対応する字形の一覧は、UnicodeコンソーシアムからIVD(Ideographic Variation Database)として公開されており、ISO/IEC 10646から正規の規格として参照されています。
文字符号(文字コード)を定める日本工業規格のJIS X 0213(以下、JIS)やISO/IEC 10646 Universal Coded Character Set(以下、UCS)などでは、複数の字形に対して一つの共通な符号(コード)を与える場合があります(「同一の符号位置に複数の字形を置く」、といった言い方をされることもあります)。これを、JISでは包摂と呼び、UCSでは統合と呼んでいます。文字コードの主な目的が、意味的な情報交換である場合には、意味も読みも同じであり、形も類似な字形を、コードとしては区別しない方が、その目的にかなっています。このような考え方は、漢字だけに特有のものではなく、コミュニケーションの手段としての言語が持っている普遍的な性質です。
しかし、特に人名や地名などの漢字による表記の場合、意味的な情報交換とは別の次元で、視覚的な表記が個人や地域の独自性と尊厳を表象する場合が多々あります。例えば、東京都葛飾区と奈良県葛城市では異なる「葛」の字形を用いるなどが、その一例です。また、日本人の姓に多く使われる「辻」の字も、一点しんにょうを用いる人と二点しんにょうを用いる人がいます。
これらの「葛」や「辻」は、JISやUCSでは、それぞれ包摂又は統合されているため、文字コードとしては区別がありませんが、行政実務や、冠婚葬祭の案内状などでは社会通念上使い分けられることがあり、これらを区別できないコンピュータでは文章作成等に支障の出る場合があります。IVS(Ideographic Variation Sequence/Selector)は、このように、UCSでは一つの符号位置に統合されてしまう文字の細かな字形の差異を区別するための手段として規定されました。具体的には、それぞれの文字コード(葛U+845B、辻U+8FBB)の後に、それぞれの字形を特定するための枝番号を表現するための符号(U+E0100やU+E0101など)を付けることによって字形を区別します。この枝番号は、”Variation Selector”(VS, JIS X 0221では字形選択子と呼んでいます)と呼ばれます。UCSコードとVSとを並べた符号列全体を”Ideographic Variation Sequences”と呼びます。電子文書中にこの符号列を記述することで、細かな字形の差異を区別して指定できることになります。
IVDとコレクション
しかし、このような、同一符号位置内での字形の区別は、必ずしも世界的に共通なものではありません。文字の利用目的により、必要となる字形のセットや、字形の区別の粒度が異なることがあります。そのため、IVSの利用に当たっては、それを利用する社会や目的ごとに、区別すべき字形とIVSの対応関係の集合をデータベース(IVD: Ideographic Variation Database)に登録した上で利用しよう、という国際的な合意が出来ています(技術的な詳細は、Unicode Technical Standard #37 及びISO/IEC 10646:2012をご参照ください)。このそれぞれの集合のことをIVDにおける「コレクション」と呼んでいます。現在、このIVDには、2つのコレクションが登録されています。“Adobe-Japan1”と“Hanyo-Denshi”です。 前者は、アドビシステムズ社が登録したもので、出版業界や印刷業界ではよく用いられているものです。後者は、経済産業省の委託事業「汎用電子情報交換環境整備プログラム」(2002年度~2008年度) で、独立行政法人国立国語研究所(現 大学共同利用機関法人人間文化研究機構 国立国語研究所)、社団法人(現一般社団法人)日本情報処理学会、財団法人(現一般財団法人)日本規格協会の三者が実施した調査研究で、戸籍統一文字と住民基本台帳ネットワークシステム統一文字で用いられる字形を整理統合し、登録したものです。葛と辻を例に、IVDの内容を具体的に見てみましょう。
「葛」や「辻」のコレクション(http://www.unicode.org/ivd/2012-03-02/より引用)
Adobe-Japan1に比べ、人名での利用を主目的としたHanyo-Denshiは、より多くの字形を区別して持っていることが分かります。
IPAexフォントとIPAmj明朝フォントにおけるコレクション
IPAexフォント(IPAex明朝フォント、IPAexゴシックフォント)は、JIS規格がJIS X 0213:2000からJIS X 0213:2004に改正された際に例示字形が変更された168文字について、新旧の字形を使い分けことができるようにするために必要な字形をIVSで実装しています。その際、IPAexフォントではAdobe-Japan1のコレクションを採用しています。IPAexフォントに関する詳細につきまして は、リリースノートをご参照ください。 一方、IPAmj明朝は、汎用電子情報交換環境整備プログラムの成果を引き継いだ、行政実務における人名の記載を主な目的としたフォントであり、IVSの実装に当たってはHanyo-Denshiコレクションの2010年11月14日版を採用しています。IPAmj明朝フォントに関する詳細につきましては、ダウンロードページをご参照ください
デフォルトグリフ(Default Glyph)
UCSでは、IVSにより明示的に字形を指定する場合、U+○○○○;U+E01○○と表記しますが、前半のU+○○○○の部分をBase Character、後半のU+E01○○の部分をVariation Selector(VS,字形選択子)と呼びます。Base Characterのみを指定してVSを明示しない場合や、VSを指定しているにもかかわらず、そこで使用しているフォントに当該VSに対応する字形が実装されていない場合に表示される字形のことを、文字情報基盤整備事業では、デフォルトグリフ(Default Glyph)と呼ぶことにしています。一つのUCSに位置づけられている複数の字形の中の、どの字形をデフォルトグリフにするかは、フォントの実装により異なる場合があります。IPAexフォントでは、JIS X 0213:2004の例示字体をデフォルトグリフとしています。一方、IPAmj明朝フォントでは、以下の優先順位によりデフォルトグリフを決定しています。
- 常用漢字表に掲載されている字形
- 人名用漢字別表(戸籍法施行規則別表第二漢字の表)に掲載されている字形
- 住民基本台帳ネットワークシステム統一文字コードと対応するUCSが一致する字形
- JIS X 0213:2004に掲載されている例示字形
- UCSのJ欄(日本提案の字体)に掲載されている例示字形
- 法務省告示第582号別表1に掲載されている字形
- 康煕字典体
- 「市区町村が使用する外字の実態調査」の出現頻度
異なるコレクションに従って実装されたフォントでは、同一のIVSを指定した場合でも、異なる字形が表示されることがあります。これは、一方のフォントには実装されているIVSが、他方のフォントには実装されていない場合に起こります。あるフォントに実装されていないIVSが指定された場合には、そのフォントにおけるデフォルトグリフが表示されるのです。したがって、IVSを使用している文書においては、そのIVSがどのコレクションに則って指定されているのかを意識し、同じコレクションを採用しているフォントを使用する必要があります。