Last updated: 2000.12.23
JISX0213 InfoCenter
JIS X 0213:2000 関連データです。ご自由に(利用したり加工したり配布したりして)お使いください。データは、死にたい程度にはチェックしていますが、保証しろといわれても困ります。なにか問題があったら、earthian@tama.or.jpにメールすると直るかも。
-
全データまとめてダウンロード。といってもコード表2種にmiscファイル、この3つをまとめただけのもの。
-
コード表以外のデータファイルをまとめてあります。
●
コード表(jisx0213code.txt [2000-12-22],zip圧縮,198k)
-
bug→更新履歴(2000.12.22)参照。
jis,euc,sjis,ucs,utf-8などのコード一覧。青空文庫コアによる校正済。ucsはasciiの代替名称使用(ffxx)になっています。外字(空き領域)には文字の後に〓がついて外字表示してあり、ucsはffffとしています。ucsのコードがないもの(不足文字)のucsは0としています。utf-8についてはrfc2279(link)を参照してください。文字はShift_JISX0213データで、()で囲んであります。
●
コード表-csv(jisx0213code-csv.txt [2000-12-22],zip圧縮,224k)
-
bug→更新履歴(2000.12.22)参照。
上のcsv形式データ。
以下はmiscファイルまたはallファイルに入ってます。
●
文字一覧表sjis(shift_jisx0213.txt)
-
Shift_JISX0213 の2バイト文字一覧表。
●
文字一覧表euc(euc-jisx0213.txt)
-
EUC-JISX0213 の2バイト文字一覧表。SS3で3バイト。
●
ASCII対応表(ascii0213.txt [2000-08-14])
-
コード表-csvから、ASCIIに対応するリスト。
●
Latin-1対応表(latin10213.txt [2000-08-15])
-
コード表-csvから、Latin-1に対応するリスト。
●
Latin-2対応表(latin20213.txt [2000-08-15])
-
コード表-csvから、Latin-2に対応するリスト。
●
空き領域リスト(reserved0213.txt [2000-08-14])
-
コード表-csvから、空き領域のリスト。ただし、2面の使わない区は省略している。
●
NT diffリスト(winnt0213.txt [2000-12-22])
-
bug→更新履歴(2000.12.22)参照。
コード表-csvから、WindowsNTのUnicodeへの変換が違っている文字のリスト。NTで0213に変換できるわけではないので、これは0208の文字のみ。
●
UCS不足文字リスト(ucsproposed0213.txt [2000-08-14])
-
UCSに不足していて、追加提案中の文字リスト。
●
包摂変更文字リスト(duplex0213.txt [2000-08-15])
-
互換包摂の29組と包摂除外の104組のリスト。
●
部首画数索引-csv(拡張版)(radical-csv.txt [2000-10-09])
-
bug→更新履歴(2000.10.24)参照。
部首画数による索引データ。青空文庫コアによる校正済。附属書11の「2.2漢字部首・画数索引」のデータに、次の追加を行っている。
- 0213の索引では、0208で複数の部首に属していて重複して掲載されていた文字(これらの文字はplural0208.txt参照)がどれか1つしか出てこない。画数の小さくなる部首で掲載されている模様。これらの複数の部首に属している文字で、0213索引で消えているものを追加した。plural2nd-tab.txt参照。但し、包摂などで複数の画数がある場合でも1つの画数しか取っていない。つまり画数に揺れがあるので注意。なお0213で複数の部首に属している文字(これらの文字はplural0213.txt参照)は複数出てくる。
- 部首番号0に漢数字の零「〇」を追加した。
- 1-74-12は部首142(虫)画数0となっているが、画数11にした。
- 2-78-87は部首184(食)画数2となっているが、画数3にした。
●
部首画数索引-tab(拡張版)(radical-tab.txt [2000-10-09])
-
bug→更新履歴(2000.10.24)参照。
部首画数索引-csvのtab区切り版。
●
複数の部首にある文字(0208)(plural0208.txt [2000-08-04])
-
0208で複数の部首に分類されている文字のリスト。
●
複数の部首にある文字(0213)(plural0213.txt [2000-08-04])
-
0213で複数の部首に分類されている文字のリスト。
●
拡張版で追加した差分(plural2nd-tab.txt [2000-08-06])
-
plural0208.txtの2番目,3番目の部首画数データ。
●
漢字音訓索引(onkun0213.txt [2000-09-11])
-
青空文庫作成・提供の音訓による索引データ。青空文庫コアによる校正済。
JIS X 0213 規格票の附属書11の「2.3漢字音訓索引」に以下の変更を加えた。
また、sjisのコードをs-ffffの形式で面区点番号の後に付加した。
●
漢字音訓索引(onkun-1014,gzip圧縮)
-
上の音訓索引からコード番号を除いてSKKの辞書形式(EUC)に変換したもの。
矢野啓介さんによる。ちなみにSKKオープンラボで辞書作業が進行中とのこと。
●
参照文字リスト(0208)(variant0208.txt [2000-10-22])
-
JIS X 0208規格票で参照区点がある文字とその参照先のリスト。
関連する文字の組は全部リストしている。つまり(a→b,b→a,c→a)と
いう参照情報しかなくても、a,b,cとb,a,cとc,a,bがリストされている。
最初の文字が見だしで、以降は参照文字。面区点の形式になっている。
規格票に以下の追加を行っている。
- 1-1-24,(仝),1-38-17,(同),
- 1-5-86,(ヶ),1-18-53,(箇),1-48-4,(个),
- 1-18-53,(箇),1-5-86,(ヶ),1-48-4,(个),
- 1-38-17,(同),1-1-24,(仝),
- 1-48-4,(个),1-5-86,(ヶ),1-18-53,(箇),
●
参照文字リスト(0213)(variant0213.txt [2000-10-23])
-
JIS X 0213規格票で参照区点がある文字とその参照先のリストから、
関連する文字を全部見出しにして、上の0208のデータと統合したもの。
方針も上の通り。これにより規格票に以下の追加を行っている。
(方針により自動生成された0208→0213の参照は除く)
- 1-15-22,(〓),1-20-79,(器),1-51-58,(噐),
- 1-84-37,(〓),1-38-33,(徳),1-55-60,(悳),2-12-48,(〓),
- 1-85-28,(〓),1-40-53,(晩),2-14-4,(〓),
- 1-85-46,(〓),1-47-15,(朗),1-59-13,(朖),
- 1-85-69,(〓),1-39-63,(梅),1-39-64,(楳),
- 1-86-3,(〓),1-19-21,(概),1-86-4,(〓),
- 1-86-4,(〓),1-19-21,(概),1-86-3,(〓),
- 1-86-83,(〓),1-46-62,(涙),1-62-5,(泪),
- 1-87-53,(〓),1-28-49,(煮),1-87-52,(〓),
- 1-87-79,(〓),1-35-86,(猪),1-76-23,(豬),
- 1-91-45,(〓),1-21-85,(虚),1-91-46,(〓),
- 1-91-46,(〓),1-21-85,(虚),1-91-45,(〓),
- 2-12-48,(〓),1-38-33,(徳),1-55-60,(悳),1-84-37,(〓),
- 2-14-4,(〓),1-40-53,(晩),1-85-28,(〓),
- 2-86-61,(〓),1-16-94,(蔭),2-86-78,(〓),2-91-73,(〓),
- 2-86-78,(〓),1-16-94,(蔭),2-86-61,(〓),2-91-73,(〓),
- 2-91-73,(〓),1-16-94,(蔭),2-86-61,(〓),2-86-78,(〓),
- 2-91-81,(〓),1-23-60,(鶏),1-83-17,(鷄),1-93-66,(〓),
[データファイルの終わり]
リンク
- ★Kandata,Habian (sjis TrueType Font)
- JIS X 0213:2000(JIS2000)関連情報のページから。
- ★T-Time v2.2 (Voyager Japan)
- T-Time v2.2の新しい仕様・機能のページ
- ★青空文庫〜明日の本棚〜
- 「新JIS漢字時代の扉を開こう!」など。
更新履歴
- 2000.12.22
- 規格票附属書4の 1-1-29(EM DASH) のUCSのコードが2015になっているが2014が正しいと思われる(JIS X 0221によれば)のでコード表およびコード表-csvを修正。またこの文字をNT diffリストにも追加。
- 2000.10.24
- 青空文庫で「新JIS漢字総合索引」(T-Time用)が公開されたので、とりあえず異体参照リストと青空文庫提供の漢字音訓索引を追加。
また、部首画数索引[2000-08-06]に発見されたバグ(1-93-86の180(音)11画→13画)を修正。
- 2000.08.18
- T-Time V2.2が公開されたので、とりあえず公開。
[end] Copyright 2000 earthian@tama.or.jp