最終更新:2013年5月7日

役に立つかもしれない資料置き場

このサイトについて

このサイトは、私(yuan.jiu@an.email.ne.jp)の個人的なサイトです。調べたことや、作成したフリーソフトなどを順次置いていく予定です。
コード変換プログラムm2pc等の古いコンテンツは 『ここ』 に残してあります。

UNICODEの正規化

java.text.Normalizerクラスを使って、JISX0201(158文字)とJISX0213(11,233文字)がどのように正規化されるのか調べてみました。
NFD,NFKD,NFC,NFKCのいずれかで他の文字に置き換えられるもの(647文字)だけを表にしています。→詳細は『ここ』
(IE9、Firefox、GoogleChromeで表示を確認しましたが、作者の環境(Windows/VISTA)のIE9では、表示に時間がかかる場合がありました。)

MS932とShift_JIS

Java character-setで利用可能な名称に、x-MS932_0213とx-SJIS_0213があります。
これを利用して、MS932のJISX0213対応版とShift_JIS-2004との相違点を調べました。(java version "1.7.0_06")
(ただし、VB.NETで、'System.Text.Encoding.GetEncoding(932).GetString(byteData)'としてバイト列から文字を得る場合に、'932'に代えて指定するENCODEが定義されているわけではありません。また、Windowsのメモ帳でJIS第三水準、第四水準の文字が入力できるといっても、UNICODE/UTF-8のファイルでしか保存できません。しかし、Javaが実装しているところをみると、MS932のJISX0213対応版が公式ではなくとも存在するのは確かでしょう。このあたりをご存知のかたは教えてください。)

x-MS932_0213とx-SJIS_0213は各々MS932とShift_JISの上位集合なので、以下の資料は蛇足と云えますが参考までに置いておきます。

内容に誤り等を発見された場合、お知らせいただけるとウレシイです。
連絡先:yuan.jiu@an.email.ne.jp(@を@に置き換えてください。)