松木です。
以下のURL
http://www.ingrid.org/java/i18n/unicode.html
には、
---------------------------------------
この表は、JavaHouse-Brewersメーリングリストに投稿された、Windows 95/NT環境で
Javaプログラムを使うと一部の文字が表示されないという話題についてまとめたもの
です。
これは、次の事柄が原因でした。
1.従来採用していたShift-JISコードを、どのようにUnicodeにマップするかについ
ては、ベンダ依存である。
2.JIS X0221の付属書3「JIS X 0201, JIS X 0208及びJIS X 0212の表内文字との対
応」で、マッピングを定義している。しかし、これは参考であり強制力を持たない。
3.Unicodeにおいても、使用するフォントやソーティングのためにつかうデータは
言語によって異なるために、通常のUnicodeベースの地域化プログラムは、Unicodeす
べての文字に対してではなく、その一部に対してのデータしか持たない。 現在、各
ベンダは自分が使用している文字しか配慮しないために、他のベンダがマッピングし
たUnicodeデータを渡されると、正しく処理できない。
---------------------------------------
と書いてあります。
> そうですね。ちょっといろいろと探ってみたのですが、機種依存文字に該当
> する漢字の UNICODE へのマッピングが「正確には」よくわかりませんでした。
> とはいえ、以下のように割り当てているソフトがあることはわかりました。
>
> UNICODE EUC SJIS
> 8A 7E F9 A1 ED 40
> 1C 89 F9 A2 ED 41
> 48 93 F9 A3 ED 42
> . . .
> . . .
> . . .
> 02 FF FC FE EE FC
>
> ここらへんの正確な定義がわかる方っていますか?
> 標準規格でなくても、「より実用的」になるのであれば取り入れたいと思います。
> (できれば対応表を送って頂けると助かります。)
WindowsのIMEパッドを使うと、マイクロソフト社の対応表が一文字ずつですが
見れます。それによると、
上記の対応表のUNICODEは、1バイト目と2バイト目が逆でした。例えば、
SJIS:ED 40
UNICODE:7E 8A
でした。何故でしょう。
また、対応表を書いた本を持っているのですが、家には無いので、
明日書名を書きます。