こんにちは、K2です。
On Mon, 17 Feb 2003 03:49:32 +0900
Takayuki Matsuki <tmatsukijp@ybb.ne.jp> wrote:
> > 1.検索単語では例えば、"apache", "Apache", "APACHE" 等大文字
> > 小文字の区別をして集計されていますが、これを区別せずに集計する
> > 機能はありますか?
>
> 前にこの問題をターナー氏と議論したことがあり、再度ターナー
> 氏に問い合わせをして、思い出しました。
> マルチバイト言語(日本語を含む)では、英文字の大小文字を
> 統一してしまうとコードをむちゃくちゃにしてしまう恐れがあ
> るので、多バイト言語を使う環境では大小文字を区別する機能
> はオフにしてあります。
実はソースを少しいじってみたのですが、まさしくこの現象が
起きていました。
結局、日本語かつ大小文字を統一するには、まず 16 進表記の
部分を上記の現象が起きない EUC に変換し(私は EUC で出力
できればいいので)、その後 ASCII な文字を大文字なり小文字
なりに変換する・・・という結論に達したのですが、C でEUC
に変換するのがなかなか面倒ですね。。。