[前][次][番号順一覧][スレッド一覧]

mysql:13700

From: Mamiya Masataka <Mamiya Masataka <xc8m-mmy@xxxxxxxxxx>>
Date: Mon, 29 Jan 2007 11:02:54 +0900
Subject: [mysql 13700] Re: like で抽出する場合の注意点

皆さんおはようございます。
また、末永さんにはさっそくの情報をありがとうございます。

> latin1系の文字コードでは、
> 0x49,0x69,0xcc,0xcd,0xce,0xcf,0xec,0xed,0xee,0xef
> 以上10つのコードで表される文字は、
> 比較の際同じ文字と判断されてしまいます。
> よって、「の様」の4バイトの中間2バイトに「力」がマッチしてしまいます。
なるほど、合点がが行きました。

文字コード、euc にしたから sjis で起こる
2バイト文字と1バイト文字の混同
2バイト文字の2バイト目と次の文字の1バイト目の混同が避けられると思ったのですが。
新たな問題が起こってしまいました^_^;

文字コードの問題は、大変難しいとまたまた思わされました。
皆さんのお知恵をお借りできたことほんとうにお礼申し上げます。

さて、実際の対応ですが、どうしようかと思案しております。
バージョンを 4.1 に上げ、文字コードも適切に記述したいと考えるわけですが、
現在稼動中のスクリプトを対応してからでないといけないので、
その手順をきちんと考えていきたいと思います。

文字コード、将来的にどの文字コードを採用したらいいのか、
現状のスクリプトとの調整もあり悩みつつ試行錯誤しております。
同じような悩みをお持ちの方で、よい解決をされた方の体験談など、
それぞれ環境も違うとは思いますがお聞かせいただけるとうれしいなと思ったり。
情報をいただけましたなら幸いです。

皆様ほんとうにありがとうございました。

--
Mamiya masataka from IBARAKI JAPAN
0297-58-6313 090-4430-2918
mamiya@xxxxxxxxxx
masataka-orange@xxxxxxxxxx



[前][次][番号順一覧][スレッド一覧]

     13695 2007-01-28 12:25 [Mamiya Masataka <xc8] like で抽出する場合の注意点             
     13696 2007-01-29 04:29 ┣[Tasuku SUENAGA <a@xx]                                       
->   13700 2007-01-29 11:02 ┃┣[Mamiya Masataka <xc8]                                     
     13703 2007-01-30 08:09 ┃┗[とみたまさひろ <tomm]                                     
     13711 2007-02-07 02:12 ┃ ┗[Mamiya Masataka <xc8]                                   
     13701 2007-01-29 12:12 ┗[YuGo <yu.gotou@xxxxx]