SQL Server 照合順序の意味

“Japanese_CI_AS” とか。
意味もわからず呪文のように覚えていた頃もありましたが、意味がわかれば結構簡単に覚えられます。
先ずはこの”CI””AS”の末尾の一文字
“I”-Insensitive:識別しない
“S”-Sensitive:識別する
さらに、前の一文字
“C”-Case:大文字小文字(例:”A”と”a”)
“A”-Accesnt:アクセント記号(例:”a”と”á”)
“K”-Kana:ひらがなとカタカナ(例:”あ”と”ア”)
“W”-Width(?):文字列幅(例:”ア”と”ア”)
これらの組み合わせで出来ています。
なので、”Japanese_CI_AS”なら、「日本語・大文字小文字は識別しない・アクセントは識別する」という意味になります。省略されたものは「識別しない」になるようです。
「日本語にアクセント記号は無いぞ!」という至極最もな突っ込みはありますが、ちょいと実験してみました。

[T-SQL]
declare @Sometable table (
    SomeValue nvarchar(10)
    COLLATE JAPANESE_CI_AS )
insert into @Sometable values (‘か’)
insert into @Sometable values (‘が’)
insert into @Sometable values (‘カ’)
insert into @Sometable values (‘ガ’)
insert into @Sometable values (‘カ’)
insert into @Sometable values (‘ガ’)
insert into @Sometable values (‘つ’)
insert into @Sometable values (‘っ’)
select count(*), Somevalue from @SomeTable
group by SomeValue

【結果】
CNT     Somevalue
———– ———-
3      か
3      ガ
1      っ
1      つ
では、照合順序を”Japanese_CI_AI”にしてみると…
【結果】
CNT     Somevalue
———– ———-
6      か
2      つ
なんと、濁点はともかく、「小さい”つ”」も「アクセント記号」だったのです。(これは知らなかった…)
そして、これらのほかに
“_BIN”-Binary
“_BIN2″-Binary – Unicode codepoint
というのもあります。
このあたりについては、コチラ:MSDN-SQL Server Books Online- Windows 照合順序並べ替えスタイルに詳しく解説されています。

SQL Server 照合順序の意味” への5件のコメント

  1. なるほど!!
    記号の意味をわからないで使っていたので、とても勉強になりました!!
    ありがとうございます!!

  2. 英字の大文字小文字を判断してくれなくて困っていたところでした!
    助かりました!
    ありがとうございます!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Spam Protection by WP-SpamFree