★漢字コード

○シフトJISコード(Winodws一般漢字コード)
シフトJISのコード範囲は以下のようになっています。
1バイト目 0x81-0x9F, 0xE0-0xFC 
2バイト目 0x40-0x7E, 0x80-0xFC 
(正規表現:[\x81-\x9F\xE0-\xFC][\x40-\x7E\x80-\xFC])

通常ASCII:
0x20-0x7E

半角カナ:
0xA0-0xDF
(正規表現:[\xA0-\xDF])

全角数字:1234567890
0x824F-0x8258
(正規表現:[\x82][\x4F-\x58])

全角英字:ABC〜
大文字:
0x8260-0x8279
小文字:
0x8281-0x829A
(正規表現:[\x82][\x60-\x9A])

ひらがな:
0x829F-0x82F1
(正規表現:[\x82][\x9F-\xF1])

カタカナ:
0x8340-0x8396
(正規表現:[\x83][\x40-\x96])

ー:
0x815B

JIS漢字:
0x889F-0xFCFC

○EUCコード(UNIX系統)
EUCコードは第1、第2バイトとも 0xa1 - 0xfe までであるが、
半角のカナ文字については、0x8e を半角カナ文字の前につけ、2バイトで表現する。

○JISコード(メールなど)
JISコードは7ビット系漢字コードであるため、
つぎのようなシフトコードを使って、文字セットの切り替えを行い、かな漢字を表現する。

シフトコード
文字セット  シフトコード  
新JIS    X0208-1983  ESC $ B  
旧JIS    X0208-1978  ESC $ @  
JISローマ字 X0201       ESC ( J  
ASC                 ESC ( B