症状
- CGIまたはPHPなどで作成の際に、発生することがある。
- その文字を記述する位置にかかわらず、特定の文字で文字化けが起こる。
- 「表示」をという文字列を表示しようとすると「侮ヲ」と化ける。
- 「十、表、予、能」などを含むと化けてしまう。(※他にも多数化ける文字は存在します。詳細は5C文字を参考にして下さい。)
- windowsサーバでは起こらない。
原因
- 2バイト目が「5C」である文字が、「5C」がメタ文字の「¥(日本語環境(半角))」と認識されて化ける。
- 2バイト目が「5C」である文字は全て化ける可能性がある。
事例
※ここでは、「表示」という文字を見本にます。
- 図のように「表」の2バイト目が「5C」と解釈されて取り除かれる。
文字 |
表 |
示 |
文字コード(Shift_JIS) |
95 5C |
8E A6 |
文字 |
侮 |
ヲ(半角) |
文字コード(Shift_JIS) |
95 8E |
A6 |
対応
- ファイルをEUC-JPの形式で保存する。
- 問題の文字の後ろに「¥(日本語環境(半角))」を追加すると正しく表示される。
追記
- 色々条件により、EUC-JPの形式での作成が不可能な場合があるので、別の対応も必要。
- 携帯サイトなどでも、出来るだけShift_JISで保存することが推奨される。(※機種により文字コードの対応がさまざまである為)
5C文字とコード
― |
81 5C |
ソ |
83 5C |
Ы |
84 5C |
Ⅸ |
87 5C |
噂 |
89 5C |
浬 |
8A 5C |
欺 |
8B 5C |
圭 |
8C 5C |
構 |
8D 5C |
蚕 |
8E 5C |
十 |
8F 5C |
申 |
90 5C |
曾 |
91 5C |
箪 |
92 5C |
貼 |
93 5C |
能 |
94 5C |
表 |
95 5C |
暴 |
96 5C |
予 |
97 5C |
禄 |
98 5C |
兔 |
99 5C |
喀 |
9A 5C |
媾 |
9B 5C |
彌 |
9C 5C |
拿 |
9D 5C |
杤 |
9E 5C |
歃 |
9F 5C |
濬 |
E0 5C |
畚 |
E1 5C |
秉 |
E2 5C |
綵 |
E3 5C |
臀 |
E4 5C |
藹 |
E5 5C |
觸 |
E6 5C |
軆 |
E7 5C |
鐔 |
E8 5C |
饅 |
E9 5C |
鷭 |
EA 5C |
偆 |
ED 5C |
砡 |
EE 5C |
最終更新:2006年04月27日 16:01