Software Engineer and Web Developer's Diary

1年後の自分に向けて

髙(はしご高)が文字化けする

プログラムなどでいろいろ処理をしていると、髙(はしご高)などのIBM拡張文字が 文字化けすることがあります。

今回はCSVファイルを読み込んでDBに登録し、そのデータを画面に表示するというアプリケーション作成時にその問題が発生しました。

どのように解決したかというと、CSV読み込み時の文字コード指定をMS932(MS932というのはMicrosoftShift_Jisを拡張して作成したコード体系ではしご高も含まれます。)としてDBに登録、画面表示の際はUTF-8として出力するというようなことをしました。

UTF-8だと全て表示できるようです。