文字化け変換・復元 Character Encoding
文字化け変換・復元ツールは、読めなくなってしまったテキストやCSVファイルの文字化けを自動で判定して簡単に直すことができる無料のオンラインツールです。テキスト入力欄に文字化けした文章を貼り付けるか、ファイルをドロップするだけで、Shift\_JISやUTF-8などの文字コードの違いによって発生した文字化けを瞬時に解読し、正しい日本語に変換します。
使い方
- 「文字化けテキスト」の入力欄に文字化けした文章を貼り付けるか、対象のファイル(txt、csv、htmlなど)をドロップして読み込みます。
- 「変換・復元する」または「CSV文字化けを変換」ボタンをクリックします。
- 正しい日本語に復元された候補が一覧で表示されるので、目的の結果の「テキストをコピー」またはCSVのダウンロードボタンをクリックして利用します。
文字化けとは
文字化けとは何か
文字化けとは、コンピュータがテキストデータを表示するときに、文字コードの解釈がずれてしまい、本来の文字が正しく表示されない現象です。
たとえば「こんにちは」が「縺薙s縺ォ縺。縺ッ」のように意味不明な文字列になってしまうのが文字化けです。
なぜ文字化けが起きるのか
コンピュータの中では、文字は数字(バイト列)として保存されています。どの数字がどの文字に対応するかを決めたルールが「文字コード」です。
日本語には複数の文字コードが存在するため、Shift_JISで保存したファイルをUTF-8として読み込むと、対応する文字がずれてしまい文字化けが発生します。
代表的な日本語の文字コード
UTF-8
現在最も広く使われている文字コードです。世界中の文字を表現でき、WebサイトやLinux環境で標準的に使われています。
Shift_JIS(Windows-31J)
WindowsやMicrosoft Officeで長年使われてきた文字コードです。ExcelでCSVを保存するとShift_JISになることが多く、UTF-8環境で開くと文字化けの原因になります。
EUC-JP
LinuxやUnix系のサーバーで使われていた文字コードです。古いWebサイトやメールシステムで採用されていることがあります。
ISO-2022-JP(JIS)
日本語メールで使われることが多い文字コードです。メールソフトの設定ミスによる文字化けの原因になることがあります。
よくある文字化けのパターン
ExcelでCSVを開いたら文字化けした
UTF-8で保存されたCSVをExcelで直接開くと、Shift_JISとして読み込まれて文字化けします。対処法はExcelの「データ取り込み」機能でUTF-8を指定するか、UTF-8 BOM付きで保存することです。
メールが文字化けした
送信側と受信側のメーラーの文字コード設定が一致していない場合に発生します。ISO-2022-JPに変換して送信することで解決することが多いです。
PHPやMySQLで文字化けした
データベースへの接続時に文字コードを指定していないと文字化けが発生します。MySQLではSET NAMES utf8mb4を実行し、PHPではmb_internal_encoding('UTF-8')を設定することで防げます。
BOM付きUTF-8の問題
BOM(Byte Order Mark)はUTF-8ファイルの先頭に付加される不可視の印です。多くの環境では問題ありませんが、古いシステムやPHPで先頭に余分な文字が表示される原因になることがあります。
このツールでできること
文字化け変換・復元ツールでは、以下の処理が可能です。
- 文字化けテキストの自動解析と復元候補の一覧表示
- Shift_JIS・UTF-8・EUC-JP・ISO-2022-JP・Latin-1・UTF-16の相互変換
- HTMLエンティティ(& < あ など)の復元
- Unicodeエスケープ(\u3042 など)の復元
- 制御文字・改行コード・全角スペース・BOMの可視化
- CSVファイルの文字化け確認とUTF-8 BOM付きダウンロード
文字化けを防ぐために
文字化けを根本的に防ぐには、ファイルの作成・保存・読み込みのすべての段階で文字コードを統一することが重要です。現在はUTF-8が最も広く使われており、特別な理由がない限りUTF-8に統一することをおすすめします。
関連ツール
注意事項
このツールは無料でご利用いただけます。
※このプログラムはPHP8.2.22にて作成、動作確認を行っております。
※ご利用下さっている皆様のご意見・ご要望(改善要望)をお寄せください。