文字コード(UTF-8、Shit_JISなど)とは

文字コードとは何ですか?

Shift_JIS,EUC-JP,UTF-8などの言葉を聞いたことがある人は多いかと思われます。これらはコンピュータ上で文字を使う際に、各文字に割り当てられる数値表現もしくは数値表現と文字の対欧関係を規定したものです。

PCのOSがWindowsの方であれば、文章を編集するアプリケーション(エディタ)で「メモ帳(notepad.exe)」がインストールされていますよね。メモ帳は文字コードを扱うにあたり、Shit_JISを標準的に利用するようになっています(「名前を付けて保存」実行時に文字コードを選択することができます)。

notepadの保存ダイアログ

HTML文書を記述するにあたって、「自分がどの文字コードを採用するのか」を明確にしておく必要があります。文字コードの理解不足は俗に言う「文字化け」の原因にも繋がります。

文字化けとは

コンピュータで文字を表示する際に、正しく表示されない現象のことを文字化けと言います。例えば、ホームページ閲覧時において、実際にHTML文書が書かれた文字コードと、ブラウザで表示しようとする際に使う文字コードの不一致により、文字化けが発生します。

XHTML文章を書く際に、どの文字コードを使うべき?

本サイト管理人は、「UTF-8」の利用を勧めます。

ちなみに、Windowsの標準文字コードはUTF-8ではありません。XHTML文書を作成する際は、「メモ帳」を使わず、自分で文字コードを指定できるエディタを用意すると良いでしょう。