2010/10/29改訂
Webで使用 | 表記(charset) | 特徴 | 漢字対応 | 採用サイト | |
JIS | iso-2022-jp | 電子メールの送受信で使用。 | 第二水準漢字まで | ||
● | シフトJIS | Shift_JIS | おもにWindowsやMacintosh、携帯端末で使用。 | 第二水準漢字まで | BIGLOBE、NTT、Sony |
● | EUC | EUC-JP | Extended Unix Code の略。おもにLinuxを含むUNIX系のOSで使用。 | 第二水準漢字まで | NEC |
● | Unicode | UTF-8 | 多言語に対応するUnicodeのひとつ、日本語以外でも使用される。他の日本語文字コードが1文字を2バイトで表現するのに対し、データサイズが大きい(日本語部分1.5倍)。 | gや閧ネど第一、第二水準漢字以上(機種に依存しないので機種依存文字という考えは不要) | Yahoo!、google、MSN、goo、富士通 |
補足:
UTF-8にはBOM(Byte Order Mark)がついており、UTF-8Nにはついていない。
Webの世界ではBOMは要らない。なので、UTF-8Nでファイルを保存する必要がある。
通常、Web系のソフトでUTF-8というと、UTF-8Nのことを指す。
※metaで文字コードの指定がないと、IEはShift_JISを選んでくる。Firefoxは保存形式に合わせてコードを選んでくれる。
※IEの場合、Shift_JISでは欧文の表示がデフォルトでゴシック形だが、UTF-8では明朝形(Times New Roman)になってしまう。Firefoxは表示に違いはない。
参考サイト - Infoseek マルチ辞書
OS | |
CR+LF | Windows |
CR | Mac OS |
LF | Linuxを含むUnix系OS |
CR(キャリッジ・リターン=復帰):行の途中から行の先端(左端)へ移動する命令を表す
LF(ラインフィード=改行):左右の位置は変えずに次の行に移る命令を表す