| HEX | 00 | 10 | 20 | 30 | 40 | 50 | 60 | 70 |
|---|---|---|---|---|---|---|---|---|
| 00 | NUL | DLE | 0 | @ | P | ` | p | |
| 01 | SOH | DC1 | ! | 1 | A | Q | a | q |
| 02 | STX | DC2 | " | 2 | B | R | b | r |
| 03 | ETX | DC3 | # | 3 | C | S | c | s |
| 04 | EOT | DC4 | $ | 4 | D | T | d | t |
| 05 | ENQ | NAK | % | 5 | E | U | e | u |
| 06 | ACK | SYN | & | 6 | F | V | f | v |
| 07 | BEL | ETB | ' | 7 | G | W | g | w |
| 08 | BS | CAN | ( | 8 | H | X | h | x |
| 09 | HT | EM | ) | 9 | I | Y | i | y |
| 0A | LF | SUB | * | : | J | Z | j | z |
| 0B | VT | ESC | + | ; | K | [ | k | { |
| 0C | FF | FS | , | < | L | \ | l | | |
| 0D | CR | GS | - | = | M | ] | m | } |
| 0E | SO | RS | . | > | N | ^ | n | ~ |
| 0F | SI | US | / | ? | O | _ | o | DEL |
ASCIIコードでは 5C や7C の文字が変更可能で国により異なる文字が割り当てられていることがある
ISO 646 などで変更可能とされている
その他文字も各国で異なる場合がありいろいろあったのかISO 8859 にまとめられていたりするため純粋なASCIIコードはあまり使われていない
7bit/8bit付近の推移 ASCII? ISO 646 → いろいろ → ISO-8859-1 → Unicode
制御文字はJIS X 0211 とか ISO/IEC 6429 とか
Unicodeの先頭256文字はASCIIではなくISO 8859-1と同じ配置が割り当てられている
文字として区別する場合はUnicodeで別途割り当てられているコードを使用する。他の文字コードと併用する可能性がある場合は全角文字などで代用するのが無難
| CODE | 文字 | Unicode位置 | Unicode全角代替 | |
|---|---|---|---|---|
| US-ASCII | 5C | バックスラッシュ | \U+005C | \U+FF3C |
| 7C | 破断線(ブロークンバー) | ¦U+00A6 | ¦U+FFE4 | |
| 7E | チルダ | ~U+007E | ~U+FF5E | |
| ISO/IEC 8859-1 Latin-1 ISO-8859-1 / Windows-1252 / CP819 | 5C | バックスラッシュ | U+005C | \U+FF3C |
| 7C | 縦線(vertical line) | U+007C | |U+FF5C | |
| 7E | チルダ | U+007E | ~U+FF5E | |
| A5 | 円記号 | U+00A5 | ¥U+FFE5 | |
| A6 | 破断線 | U+00A6 | ¦U+FFE4 | |
| JIS X 0201 / Shift_JIS / Windows_31J / EUC-JP / CP932 | 5C | 円記号 | ¥U+00A5 | ¥U+FFE5 |
| 7C | 縦線(vertical line) | |U+007C | |U+FF5C | |
| 7E | オーバーライン | ‾U+203E |  ̄U+FFE3 | |
| 韓国 EUC-KR | 5C | ウォン記号 | ₩U+20A9 | ₩U+FFE6 |
| デンマーク/ノルウェー | 5C | ストローク付きO | ØU+00D8 |
ASCIIコード近辺のみ取り上げていますが、他の文字でもいろいろあるので省略します。
制御コード
| bit | HEX | ESC | ||
|---|---|---|---|---|
| 0000000 | 00 | NUL | NULL | |
| 0000001 | 01 | SOH | ||
| 0000010 | 02 | STX | ||
| 0000011 | 03 | ETX | ||
| 0000100 | 04 | EOT | ||
| 0000101 | 05 | ENQ | ||
| 0000110 | 06 | ACK | 肯定応答 | |
| 0000111 | 07 | \a | BEL | |
| 0001000 | 08 | \b | BS | |
| 0001001 | 09 | \t | HT | |
| 0001010 | 0A | \n | LF | |
| 0001011 | 0B | \v | VT | |
| 0001100 | 0C | \f | FF | |
| 0001101 | 0D | \r | CR | |
| 0001110 | 0E | SO | シフトアウト | |
| 0001111 | 0F | SI | シフトイン | |
| 0010000 | 10 | DLE | ||
| 0010001 | 11 | DC1 | ||
| 0010010 | 12 | DC2 | ||
| 0010011 | 13 | DC3 | ||
| 0010100 | 14 | DC4 | ||
| 0010101 | 15 | NAK | 否定応答 | |
| 0010110 | 16 | SYN | 同期文字 | |
| 0010111 | 17 | ETB | ||
| 0011000 | 18 | CAN | 取り消し | |
| 0011001 | 19 | EM | 媒体終端 | |
| 0011010 | 1A | SUB | ||
| 0011011 | 1B | ESC | ||
| 0011100 | 1C | FS | ||
| 0011101 | 1D | GS | ||
| 0011110 | 1E | RS | ||
| 0011111 | 1F | US | ||
| 1111111 | 7F | DEL |
エスケープシーケンス / エスケープコード
もともとDOSでESC(0x1B) + いろいろでテキスト画面やプリンタを飾っていたもの ANSI escape code などWindowsではつかなくなったのかな
ISO-2022-XX で入れ換えに使うのもあり
C言語などから円記号 \と制御コードを示す文字をあわせたもの
HTMLなどでは制御文字を代替文字で使うもの \t > など