Mac OS romain - Mac OS Roman
MIME / IANA | macintosh |
---|---|
Pseudo(s) | mac, MacRoman, x-mac-roman
|
Langue(s) | Anglais , divers autres |
Classification | ASCII étendu , script Mac OS |
S'étend | ASCII , jeu de caractères Macintosh |
Mac OS Roman est un codage de caractères créé par Apple Computer, Inc. pour être utilisé par les ordinateurs Macintosh . Il convient à la représentation de texte en anglais et dans plusieurs autres langues occidentales. Mac OS Roman code 256 caractères, dont les 128 premiers sont identiques à ASCII , les autres caractères comprenant des symboles mathématiques, des signes diacritiques et des signes de ponctuation supplémentaires. Mac OS Roman est une extension du jeu de caractères Macintosh d'origine, qui n'encodait que 217 caractères. La prise en charge complète de Mac OS Roman est apparue pour la première fois dans macOS 6.0.4 , publié en 1989, et l'encodage est toujours pris en charge dans les versions actuelles de macOS , bien que les codages de caractères standard soient désormais UTF-8 ou UTF-16 . Apple a modifié Mac OS Roman en 1998 avec la sortie de macOS 8.5 en remplaçant le signe de la devise à la position hexadécimale 0xDB par le signe de l'euro, mais sinon l'encodage est resté inchangé depuis sa sortie.
Jeu de caractères
Le tableau suivant montre comment les caractères sont codés dans Mac OS Roman. Les en-têtes de ligne et de colonne donnent le premier et le deuxième chiffre du code hexadécimal pour chaque caractère du tableau. Sous chaque caractère se trouve la valeur scalaire de l' équivalent Unicode du caractère .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
NUL 0000 |
SOH 0001 |
STX 0002 |
ETX 0003 |
EOT 0004 |
ENQ 0005 |
ACK 0006 |
BEL 0007 |
BS 0008 |
HT 0009 |
BF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
DC4 0014 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
NOUS 001F |
2_ |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ |
@ 0040 |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Je 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ |
` 0060 |
un 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
je 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
avec 0077 |
x 0078 |
et 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ |
Ä 00C4 |
Å 00C5 |
Ç 00C7 |
É 00C9 |
Ñ 00D1 |
Ö 00D6 |
Ü 00DC |
à 00E1 |
à 00E0 |
â 00E2 |
à 00E4 |
ã 00E3 |
å 00E5 |
ç 00E7 |
é 00E9 |
è 00E8 |
9_ |
ê 00EA |
ë 00EB |
í 00ED |
ì 00EC |
î 00EE |
ï 00EF |
ñ 00F1 |
ó 00F3 |
ò 00F2 |
ô 00F4 |
ö 00F6 |
õ 00F5 |
ú 00FA |
ù 00F9 |
û 00FB |
ü 00FC |
UNE_ |
† 2020 |
° 00B0 |
¢ 00A2 |
£ 00A3 |
§ 00A7 |
• 2022 |
¶ 00B6 |
ß 00DF |
® 00AE |
© 00A9 |
™ 2122 |
´ 00B4 |
¨ 00A8 |
≠ 2260 |
Æ 00C6 |
Ø 00D8 |
B_ |
∞ 221E |
± 00B1 |
≤ 2264 |
≥ 2265 |
¥ 00A5 |
μ 00B5 |
∂ 2202 |
Σ 2211 |
Π 220F |
π 03C0 |
∫ 222B |
ª 00AA |
º 00BA |
Ω 03A9 |
æ 00E6 |
ø 00F8 |
C_ |
¿ 00BF |
¡ 00A1 |
¬ 00AC |
√ 221A |
ƒ 0192 |
≈ 2248 |
Δ 2206 |
« 00AB |
» 00BB |
… 2026 |
NBSP 00A0 |
À 00C0 |
à 00C3 |
Õ 00D5 |
Œ 0152 |
œ 0153 |
RÉ_ |
– 2013 |
— 2014 |
" 201C |
” 201D |
' 2018 |
' 2019 |
÷ 00F7 |
◊ 25CA |
ÿ 00FF |
Ÿ 0178 |
/ 2044 |
€ 20AC |
< 2039 |
› 203A |
fi FB01 |
fl FB02 |
E_ |
‡ 2021 |
· 00B7 |
, 201A |
„ 201E |
‰ 2030 |
 00C2 |
Ê 00CA |
Á 00C1 |
Ë 00CB |
È 00C8 |
Í 00CD |
Î 00CE |
Ï 00CF |
Ì 00CC |
Ó 00D3 |
Ô 00D4 |
F_ |
F8FF |
Ò 00D2 |
Ú 00DA |
Û 00dB |
Ù 00D9 |
ı 0131 |
02C6 |
~ 02DC |
¯ 00AF |
˘ 02D8 |
˙ 02D9 |
˚ 02DA |
ļ 00B8 |
˝ 02DD |
˛ 02DB |
02C7 |
Lettre Nombre Ponctuation symbole Autre Indéfini
Notes techniques
L' Internet Assigned Numbers Authority identifie ce codage à l'aide de la chaîne « macintosh ». Le type de contenu MIME pour cet encodage est donc "text/plain; charset=macintosh". Le numéro de page de code Microsoft Windows est 10000 . IBM utilise la page de codes/ CCSID 1275.
Avec la sortie de Mac OS X , Mac OS Roman et tous les autres "scripts" (comme les appelait Mac OS classique) ont été remplacés par UTF-8 comme codage de caractères standard pour le système d'exploitation Macintosh. Cependant, l'encodage de caractères par défaut dans Java pour Mac OS X est resté MacRoman, et la disposition du clavier avec sa combinaison de touches control , option et mortes correspond toujours aux caractères d'origine de MacRoman. L'encodage de caractères par défaut pour Java peut être changé en UTF-8 en ajoutant la ligne suivante à .profile
:
JAVA_OPTS="${JAVA_OPTS:+$JAVA_OPTS }-Dfile.encoding=UTF-8"
export JAVA_OPTS