Objet : Liste consacrée aux discussions à propos de la composition et de la typographie
Archives de la liste
- From: orandier AT unix12.pressicom.fr (Olivier RANDIER)
- To: TYPOGRAPHIE Distribution List <typographie AT irisa.fr>
- Subject: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur
- Date: Tue, 22 Apr 1997 00:41:22 +0200
... fin du message précédent
Concrètement, Unicode comprend déjà les ligatures suivantes :
0132 LATIN CAPITAL LIGATURE IJ
0133 LATIN SMALL LIGATURE IJ
FB00 LATIN SMALL LIGATURE FF
FB01 LATIN SMALL LIGATURE FI
FB02 LATIN SMALL LIGATURE FL
FB03 LATIN SMALL LIGATURE FFI
FB04 LATIN SMALL LIGATURE FFL
FB05 LATIN SMALL LIGATURE LONG S T
FB06 LATIN SMALL LIGATURE ST
Les codages expert et alternate d'Adobe propose en outre :
ct -> LATIN SMALL LIGATURE C T
s long double -> LATIN SMALL LIGATURE LONG S DOUBLE
s long-h -> LATIN SMALL LIGATURE LONG S H
s long-i -> LATIN SMALL LIGATURE LONG S I
s long-l -> LATIN SMALL LIGATURE LONG S L
s long-s -> LATIN SMALL LIGATURE LONG S S (pour distinguer du eszet)
Rp -> LATIN LETTER LIGATURE CAPITAL R SMALL LETTER P (franchement, je ne me
rappelle pas à quoi sert celle-ci)
- les terminologies Unicode proposées sont de mon crû -
ainsi que des formes alternatives pour k, v, w (en italique) ou finales
pour a, e, n r, t, z (en romain) et des swash caps.
On a fait remarquer ici qu'il faudrait également prévoir des ligatures pour
les différents accents que peut prendre le i, par exemple ffî.
Par contre, on a parlé aussi de ligature fè, à cause de fontes mal conçues.
Là , je crois qu'il faut pas pousser : c'est aux fondeurs d'être vigilants
pour tenir compte des problèmes particuliers liés aux lettres accentuées.
L'adoption d'une norme favorisant les fontes multilingues devrait
contribuer à renforcer leur attention (enfin, j'espère...).
Certains ici ont fait remarquer que ae et oe n'était pas nommés ligatures
dans Unicode. Mais, même si, typographiquement, c'en sont (et Dalida ;) ),
sémantiquement ce sont des signes distincts et indivisibles. Unicode est
donc cohérent, là (si, là , regarde, là ...), même si on aurait pu être un
peu plus explicite (ligaturème ? ;))) ). Il en est de même pour l'eszet,
l'experluette, l'arobace, entre autres.
Bref, à tout casser, ça fait moins d'une vingtaine de signes à ajouter Ã
Unicode pour être, à peu près, complet (du moins en ce qui concerne le
français, d'autres langues en exigent peut-être quelques autres (fff en
allemand, par exemple). Je doute qu'au total on excède la cinquantaine de
signes.
Une cinquantaine de signes, ça paraît raisonnable, ramené aux 65 000 signes
que peut contenir Unicode, non ?
Concernant les petites caps, il est à noter qu'Unicode contient déjà :
0299 LATIN LETTER SMALL CAPITAL B
0262 LATIN LETTER SMALL CAPITAL G
029C LATIN LETTER SMALL CAPITAL H
026A LATIN LETTER SMALL CAPITAL I
029F LATIN LETTER SMALL CAPITAL L
0274 LATIN LETTER SMALL CAPITAL N
028F LATIN LETTER SMALL CAPITAL Y
0280 LATIN LETTER SMALL CAPITAL R
0276 LATIN LETTER SMALL CAPITAL OE
0281 LATIN LETTER SMALL CAPITAL INVERTED R
029B LATIN LETTER SMALL CAPITAL G WITH HOOK
Pourquoi celles-là , et pas les autres, mystère...
En tout état de cause, les caractères latins dans Unicode sont
approximativement au nombre de 700 environ (en comptant les variantes caps
et bas-de-casse). Ce qui veut dire qu'ajouter les versions petites caps
signifie environ 350 signes de plus. C'est déjà moins raisonnable... (mais
ça reste envisageable).
Il est, d'ailleurs, intéressant de noter la présence de "petite ponctuation" :
FE50 SMALL COMMA
FE51 SMALL IDEOGRAPHIC COMMA
FE52 SMALL FULL STOP
FE54 SMALL SEMICOLON
FE55 SMALL COLON
FE56 SMALL QUESTION MARK
FE57 SMALL EXCLAMATION MARK
FE58 SMALL EM DASH
FE59 SMALL LEFT PARENTHESIS
FE5A SMALL RIGHT PARENTHESIS
FE5B SMALL LEFT CURLY BRACKET
FE5C SMALL RIGHT CURLY BRACKET
FE5D SMALL LEFT TORTOISE SHELL BRACKET
FE5E SMALL RIGHT TORTOISE SHELL BRACKET
FE5F SMALL NUMBER SIGN
FE60 SMALL AMPERSAND
FE61 SMALL ASTERISK
FE62 SMALL PLUS SIGN
FE63 SMALL HYPHEN-MINUS
FE64 SMALL LESS-THAN SIGN
FE65 SMALL GREATER-THAN SIGN
FE66 SMALL EQUALS SIGN
FE68 SMALL REVERSE SOLIDUS
FE69 SMALL DOLLAR SIGN
FE6A SMALL PERCENT SIGN
FE6B SMALL COMMERCIAL AT
dont l'utilité ne peut qu'être liée aux petites caps et aux chiffres
petites caps (qui eux, sont présents).
À mon avis, il est plus logique de prévoir un attribut <SC> qui renvoie
directement à un descriptif de famille <SC> dans les fontes (comme cela se
passe pour l'italique). C'est simple, efficace, et ça fonctionne
parfaitement pour des substitutions glyphe à glyphe, qui sont beaucoup plus
simples que les ligatures.
Merci de votre attention.
Olivier Randier - Experluette
- [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Olivier RANDIER, 22/04/1997
- <Suite(s) possible(s)>
- [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Olivier RANDIER, 22/04/1997
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Paul Pichaureau, 22/04/1997
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Paul Terray, 22/04/1997
- Re: [Unicode] Distinction, Emmanuel Curis, 22/04/1997
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Paul Pichaureau, 22/04/1997
- [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Olivier RANDIER, 22/04/1997
- Re: [Unicode] Distinction caractère/glyphe/graphème/typème/raton-lav eur, Jean-Pierre Lacroux, 22/04/1997
- [Unicode] Distinction caractère/glyphe/graphèm e/typème/raton-lav eur, Thierry Bouche, 22/04/1997
Archives gérées par MHonArc 2.6.16.