Dispositions de clavier
pour la France et la Francophonie
• possibilité de faire sans exécutable à télécharger ;
• un outil gratuit de Microsoft fait les pilotes et les installateurs ;
• des classeurs Excel bientôt disponibles pour personnaliser ;
• la gravure des touches AZERTY France est respectée.
Nouvelles propositions pour l’AZERTY et le BÉPO
[Ici reviendront des vues de disposition]
Les fichiers qui suivent devraient permettre à tous les volontaires de tester des dispositions de clavier afin de finaliser leur développement. Ils sont dérivés d’un prototype fait pour le CLDR (Common Locale Data Repository) d’Unicode dans le cadre d’une enquête publique menée sur une extension du langage formel qu’il utilise, en vue de prendre en charge de nouvelles fonctionnalités sur les dispositions de clavier.
C’était l’occasion pour le CLDR de valider ce dont la France et d’autres pays ont besoin : bascule Programmeur, modificatrice Nombres, sélecteur de groupe en touche morte, et la touche de composition. Par manque de temps et afin dʼéviter de mélanger plusieurs nouveautés (de nouvelles versions sortent tous les six mois), Unicode a décidé de remettre la plupart de ces choses éventuellement à plus tard. Retrouvez les informations dont il disposait sur les modificatrices et bascules, les sélecteurs à base de touches mortes, et l’espacement automatique des ponctuations.
On utilise uniquement les fonctionnalités fournies par Windows. Cela fonctionne sous n’importe quelle version de Windows à partir de Windows 2000.
Tous les utilisateurs de Windows ont le droit de télécharger gratuitement, sur le site de Microsoft,un logiciel qui permet à tout le monde d’apporter des modifications à la disposition de clavier utilisée, ou d’en créer de nouvelles. Il s’appelle Microsoft Keyboard Layout Creator, bref MSKLC. Son interface est en anglais uniquement. La licence de Windows interdit d’utiliser des composants logiciels, tandis que la licence du MSKLC ne l’interdit pas. On peut donc se servir aussi directement de l’utilitaire qui se trouve à l’intérieur, qui s’appelle Keyboard Table Generation Tool (Unicode), ou KbdUTool de son nom de fichier. Il permet d’utiliser toutes les fonctionnalités de clavier de Windows, pas seulement celles que le MSKLC aide à éditer par son interface graphique. On n’est pas non plus obligé de se limiter au format de fichier simplifié utilisé par le MSKLC et pris en chargee par le KbdUTool.
Avant de faire compiler les drivers, le KbdUTool génère des tables (d’où son nom) en langage C. La source avec l’extension .klc est donc d’abord convertie en une source avec l’extension .c à laquelle est associée une source en-tête avec l’extension .h ainsi qu’un fichier .rc contenant les métadonnées, et enfin un minuscule fichier .def pareillement requis pour la compilation. En plus des commandes pour sortir les quatre drivers un à un, le KbdUTool en accepte aussi une seulement pour générer ces sources, qui une fois éditées doivent être mises en lecture seule. Grâce à cette astuce, les sources éditées sont compilées à la place des sources fraîchement générées chaque fois.
La source .klc ne contient pas la disposition proposée, elle ne sert qu’à faire tourner le MSKLC pour produire les installateurs au nouveau nom. On peut installer cette disposition par défaut avant de remplacer ces drivers par les drivers de la disposition souhaitée, puis de redémarrer l’ordinateur. Pour cela on a besoin du MSKLC. On peut éventuellement automatiser le tout à l’aide d’un script de commandes en batch, le langage de Windows. L’auteur du MSKLC, Michael Kaplan, donne quelques indications dans un billet de blog. C’est avantageux pour les administrateurs de systèmes informatiques, qui grâce à la visibilité sur la chaîne peuvent plus facilement en assumer la responsabilité.
Comme il a fallu ajouter pas mal de code dans la source en-tête, il est plus intéressant d’en mettre une partie dans une source en-tête commune, appelée kbcommon.h. Pour afficher les sources ci-dessouses dans le navigateur, il est recommandé d’utiliser Chrome (Firefox ne reconnaît pas les extensions de fichier .c ni .h).
Pour partager des dispositions de clavier, on distribue couramment des dossiers contenant le setup.exe, les trois fichiers d’installation (un par famille de systèmes), et les quatre drivers chacun dans son dossier. Les utilisateurs préfèrent en général cliquer sur le setup.exe puis laisser faire l’installateur Windows. Comme avant l’installation d’un grand logiciel, Windows commence par créer un point de restauration, ce qui prend un peu de temps à cause de la masse de données à enregistrer sur le disque dur.
On peut aussi prendre les drivers au détail ici et les mettre dans les dossiers générés chez soi par le MSKLC, comme ça au moins on sait d’où vient le setup.exe. Tous les fichiers téléchargés sont systématiquement marqués comme suspects, et comme je donne tout gratuitement, je ne paierai pas de certificats ni de signatures numériques. Dans les propriétés des fichiers on peut cocher une case indiquant à Windows que l’on fait confiance.
Trois des quatre drivers correspondent aux processeurs courants :
Voici le pack tout-en-un :
Voici le pack tout-en-un :
Par défaut, sous Windows, la bascule Programmeur est à gauche du 1, et la modificatrice Nombres est à gauche du W, tandis que sous macOS il faut utiliser VerrCap comme bascule Programmeur, et Option comme modificatrice Nombres en mode Programmeur. VerrCap est remplacé par une touche morte itérative à gauche du W. On peut avoir une disposition similaire sous Windows en utilisant le redisposeur de codes matériels de touches (Scancode mapper for keyboards) inclus depuis Windows 2000, paramétré par cette valeur à ajouter dans le registre :
En projet, sortie prévue prochainement.
Avec ce qui est prévu depuis Mac OS X 10.2, chaque disposition de clavier supplémentaire est définie dans un fichier en langage XML avec l’extension .keylayout déposée dans l’un des dossiers /Keyboard Layouts/ qui sont des sous-dossiers des dossiers /Bibliothèque/. Cela peut se faire dans chacun des comptes utilisateurs, mais aussi dans le dossier central partagé par tous les utilisateurs du poste. Cela est spécifié dans la TechNote 2056.
Testés sur Mac OS X 10.6.8 Snow Leopard, ils peuvnet être utilisés sur tous les ordinateurs Apple Mac à partir de Mac OS X 10.2.
Suite à un bug qui empêche macOS de reconnaître Option droite comme une modificatrice distincte d’Option gauche comme spécifié dans la Technical Note 2056, on utilise Option différemment en mode Programmeur, c’est-à-dire quand la bascule CapsLock (verrouillage majuscule) est enclenchée. Voir la vue de disposition ci-après ainsi que les commentaires dans le .keylayout :
Si la disposition de clavier n’est pas immédiatement disponible après son ajout dans le dossier macOS/Library/Keyboard Layouts, il faut juste fermer et rouvrir la session. Elle apparaîtra dans la liste sous le nom de Français complémenté.
En projet, sortie prévue prochainement.
[Ici viendra une vue de disposition]
Il y a un jeu de classeurs Excel pour générer une partie du code source pour Windows (table d’allocations, répertoire des touches mortes, et table des séquences), puis pour en dériver du code pour macOS. Il était rédigé en français mais comme il a fallu commencer par le CLDR il est maintenant en anglais :
Adaptation française (alternative avec descripteurs) des tables de codes du Standard Unicode™ 10.0 (2017).
Dérivée de la version 10.0 du standard Unicode™ et de la version française de son image ISO/IEC 10646.
Sont repris inchangés 49,07 % des noms de la version 10.0 de la liste française officielle révisée du 2017-08-08, 16:47:50 TUC, téléchargée depuis :
http://hapax.qc.ca/ListeNoms-10.0.0.txt
et tenue aussi à disposition à :
http://dispoclavier.com/iso/src/v10/2017-08-08/ListeNoms-10.0.0_ioo.txt
La version originale anglaise de la ListeNoms, la NamesList, a paru en version finale 10.0 le 20 juin 2017 et est consultable à :
http://www.unicode.org/Public/10.0.0/ucd/NamesList.txt
La syntaxe de ces sources est détaillée au même endroit :
http://www.unicode.org/Public/10.0.0/ucd/NamesList.html
Le jeu de caractères universel est maintenu conjointement par Unicode et ISO/IEC JTC1 SC2 WG2 qui le publie sous le numéro ISO/IEC 10646. Seule cette norme avait une version française. Aucune adaptation française n’est endossée par le Consortium Unicode®, qui héberge toutefois sur son site quelques pages en français. Les textes de référence et en général aussi les travaux d’extension du répertoire se font en anglais, mais quelques documents sont bilingues ou en français.
L’original anglais : Copyright © 1991-2017 Unicode®, Inc.
Unicode™ est une marque d’Unicode®, Inc.
Avant toute distribution, consulter les modalités d’utilisation d’Unicode® :
http://www.unicode.org/terms_of_use.html
La liste complète est disponible (en pré-aperçu) sur la page d’accueil (provisoirement très lourde avec ses 12 Mo de code HTML) de docucaras.info.
Invitation à commenter
Les noms des signes de nos écritures font partie de notre patrimoine culturel. Ils se doivent de convenir au plus grand nombre et d’être en accord avec les nations et les linguistes qui pratiquent ces écritures. Cela ne se vérifie pas pour les noms de caractères dans Unicode, qui ont été altérés par l’ISO pour les faire converger vers les noms trouvés dans des normes précédentes, noms parfois obsolètes voire erronés. Ainsi l’ISO a remplacé « ouvrant » et « fermant » par « gauche » et « droit » dans les noms de ponctuations devenues pourtant réflexibles (en fonction de la direction de l’écriture), et elle a remplacé « hatchek » par « caron » alors que « caron » n’est pas le nom anglais de l’hatchek (qui s’appelle hachek ou hacek en anglais) et n’a jamais été validé par les Tchèques. De plus, par égard pour l’ISO, les noms Unicode anglais-standardais sont figés et ne peuvent être corrigés que par la publication de noms bis (dits alias formels), immédiatement repris dans la version française en remplacement des noms défectueux. Mais cette procédure ne s’applique qu’aux erreurs les plus grossières. D’autres noms faux sont corrigés par l’ajout d’alias informatifs, d’annotations ou de fichiers auxiliaires. Certains noms Unicode sont illogiques à dessein, comme ceux où « lettre modificative » figure à la place d’« exposant ». Si la plupart des noms Unicode valent aussi comme descripteurs, ce n’est pas le cas de tous, et il faut toujours se reporter aux textes descriptifs du standard.
Les noms de caractères Unicode sont par conséquent susceptibles d’être traduits même en anglais, et Unicode encourage toute initiative dans ce sens (voir cette page sur le site d’Unicode). La version française s’est toujours évertuée à aplanir les aspérités de l’original. Elle a un statut particulier dans le sens où les normes ISO se présentent sous la forme de deux versions, une anglaise et une française. Corriger la version française est ainsi plus compliqué.
En pratique, les noms français sont des traductions pour les utilisateurs. Il est donc primordial qu’ils vous plaisent, et vous préférez certainement rencontrer au quotidien des noms agréables à lire et à entendre. Si vous trouvez sur cette page des noms que vous n’aimez pas, n’hésitez pas à me les signaler et à partager vos idées pour des noms meilleurs. Pour cela et pour toute autre question ou information, merci de m’envoyer un mail à contact@dispoclavier.com, ou un tweet à @dispoclavier.
Présentation (de la liste complète)
105 079 des 136 690 caractères d’Unicode 10.0 ne figurent pas nominativement dans cette liste, parce qu’ils portent un nom composé d’un nom générique et du point de code, et ne sont représentés ici que par leurs blocs de codes. Il s’agit surtout des idéogrammes (sinogrammes) chinois, japonais et coréens.
Les caractères de commande quant à eux sont repris dans Unicode mais dépassent le cadre du standard. Les glyphes qui s’affichent pour eux dans la liste résultent de l’entité HTML formée avec le point de code.
Les caractères ne sont pas tous implémentés sur tous les ordinateurs. On peut utilement mettre à jour sa machine en ajoutant une bonne police pour les symboles mathématiques, comme STIX 2.0.0, qui est gratuite, faite par des professionnels et utilisée dans le monde universitaire. Voir le lien de téléchargement sur fileformat.info/info/unicode/char/27cb/fontsupport. On peut aussi consulter les exemples de glyphes dans les tables de caractères d’Unicode, dont les liens de téléchargement depuis le site d’Unicode se trouvent à la suite des titres de blocs, ou dans le fichier PDF unique.
Les numéros précédés de « § » renvoient à la version 10.0.0 du standard Unicode™, disponible aussi sous forme d’une collection de 24 chapitres isolés, dont les adresses ont cette forme où XX est le numéro du chapitre : http://www.unicode.org/versions/Unicode10.0.0/chXX.pdf. Les adresses complètes sont dans l’hyperlien des numéros de chapitres dans la liste.
Les noms ou descripteurs surligés en vert jaune sont changés par rapport à la version française ISO/IEC révisée officielle du 8 août 2017, qui renseigne le nom apparaissant en infobulle au survol de ces descripteurs. Le changement peut être aussi petit que le remplacement d’un simple guillemet générique par un guillemet apostrophe, plus joli et à l’abri de certains problèmes informatiques. Dans les noms Unicode d’origine, les simples guillemets génériques sont même interdits.
Les couleurs de fond des encadrés où se trouvent les noms ou descripteurs de caractères indiquent à quelle catégorie le caractère appartient. Le nom de la catégorie apparaît en infobulle au survol.
Les caractères réflexibles (bidi-mirrored) par permutation de glyphes entre caractères appariés changent de direction de l’écriture au clic dessus. La réflexion bidirectionnelle (bidi-mirroring) existe depuis Unicode pour les ponctuations et symboles qui ont une directionnalité. Ces ponctuations surviennent souvent par paires d’une ponctuation ouvrante et d’une ponctuation fermante. Leur réflexion permet d’éviter des problèmes dans les contextes bidirectionnels, comme en arabe et en hébreu où les mots s’écrivent de droite à gauche, et les chiffres de gauche à droite.
Le premier caractère concerné est la parenthèse ouvrante. Au survol de la parenthèse, le fond vert avec la ligne de base disparaît et laisse la place à un fond jaune dégradé indiquant la direction de l’écriture, précisé par une infobulle. Après un clic, la cellule de tableau est remplacée par une autre où la parenthèse est précédée d’un caractère de forçage directionnel droite-à-gauche U+202E (et suivie d’un caractère de dépilement de formatage directionnel U+202C, bien que cela ne soit pas nécessaire à la fin d’une cellule), de sorte qu’elle s’affiche en miroir.
Cela fonctionne aussi pour une partie des symboles mathématiques. Couramment, 180 symboles mathématiques ne bénéficient pas de ce système ; leur réflexion bidirectionnelle se fait par glyphes droite-à-gauche dédiés. Ces remplacement de glyphes font appel à des fonctionnalités OpenType avancées qui doivent être prises en charge à la fois par le moteur de rendu et la police de caractères. Tant que l’une des deux parties n’est pas prête, rien ne se passe, à moins d’utiliser un éditeur de formules, qui peut générer lui-même le miroir d’un glyphe, en plus d’ajouter des graphismes.
0020 | ESPACE | |
espace mots
[i] « Espace mots » s’écrit correctement sans trait d’union, comme dans cette leçon de typographie : http://esad-gv.net/designgraphique/_ressources/_David_Poullard/A_ESPACES_PONCTUATIONS.pdf. C’est une application de la règle selon laquelle en français, on n’utilise pas de trait d’union dans les mots composés qui ne changent pas de sens ou de catégorie grammaticale ; voir http://grammaire.reverso.net/5_3_01_trait_dunion.shtml. On considère qu’« espace mots » ne change pas de sens, puisqu’il s’agit toujours d’une espace, en précisant que c’est celle qui sépare les mots qui l’entourent. D’où aussi le pluriel. | ||
[i] En effet, les espaces ne sont pas de « caractères graphiques » au sens propre, catégorie souvent opposée à celle des caractères de contrôle, mais elle est classée comme caractère graphique invisible : https://en.wikipedia.org/wiki/ASCII#Printable_characters | ||
pour symboliser sa présence, on met le symbole 2423 ␣ BOÎTE OUVERTE, ou le symbole 2420 ␠ ou l’abréviation SP pour « space »
[i] Cette distinction est utile aussi dans la vie courante. Voir dans le Larousse en ligne : http://www.larousse.fr/dictionnaires/francais/espace/31014?q=espace#30933 ; sous l’onglet http://www.larousse.fr/dictionnaires/francais/espace/31014/difficulte, on lit : « Genre : Espace n.m. = étendue, volume, intervalle de temps ; Espace n.f. = blanc entre deux mots (terme technique d’imprimerie) : une espace fine. » | ||
espace insécable classique 00A0
espace cadratin 2003 césure conditionnelle 200B espace fine insécable 202F gluon 2060 symbole d’espace 2420 ␠ boîte ouverte 2423 ␣ espace idéographique 3000 indicateur d’ordre des octets FEFF |
0021 | ! | [i] Sur l’usage de l’apostrophe dans les noms de caractères et le reste du fichier, voir la note à 0001 COMMANDE DÉBUT D’EN-TÊTE. (Des notes sur les changements sont placées à la première occurrence.) | |
factorielle
point d’exclamation retourné 00A1 ¡ lettre latine clic rétroflexe 01C3 ǃ point d’exclamation arménien 055C ՜ double point d’exclamation 203C ‼ point exclarrogatif 203D ‽ signal de danger 26A0 ⚠ point d’exclamation ornemental 2762 ❢ | |||
0022 | " | [i] En français, on ne peut laisser à ce caractère le nom de « GUILLEMET » sans préciser. Mais on ne saurait l’affubler de l’attribut d’« ANGLAIS » non plus, car ce serait induire les utilisateurs en erreur. En anglais, « mettre entre guillemets » ne revient pas à faire précéder et suivre ce caractère-ci, même si l’on s’en dépanne souvent, faute d’avoir davantage sur le clavier. Aujourd’hui que tout est codé et disponible dans Unicode (et déjà depuis la fin des années 1980 ᦀ et l’émergence des jeux de caractères industriels Windows 1252 et MacRoman), l’usage propre de ce caractère est limité aux langages informatiques : moteurs de recherche, HTML/XML, programmation. — L’attribut DOUBLE est préposé, non postposé (comme dans « guillemet double générique »), pour la cohérence interne et les nuances sémantiques ; cf. la note de 2A53 ⩓ ET LOGIQUE DOUBLE. | |
[i] En anglais américain, ce caractère tient lieu de guillemets ; en anglais britannique, il tient lieu de guillemets de second niveau. D’où l’idée de l’appeler « guillemet anglais ». Or même en anglais, ce guillemet n’est pas préféré, mais la paire des guillemets doubles apostrophes “…”. Voir par exemple sur : http://monsu.desiderio.free.fr/atelier/chevrons.html | |||
représenté par un glyphe neutre (vertical) polysémique, appelé « gants de toilette » d’après sa forme dans certaines polices
en informatique : guillemet double (« double quote ») en français, les caractères préférés pour les citations sont 00AB « GUILLEMET CROISSANT et 00BB » GUILLEMET DÉCROISSANT [i] Contrairement à une ancienne tradition typographique, les guillemets doubles apostrophes ne sont pas « anglais » à tel point que leur usage devrait être proscrit en français, car ils ont un rôle à jouer en tant que « guillemets d’ironie ». Voir https://fr.wikipedia.org/wiki/Guillemet#Guillemets_d.E2.80.99ironie. Le problème de la faille sémantique introduite par l’usage des guillemets de citation comme guillemets d’ironie ressort de http://www.ledevoir.com/societe/actualites-en-societe/488139/mises-aux-points-les-antiguillemets-comme-symboles-de-la-postverite. | |||
sert aussi à remplacer la ponctuation double prime pour noter pouces et secondes ; le caractère préféré est 2033 ″ DOUBLE PRIME
lettre seconde 02BA ʺ diacritique double accent aigu 030B ̋ diacritique double accent grave 030F ̏ diacritique double ligne verticale en chef 030E ̎ ponctuation hébraïque gerchâïm 05F4 ״ guillemet double apostrophe retournée 201C “ guillemet double apostrophe 201D ” double prime 2033 ″ guillemet double apostrophe ornemental 275E ❞ guillemet de répétition 3003 〃 guillemet double prime 301E 〞 | |||
0023 | # | CROISILLON | |
carré, chemin de fer, ducat, octothorpe
claviers téléphoniques : dièse anglais : symbole numéro 0023 FE0F 20E3 #️⃣ TOUCHE DE CLAVIER CROISILLON symbole l b rayé 2114 ℔ égal et parallèle 22D5 ⋕ carré de visualisation 2317 ⌗ dièse 266F ♯ | |||
0024 | $ | SYMBOLE DOLLAR | |
milreis, escudo
peso, piastre utilisé pour de nombreuses devises peso en Amérique Latine et ailleurs le glyphe peut comporter une ou deux barres verticales la plupart des symboles monétaires sont codés dans le bloc Symboles monétaires (20A0 ₠..20CF ) symbole monétaire générique 00A4 ¤ symbole peso 20B1 ₱ gros symbole dollar 1F4B2 💲 billet de dollar 1F4B5 💵 | |||
0025 | % | SYMBOLE POUR CENT | |
symbole arabe pour cent 066A ٪
symbole pour mille 2030 ‰ symbole pour dix-mille 2031 ‱ signe moins commercial 2052 ⁒ | |||
0026 | & | PERLUÈTE | |
esperluète, esperluette, et commercial
note tironienne et 204A ⁊ perluète retournée 214B ⅋ perluète italique minuscule 1F670 🙰 perluète italique captiale 1F672 🙲 perluète épaisse 1F674 🙴 perluète italique 1F675 🙵 | |||
0027 | ' | [i] On ne saurait laisser à ce caractère le nom d’« APOSTROPHE », car on ne ferait qu’induire les utilisateurs en erreur. En français et dans d’autres langues, l’élision ne consiste pas à remplacer la fin du mot par ce caractère-ci, même si l’on s’en dépanne souvent, faute d’avoir davantage sur le clavier. Aujourd’hui que tout est codé et disponible dans Unicode, ce caractère sert avant tout en informatique, comme délimiteur de chaîne, ou en HTML à la place de 0022 " DOUBLE GUILLEMET GÉNÉRIQUE. Un nom similaire, « guillemet simple informatique », se trouve dans cette contribution du 24/11/2012 : https://openclassrooms.com/forum/sujet/probleme-d-apostrophes-46020#message-7863603, et le nom de GUILLEMET SIMPLE est répertorié dans un mini-dictionnaire de traduction technique : https://tigrerayé.org/Mini-dictionnaire/Inversé. — L’attribut SIMPLE est préposé, en harmonie avec l’attribut DOUBLE, mentionné à la fin de la note de 0022 ". | |
[i] En anglais britannique, ce caractère tient lieu de guillemets ; en anglais américain, il tient lieu de guillemets de second niveau. | |||
guillemet APL, symbole de fonction APL apostrophe
prime, minute [i] Cet alias, s’il prête à confusion, exprime au moins le fait que ce caractère simplifié a de multiples usages. Mais cela est vrai aussi pour les guillemets apostrophes, dont l’une sert d’apostrophe en français et dans d’autres langues : 2019 ’ GUILLEMET SIMPLE APOSTROPHE. | |||
glyphe neutre (vertical) polysémique
sert de guillemet simple (« quote ») en informatique sert aussi à remplacer la ponctuation prime pour noter pieds et minutes ; le caractère préféré est 2032 ′ PRIME le caractère préféré comme apostrophe est 2019 ’ GUILLEMET SIMPLE APOSTROPHE le caractère préféré en anglais britannique comme apostrophe est 2019 ’ GUILLEMET SIMPLE APOSTROPHE ou 02BC ʼ LETTRE APOSTROPHE les caractères recommandés en anglais comme guillemets simples hauts appariés sont 2018 ‘ GUILLEMET SIMPLE APOSTROPHE RETOURNÉE et 2019 ’ GUILLEMET SIMPLE APOSTROPHE le caractère préféré comme gerich en hébreu est 05F3 ׳ PONCTUATION HÉBRAÏQUE GERICH lettre prime 02B9 ʹ lettre apostrophe 02BC ʼ lettre ligne verticale 02C8 ˈ diacritique accent grave 0300 ̀ diacritique accent aigu 0301 ́ diacritique ligne verticale en chef 030D ̍ ponctuation hébraïque gerich 05F3 ׳ séparateur de milliers arabe 066C ٬ guillemet simple apostrophe retournée 2018 ‘ guillemet simple apostrophe 2019 ’ prime 2032 ′ guillemet simple apostrophe retournée ornemental 275B ❛ guillemet simple apostrophe ornemental 275C ❜ minuscule latine saltillo A78C ꞌ | |||
0028 | ( | ( | [i] Dans Unicode 1.0, ce caractère s’appelle « parenthèse ouvrante », et c’est seulement depuis la fusion avec l’ISO/IEC 10646 (à partir de la version 1.1) qu’Unicode est forcé de l’appeler « parenthèse gauche », et obligé de spécifier dans le standard qu’au lieu de « gauche », il faut lire « ouvrante ». Voici le texte original : Paired punctuation marks containing the qualifier “left” in their name are taken to denote opening; characters whose name contains the qualifier “right” are taken to denote closing. For example, U+0028 left parenthesis and U+0029 right parenthesis are interpreted as opening and closing parentheses, respectively. In a right-to-left directional run, U+0028 is rendered as “)”. In a left-to-right run, the same character is rendered as “(”. https://unicode.org/versions/Unicode9.0.0/ch06.pdf#G11291. |
écriture gauche-à-droite : parenthèse gauche
ce caractère est réflexible : il est gauche ou droit selon la direction de l’écriture (§04.7) [i] Pour afficher les parenthèses ouvrantes dans un texte droite-à-gauche, le moteur de rendu utilise simplement le glyphe de la parenthèse fermante. Voir cet exemple par le W3C : https://www.w3.org/International/articles/inline-bidi-markup/#mirrored. Voir https://unicode.org/versions/Unicode9.0.0/ch06.pdf#G11291 et la sous-section Paired Brackets dans l’Annexe nᵒ 9 au Standard Unicode – Unicode® Standard Annex #9 : Unicode bidirectional algorithm (UBA) : http://www.unicode.org/reports/tr9/#Paired_Brackets. La ressource associée dans la Base de données des caractères Unicode est : https://unicode.org/Public/10.0.0/ucd/BidiBrackets.txt. Cf. https://stackoverflow.com/questions/13535172/list-of-all-unicodes-open-close-brackets. — Le mot « réflexible » dans le Wiktionnaire : https://fr.wiktionary.org/wiki/réflexible, et dans la discussion sur le texte bidirectionnel dans Wikipédia : https://fr.wikipedia.org/wiki/Discussion:Texte_bidirectionnel. — Ce qui dissuade d’utiliser « contrepartie » au lieu de « pendant » est le bruit provenant des autres sens de ce mot. | |||
diacritique parenthèses en chef 1ABB ᪻
exposant parenthèse ouvrante 207D ⁽ indice parenthèse ouvrante 208D ₍ arc supérieur de parenthèse gauche 239B ⎛ parenthèse supérieure 23DC ⏜ nombre un entre parenthèses 2474 ⑴ minuscule latine a entre parenthèses 249C ⒜ parenthèse moyenne ouvrante 2768 ❨ parenthèse ajourée ouvrante 2985 ⦅ double parenthèse ouvrante 2E28 ⸨ capitale latine a entre parenthèses 1F110 🄐 | |||
0029 | ) | ) | PARENTHÈSE FERMANTE |
écriture gauche-à-droite : parenthèse droite
ce caractère est réflexible par permutation de glyphes avec son pendant 0028 ( (§04.7) | |||
002A | * | ASTÉRISQUE | |
claviers téléphoniques : étoile
la TOUCHE DE CLAVIER ÉTOILE est représentée par la séquence emoji 002A FE0F 20E3 *️⃣ étoile à cinq branches arabe 066D ٭ astérisme 2042 ⁂ astérisque baissé 204E ⁎ opérateur astérisque 2217 ∗ sextile 26B9 ⚹ gros astérisque 2731 ✱ astérisque à huit branches 2733 ✳ astérisque à cinq branches au trait moyen 1F7B0 🞰 astérisque à six branches au trait moyen 1F7B6 🞶 | |||
002B | + | [i] Le signe plus et le signe moins ainsi que leurs composés et dérivés sont les seuls symboles mathématiques à porter le mot « signe » dans leur nom, car en plus d’être des opérateurs, ils servent à noter le signe des nombres signés, en pratique celui des nombres négatifs. — L’utilisation de « signe » fait l’objet du commetaire de 003C <. | |
addition
plus ou moins 00B1 ± symbole modificateur signe plus 02D6 ˖ signe moins 2212 − moins ou plus 2213 ∓ signe plus pointé 2214 ∔ croix grecque épaisse 271A ✚ signe plus épais 2795 ➕ lettre hébraïque signe plus alternatif FB29 ﬩ croix grecque au trait mince 1F7A1 🞡 | |||
002C | , | VIRGULE | |
séparateur décimal, virgule décimale
séparateur de milliers séparateur de milliers quand le point est séparateur décimal, et vice versa en français, le séparateur de milliers est 202F ESPACE FINE INSÉCABLE virgule arabe 060C ، séparateur décimal arabe 066B ٫ guillemet virgule 201A ‚ virgule élevée 2E34 ⸴ virgule réfléchie 2E41 ⹁ virgule idéographique 3001 、 | |||
002D | - | [i] Sur les claviers en France, on l’appelle « tiret du 6 », pour le distinguer du « tiret du 8 ». | |
[i] « TRAIT D’UNION-SIGNE MOINS » est la traduction longue de l’anglais HYPHEN-MINUS. En français cela donne un mot inutilisable car trop long, presque monstrueux, gauche aussi par son trait d’union unissant deux termes déjà composés mais contenant des espaces Il faudrait presque écrire « trait-d’union-signe-moins ». En typographie, on connaît le tiret quart de cadratin (voir 2010 ‐). On peut donc parler de « tiret » et préciser « générique » comme pour 0022 ", 0027 ', 00A4 ¤ (et un alias pour 0060 `). — L’utilisation de « signe » fait l’objet du commetaire de 003C <. | |||
[i] En typographie, ce caractère aussi est appelé « division », parce qu’il s’utilise à la place de 2010 ‐ TRAIT D’UNION. | |||
[i] Dans la plupart des polices, son glyphe ne convient pas comme signe moins, et dans certaines, pas comme trait d’union non plus. Il s’agit en particulier de Lucida Sans Unicode, où ce caractère n’est vraiment qu’un tiret générique qui ne ressemble à rien. Dans la nouvelle police Noto, il est un peu plus long que 2010 ‐. Sur Noto : https://www.presse-citron.net/google-publie-noto-la-premiere-police-decriture-open-source-pour-800-langues/. | |||
le caractère recommandé comme signe moins est 2212 − SIGNE MOINS
trait d’union 2010 ‐ trait d’union insécable 2011 ‑ tiret tabulaire 2012 ‒ tiret demi-cadratin 2013 – tiret cadratin 2014 — tiret trois quarts de cadratin 2015 ― point de coupure de mot 2027 ‧ puce trait d’union 2043 ⁃ signe moins 2212 − point médian séparateur de mots 2E31 ⸱ symbole romain once 10191 𐆑 | |||
002E | . | POINT | |
point final, point d’abréviation
[i] Unicode avait décidé de ne pas désunifier les deux usages principaux. En arabe, les deux sont distincts parce que les glyphes le sont aussi. Voir http://www.unicode.org/L2/L2017/17324-decimal-full-stop.pdf pour les arguments en faveur de la désambigüisation [orthographe rectifiée de 1990, conformément à la règle de placer le tréma sur la seconde lettre prononcée distinctement]. | |||
séparateur de milliers
séparateur de milliers quand la virgule est séparateur décimal, et vice versa en français, le séparateur de milliers est 202F ESPACE FINE INSÉCABLE peut apparaître haussé pour les chiffres elzéviriens point médian 00B7 · séparateur décimal arabe 066B ٫ point arabe 06D4 ۔ simple point de conduite 2024 ․ points de suspension 2026 … point sténographique 2E3C ⸼ opérateur point 22C5 ⋅ point élevé 2E33 ⸳ point idéographique 3002 。 | |||
002F | / | OBLIQUE | |
barre oblique, cotice
oblique inverse 005C \ lettre latine clic dental 01C0 ǀ diacritique oblique longue 0338 ̸ barre de fraction 2044 ⁄ opérateur oblique 2215 ∕ oblique au trait fort 1F67C 🙼 |
Des chiffres décimaux sont codés aussi dans les plages Chiffres gras [1D7CE 𝟎..1D7D7 𝟗], Chiffres ajourés [1D7D8 𝟘..1D7E1 𝟡], Chiffres sans sérif [1D7E2 𝟢..1D7EB 𝟫], Chiffres sans sérif gras [1D7EC 𝟬..1D7F5 𝟵], et Chiffres à chasse fixe [1D7F6 𝟶..1D7FF 𝟿] du bloc Lettres et chiffres mathématiques (1D400 𝐀..1D7FF 𝟿), et dans de nombreuses autres écritures. §04.6, §05.5 et §09.2 |
0030 | 0 | CHIFFRE ZÉRO |
0030 FE0F 20E3 0️⃣ TOUCHE DE CLAVIER CHIFFRE ZÉRO
exposant chiffre zéro 2070 ⁰ indice chiffre zéro 2080 ₀ [i] Pour désigner la représentation visuelle d’un caractère selon la police (famille de fontes), on peut préférer employer uniformément le terme « glyphe » plutôt que le terme « œil », pour l’univocité et selon la préférence actuelle ; cf. https://fr.wikipedia.org/wiki/%C5%92il_(typographie), ainsi que http://www.eila.univ-paris-diderot.fr/_media/user/helene_beciri/enseignement/m1/conception-docs/ref_typo_et_mise_en_page/termes_de_typographie.doc à « œil ». | ||
0031 | 1 | CHIFFRE UN |
0031 FE0F 20E3 1️⃣ TOUCHE DE CLAVIER CHIFFRE UN
exposant chiffre un 00B9 ¹ indice chiffre un 2081 ₁ | ||
0032 | 2 | CHIFFRE DEUX |
0032 FE0F 20E3 2️⃣ TOUCHE DE CLAVIER CHIFFRE DEUX
exposant chiffre deux 00B2 ² indice chiffre deux 2082 ₂ | ||
0033 | 3 | CHIFFRE TROIS |
0033 FE0F 20E3 3️⃣ TOUCHE DE CLAVIER CHIFFRE TROIS
exposant chiffre trois 00B3 ³ indice chiffre trois 2083 ₃ | ||
0034 | 4 | CHIFFRE QUATRE |
0034 FE0F 20E3 4️⃣ TOUCHE DE CLAVIER CHIFFRE QUATRE
exposant chiffre quatre 2074 ⁴ indice chiffre quatre 2084 ₄ | ||
0035 | 5 | CHIFFRE CINQ |
0035 FE0F 20E3 5️⃣ TOUCHE DE CLAVIER CHIFFRE CINQ
exposant chiffre cinq 2075 ⁵ indice chiffre cinq 2085 ₅ | ||
0036 | 6 | CHIFFRE SIX |
0036 FE0F 20E3 6️⃣ TOUCHE DE CLAVIER CHIFFRE SIX
exposant chiffre six 2076 ⁶ indice chiffre six 2086 ₆ | ||
0037 | 7 | CHIFFRE SEPT |
0037 FE0F 20E3 7️⃣ TOUCHE DE CLAVIER CHIFFRE SEPT
exposant chiffre sept 2077 ⁷ indice chiffre sept 2087 ₇ | ||
0038 | 8 | CHIFFRE HUIT |
0038 FE0F 20E3 8️⃣ TOUCHE DE CLAVIER CHIFFRE HUIT
exposant chiffre huit 2078 ⁸ indice chiffre huit 2088 ₈ | ||
0039 | 9 | CHIFFRE NEUF |
0039 FE0F 20E3 9️⃣ TOUCHE DE CLAVIER CHIFFRE NEUF
exposant chiffre neuf 2079 ⁹ indice chiffre neuf 2089 ₉ |
003A | : | DEUX-POINTS | |
utilisé aussi pour signifier la division ou l’échelle ; pour cet usage mathematique, 2236 ∶ RAPPORT est préféré
point arménien 0589 ։ ponctuation hébraïque sof pasouq 05C3 ׃ rapport 2236 ∶ symbole modificateur deux-points A789 ꞉ | |||
003B | ; | POINT-VIRGULE | |
on préfère ce caractère à 037E ; pour représenter le point d’interrogation grec ; les deux caractères ont des glyphes identiques
point d’interrogation grec 037E ; point-virgule arabe 061B ؛ point-virgule réfléchi 204F ⁏ | |||
003C | < | < | INFÉRIEUR |
[i] Pour simplifier les choses, on propose que parmi les opérateurs et autres symboles mathématiques, les seuls à porter le mot SIGNE dans leur nom soient les véritables signes : SIGNE MOINS et SIGNE PLUS, 2212 − et 002B + respectivement, puisq’ils servent (surtout le premier, souvent remplacé par 002D - TIRET GÉNÉRIQUE) à noter les nombres signés. Aux autres symboles on applique la règle qui veut que dans les noms de caractères, l’anglais SIGN se traduit par SYMBOLE en français (tandis que le SIGNE français est souvent la traduction de l’anglais MARK). À commencer d’ailleurs par les différents symboles monétaires dont le premier par le point de code est 0024 $ SYMBOLE DOLLAR, en anglais DOLLAR SIGN. Aujourd’hui en anglais, SYMBOL est préféré, par exemple pour le (futur) COPYLEFT SYMBOL prévu à *1F12F, pour lequel le nom « COPYLEFT SIGN » (par analogie au COPYRIGHT SIGN 00A9 ©) a été délibérément écarté, parce qu’il ne correspond pas à l’usage majoritaire. Le mot SIGNE, traditionnellement utilisé aussi pour d’autres opérateurs que PLUS et MOINS, est de toute manière omis pour les opérateurs composés comme 2264 ≤ INFÉRIEUR OU ÉGAL, ce qui amène la nécessité d’apprendre la démarcation entre présence et absence du nom de catégorie, en plus de celle entre SIGNE et SYMBOLE. On propose d’éliminer ces complications arbitraires, car elles ne correspondent à aucune différence fonctionnelle et sont donc inutiles et contre-productives. — Quant aux prépositions traînantes dans les noms de symboles mathématiques, si elles ont leur raison d’être en anglais, elles sont inutiles en français, encombrantes et peuvent même conduire à des cacophonies comme dans les noms de 2A9B ⪛, 2A9C ⪜, 2AA5 ⪥ (« À À »). D’ailleurs, pour la cohérence, 22C7 ⋇ devrait alors aussi s’appeller DIVISÉ PAR MULTIPLIÉ PAR ; mais on voit bien que ce sont des noms inutilement compliqués. | |||
en informatique : sert aussi de crochet brisé ouvrant
sert aussi de pointe de flèche (vers la gauche en écriture gauche-à-droite, vers la droite en écriture droite-à-gauche) ce caractère est réflexible par permutation de glyphes avec son pendant 003E > (§04.7) simple guillemet croissant 2039 ‹ crochet brisé ouvrant 27E8 ⟨ chevron ouvrant 3008 〈 | |||
003D | = | ÉGAL | |
[i] Ce symbole est souvent considéré comme un « signe », mais de toute manière pour les symboles composés dont il fait partie, le nom de catégorie ne figure pas du tout. Il apparaît ainsi plus cohérent de le laisser tomber dès le nom du symbole simple. En plus, on évite ainsi le dilemme SIGNE/SYMBOLE ici comme dans les autres noms concernés par cette simplification. Voir aussi la note précédente. | |||
asymptotiquement égal 2243 ≃
presque égal 2248 ≈ différent 2260 ≠ identique 2261 ≡ double égal 2A75 ⩵ symbole modificateur égal court A78A ꞊ symbole romain sextant 10190 𐆐 | |||
003E | > | > | [i] Voir la note du symbole de la relation réciproque 003C <. |
symbole supérieur à
en informatique : sert aussi de crochet brisé fermant sert aussi de pointe de flèche (vers la droite en écriture gauche-à-droite, vers la gauche en écriture droite-à-gauche) ce caractère est réflexible par permutation de glyphes avec son pendant 003C < (§04.7) simple guillemet décroissant 203A › crochet brisé fermant 27E9 ⟩ chevron fermant 3009 〉 | |||
003F | ? | POINT D’INTERROGATION | |
point d’interrogation retourné 00BF ¿
point d’interrogation grec 037E ; point d’interrogation arabe 061F ؟ point exclarrogatif 203D ‽ point d’interrogation-exclamation 2048 ⁈ point d’exclamation-interrogation 2049 ⁉ symbole d’incertitude 2BD1 ⯑ | |||
0040 | @ | AROBASE | |
[i] Le principe de moindre surprise conduirait à opter pour le terme le plus courant, "a commercial", indexé 74 000 000 fois par Google Search. Cf. https://tigrerayé.org/Mini-dictionnaire/Inversé. Mais la Commission spécialisée de terminologie et de néologie de l’informatique et des composants électroniques donne le choix entre "arobase", indexé 1 290 000 fois, et "arrobe" (69 200 fois). Google trouve aussi 794 000 résultats pour "arrobas", 467 000 pour "arobas", et 47 900 pour "à commercial". Cf. http://www.apfa.asso.fr/motdor/etymolog/arobase.htm | |||
ancienne mesure de poids espagnole, de l’arabe « ar-rub » signifiant « un quart (de quintal) » |
0041 | A | [i] Le terme « LETTRE » est omis dans les noms des capitales et des minuscules, car en français, il n’est pas nécessaire de préciser « LETTRE » quand il s’agit d’une capitale ou d’une minuscule. Ce n’est pas nécessaire en anglais non plus ; voir dans les Code Charts le bloc Lettres et chiffres mathématiques (1D400 𝐀..1D7FF 𝟿) https://unicode.org/charts/PDF/U1D400.pdf Par exemple « MATHEMATICAL BOLD CAPITAL A » ; certes ces lettres de même catégorie Unicode que les lettres latines tirées de l’ASCII sont déclarées comme « Mathematical Alphanumeric Symbols » dans l’intention déclarée de dissuader les utilisateurs de s’en servir pour écrire, alors que pour Google c’est strictement équivalent. Grâce à l’omission de « LETTRE », on a des noms plus compacts, et on évite aussi le choix entre « LETTRE » et « LIGATURE » dans les cas des ligatures orthographiques telles qu’Æ et Œ – l’e dans l’a et l’e dans l’o, dont la première est appelée LETTRE, et la seconde, DIGRAMME SOUDÉ dans la v.f., et LIGATURE dans la version Unicode altérée par l’ISO/IEC (Unicode voulait tout appeler LETTRE, et le Danemark a fait changer l’Æ de LIGATURE [nom ISO] en LETTRE [nom Unicode 1.0 et nom actuel], suite à quoi le GT à l’ISO/IEC entra dans une telle colère qu’il a fallu édicter une garantie de stabilité, empêchant de corriger ne serait-ce qu’une faute de frappe…). |
[i] Il y a aussi un enjeu en termes d’expérience utilisateur : Grâce à l’utilisation du terme « CAPITALE » dans les noms de caractères, les noms deviennent plus distinctifs : CAPITALE LATINE A et MINUSCULE LATINE A, contre LETTRE MAJUSCULE LATINE A et LETTRE MINUSCULE LATINE A. Cela facilite la lecture des listes et le travail avec les caractères d’écriture identifiés par leurs noms, car il n’est plus nécessaire de porter son attention sur deux lettres (« -AJ- », « -IN- »). L’utilisateur voit de loin s’il s’agit d’une capitale ou d’une minuscule, même si dans les noms, la lettre elle-même est toujours en capitale. — On constate sans surprise que les utilisateurs sont davantage intéressés par des noms exacts, justes, vrais, d’usage courant, même si cela conduit à changer certains noms voire beaucoup de noms, tant il est vrai que les générations présentes sont prêtes à s’adapter et à retenir des noms nouveaux pour favoriser l’exactitude et la valeur d’usage de ces noms, et par égard pour nos enfants et toutes les générations futures. | ||
pour tous 2200 ∀ | ||
0042 | B | CAPITALE LATINE B |
capitale mathématique cursive b 212C ℬ | ||
0043 | C | CAPITALE LATINE C |
capitale mathématique ajourée c 2102 ℂ
capitale mathématique gothique c 212D ℭ complément 2201 ∁ | ||
0044 | D | CAPITALE LATINE D |
0045 | E | CAPITALE LATINE E |
symbole constante d’euler 2107 ℇ
capitale mathématique cursive e 2130 ℰ capitale latine e retourné 018E Ǝ il existe 2203 ∃ | ||
0046 | F | CAPITALE LATINE F |
capitale mathématique cursive f 2131 ℱ
capitale f retourné 2132 Ⅎ | ||
0047 | G | CAPITALE LATINE G |
capitale latine g cursif A7AC Ɡ | ||
0048 | H | CAPITALE LATINE H |
capitale mathématique cursive h 210B ℋ
capitale mathématique gothique h 210C ℌ capitale mathématique ajourée h 210D ℍ | ||
0049 | I | CAPITALE LATINE I |
en turc et en azéri, la minuscule est 0131 ı MINUSCULE LATINE I SANS POINT
capitale latine i point en chef 0130 İ minuscule latine i sans point 0131 ı capitale cyrillique i biélorusse-ukrainien 0406 І lettre cyrillique palotchka 04C0 Ӏ capitale mathématique cursive i 2110 ℐ capitale mathématique gothique i 2111 ℑ chiffre romain un 2160 Ⅰ | ||
004A | J | CAPITALE LATINE J |
004B | K | CAPITALE LATINE K |
symbole kelvin 212A K | ||
004C | L | CAPITALE LATINE L |
capitale mathématique cursive l 2112 ℒ | ||
004D | M | CAPITALE LATINE M |
capitale mathématique cursive m 2133 ℳ | ||
004E | N | CAPITALE LATINE N |
capitale mathématique ajourée n 2115 ℕ | ||
004F | O | CAPITALE LATINE O |
0050 | P | CAPITALE LATINE P |
capitale mathématique ajourée p 2119 ℙ | ||
0051 | Q | CAPITALE LATINE Q |
capitale mathématique ajourée q 211A ℚ | ||
0052 | R | CAPITALE LATINE R |
capitale mathématique cursive r 211B ℛ
capitale mathématique gothique r 211C ℜ capitale mathématique ajourée r 211D ℝ | ||
0053 | S | CAPITALE LATINE S |
0054 | T | CAPITALE LATINE T |
0055 | U | CAPITALE LATINE U |
0056 | V | CAPITALE LATINE V |
chiffre romain cinq 2164 Ⅴ | ||
0057 | W | CAPITALE LATINE W |
0058 | X | CAPITALE LATINE X |
0059 | Y | CAPITALE LATINE Y |
005A | Z | CAPITALE LATINE Z |
capitale mathématique ajourée z 2124 ℤ
capitale mathématique gothique z 2128 ℨ |
005B | [ | [ | CROCHET OUVRANT |
crochet gauche
ce caractère est réflexible par permutation de glyphes avec son pendant 005D ] (§04.7) coin supérieur de crochet gauche 23A1 ⎡ crochet en écaille supérieur 23E0 ⏠ crochet mathématique ajouré ouvrant 27E6 ⟦ crochet en écaille plein ouvrant 2997 ⦗ crochet en écaille ouvrant 3014 〔 | |||
005C | \ | OBLIQUE INVERSE | |
barre oblique inverse, barre oblique inversée, oblique inversée, contre-oblique, contre-cotice
diacritique oblique inverse couvrante 20E5 ⃥ oblique inverse au trait fort 1F67D 🙽 différence d’ensembles 2216 ∖ | |||
005D | ] | ] | CROCHET FERMANT |
crochet droit
ce caractère est réflexible par permutation de glyphes avec son pendant 005B [ (§04.7) | |||
005E | ^ | ACCENT CIRCONFLEXE | |
CIRCONFLEXE
caractère indépendant utilisé pour indiquer l’exponentiation sert de circonflexe en informatique, où son nom anglais est le même que celui de la marque de correcteur « caret » (2038 ‸) lettre accent circonflexe 02C6 ˆ diacritique accent circonflexe 0302 ̂ chevron d’insertion 2038 ‸ pointe de flèche vers le haut 2303 ⌃ exposant pointe de flèche vers le haut 02C4 ˄ et logique 2227 ∧ | |||
005F | _ | TIRET BAS | |
servait autrefois de tiret de soulignement (« underscore »), peut former une ligne continue
caractère indépendant utilisé pour indiquer l’indiciation lettre macron bas 02CD ˍ diacritique macron souscrit 0331 ̱ diacritique trait souscrit 0332 ̲ double tiret bas 2017 ‗ tiret bas avec pointillés FE4D ﹍ | |||
0060 | ` | ACCENT GRAVE | |
GUILLEMET INVERSE GÉNÉRIQUE
guillemet inversé caractère indépendant sert de guillemet inverse (« backquote ») en informatique lettre accent grave 02CB ˋ diacritique accent grave 0300 ̀ prime réfléchi 2035 ‵ |
0061 | a | MINUSCULE LATINE A |
lettre minuscule latine a
indicateur ordinal féminin 00AA ª | ||
0062 | b | MINUSCULE LATINE B |
0063 | c | MINUSCULE LATINE C |
0064 | d | MINUSCULE LATINE D |
0065 | e | MINUSCULE LATINE E |
symbole de quantité estimée 212E ℮
minuscule mathématique cursive e 212F ℯ | ||
0066 | f | MINUSCULE LATINE F |
0067 | g | MINUSCULE LATINE G |
minuscule latine g cursif 0261 ɡ
minuscule mathématique cursive g 210A ℊ | ||
0068 | h | MINUSCULE LATINE H |
minuscule cyrillique hé 04BB һ
symbole constante de planck 210E ℎ | ||
0069 | i | MINUSCULE LATINE I |
en turc et en azéri, la capitale est 0130 İ CAPITALE LATINE I POINT EN CHEF
capitale latine i point en chef 0130 İ minuscule latine i sans point 0131 ı minuscule mathématique italique i sans point 1D6A4 𝚤 | ||
006A | j | MINUSCULE LATINE J |
minuscule latine j sans point 0237 ȷ
minuscule mathématique italique j sans point 1D6A5 𝚥 | ||
006B | k | MINUSCULE LATINE K |
006C | l | MINUSCULE LATINE L |
minuscule l de ronde 2113 ℓ
minuscule mathématique cursive l 1D4C1 𝓁 | ||
006D | m | MINUSCULE LATINE M |
006E | n | MINUSCULE LATINE N |
exposant minuscule latine n 207F ⁿ | ||
006F | o | MINUSCULE LATINE O |
symbole degré 00B0 °
indicateur ordinal masculin 00BA º minuscule mathématique cursive o 2134 ℴ | ||
0070 | p | MINUSCULE LATINE P |
0071 | q | MINUSCULE LATINE Q |
0072 | r | MINUSCULE LATINE R |
0073 | s | MINUSCULE LATINE S |
0074 | t | MINUSCULE LATINE T |
0075 | u | MINUSCULE LATINE U |
0076 | v | MINUSCULE LATINE V |
0077 | w | MINUSCULE LATINE W |
0078 | x | MINUSCULE LATINE X |
croix de multiplication 00D7 × | ||
0079 | y | MINUSCULE LATINE Y |
007A | z | MINUSCULE LATINE Z |
minuscule latine z rayé 01B6 ƶ |
007B | { | { | ACCOLADE OUVRANTE |
accolade gauche
ce caractère est réflexible par permutation de glyphes avec son pendant 007D } (§04.7) arc supérieur d’accolade gauche 23A7 ⎧ accolade supérieure 23DE ⏞ accolade ajourée ouvrante 2983 ⦃ | |||
007C | | | BARRE VERTICALE | |
utilisée par paire pour indiquer une valeur absolue
lettre latine clic dental 01C0 ǀ ponctuation hébraïque paseq 05C0 ׀ double barre verticale 2016 ‖ est un diviseur 2223 ∣ barre verticale fine 2758 ❘ ligne verticale en zigzag 299A ⦚ ligne verticale ondulée 2E3E ⸾ six-points vertical 2E3D ⸽ | |||
007D | } | } | ACCOLADE FERMANTE |
accolade droite
ce caractère est réflexible par permutation de glyphes avec son pendant 007B { (§04.7) | |||
007E | ~ | TILDE | |
caractère indépendant
petit tilde 02DC ˜ tilde bas 02F7 ˷ tilde vertical 2E2F ⸯ diacritique tilde 0303 ̃ diacritique tilde souscrit 0330 ̰ diacritique tilde médian 0334 ̴ diacritique tilde vertical 033E ̾ double diacritique tilde 0360 ͠ diacritique tilde barré en chef 034A ͊ tilde médian 2053 ⁓ opérateur tilde 223C ∼ non tilde 2241 ≁ presque égal 2248 ≈ triple tilde 224B ≋ s pivoté inversé 223E ∾ sinusoïde 223F ∿ tilde pleine chasse FF5E ~ |
Les lettres, ponctuations et symboles sont tirés du jeu de caractères ISO/IEC 8859-1, aussi appelé « Latin-1 ». §06.2 |
00A0 | [i] Jusqu’à Unicode 3.0 (1999), c’était la seule espace insécable courante, parce que les anciens jeux de caractères n’avaient pas assez de place pour coder tous les caractères typographiques, et qu’aux débuts d’Unicode on avait bien d’autres soucis. Heureusement on a maintenant aussi l’espace fine insécable (qui ne se dilate ni ne disparaît), et il faut bien distinguer les deux parce qu’« espace insécable » est devenu une catégorie. On a besoin pour l’espace insécable traditionnelle, d’un nom neutre qui donne aussi un sigle français libre d’utilisation (donc ni EMI, ni EI). | |
espace dure, espace imposée, espace liante, espace sans coupure, espace-mot insécable
abrégée en ESPINC ou en EIC indiquée par le sigle NBSP pour « no-break space » [i] Elle n’est pas justifiante dans tous les environnements : en HTML oui, conformément à Unicode, mais pas dans tous les traitements de texte. Voire, l’espace insécable classique est remplacée par 0020 ESPACE lors de la conversion au format texte brut dans certains environnements courants… | ||
[i] Avec toutes les grandes ponctuations, elle est préférée par l’industrie graphique française, voir http://www.unicode.org/mail-arch/unicode-ml/y2015-m06/0220.html. Pour l’Imprimerie nationale, le deux-points fait exception en ce qu’il doit être centré entre les mots et nécessite donc l’espace mots insécable justifiante 00A0 . Voir le Lexique de l’Imprimerie nationale, ou http://esad-gv.net/designgraphique/_ressources/_David_Poullard/A_ESPACES_PONCTUATIONS.pdf. | ||
espace 0020
espace tabulaire 2007 espace fine insécable 202F gluon 2060 caisse ouverte à épaulement 237D ⍽ indicateur d’ordre des octets FEFF <insécable> 0020 |
00A1 | ¡ | [i] Tout comme le point d’interrogation, le point d’exclamation n’est ni inversé ni renversé, mais simplement retourné. L’attribut « retourné » (rotation de 180°) est présenté avec les autres attributs de transformation du plan au début du bloc Alphabet phonétique international (0250 ɐ..02AF ʯ). L’alias ci-dessous est là en référence au nom que l’on trouve dans des logiciels et ailleurs, comme traduction des noms faux utilisés déjà en anglais. Les typographes-compositeurs savent que ces ponctuations sont retournées, car en composition mécanique manuelle, ils les tournaient eux-mêmes (pour ceux d’entre eux qui avaient encore vécu cette époque). | |
point d’exclamation inversé
espagnol point d’exclamation 0021 ! point d’interrogation retourné 00BF ¿ | |||
00A2 | ¢ | SYMBOLE CENTIME | |
cent américain | |||
00A3 | £ | SYMBOLE LIVRE | |
livre sterling
punt irlandaise livre turque, lire turque lire italienne livre tournois symbole lire 20A4 ₤ symbole l b rayé 2114 ℔ symbole lire turque 20BA ₺ symbole romain demi-once 10192 𐆒 billet de livre 1F4B7 💷 | |||
00A4 | ¤ | SYMBOLE MONÉTAIRE GÉNÉRIQUE | |
la plupart des symboles monétaires sont codés dans le bloc Symboles monétaires (20A0 ₠..20CF )
symbole dollar 0024 $ symbole euro 20AC € | |||
00A5 | ¥ | SYMBOLE YEN | |
yuan
le glyphe peut comporter une ou deux barres, mais le symbole officiel au Japon et en Chine en a deux billet de yen 1F4B4 💴 yen en hausse 1F4B9 💹 | |||
00A6 | ¦ | [i] Par analogie au deux-points, on peut appeler ce caractère « deux-barrettes », sous-entendant qu’elles sont verticales et superposées. Ainsi on utilise la ressource du français qu’est le diminutif, comme pour distinguer 1DF9 ᷹ DIACRITIQUE PONT INVERSÉ SOUSCRIT et 033A ̺ DIACRITIQUE PONTET INVERSÉ SOUSCRIT. | |
[i] « Barre brisée » est un calque de l’anglais « broken bar », alors qu’en français, on dit « brisé » quand il y a changement de direction. | |||
dans certains environnements, le glyphe de ce caractère sert à afficher 007C | BARRE VERTICALE | |||
00A7 | § | [i] L’anglais et Unicode avec lui ont tendance à appeler PARAGRAPH SIGN notre PIED-DE-MOUCHE 00B6 ¶, comme le montre le nom anglais de 2761 ❡ CURVED STEM PARAGRAPH SIGN ORNAMENT, tandis que le présent caractère s’y appelle SECTION SIGN ; voir https://fr.wikipedia.org/wiki/Paragraphe_(symbole). — La traduction de l’anglais SIGN n’est pas toujours SIGNE, souvent c’est SYMBOLE, cf. la note de 003C <. | |
alinéa, section
au sens commun, désigne l’alinéa au sens juridique : ensemble d’alinéas, paragraphe usage anglo-saxon : symbole section pied-de-mouche 00B6 ¶ | |||
00AA | ª | INDICATEUR ORDINAL FÉMININ | |
castillan, galicien, italien, portugais
<exposant> 0061 a | |||
00AB | « | « | GUILLEMET CROISSANT |
[i] Lʼattribut « croissant » est proposé dans ce contexte pour donner à ce caractère un nom qui reste toujours vrai, quelle que soit la langue et le système d’écriture où il est utilisé. En effet, depuis que la plupart des ponctuations appariées sont réfléchies en fonction de la direction de l’écriture (bidi-mirrored dans Unicode), les attributs traditionnels « gauche » et « droit » ne sont plus valables, et on appelle ces caractères « ouvrant » ou « fermant » comme c’était proposé par Unicode (mais refusé par l’ISO/IEC), et comme c’est toujours spécifié dans le standard. Les guillemets chevrons sont en plus permutés dans certaines langues, répétés dans d’autres. Ce guillemet peut donc être nommé d’après sa ressemblance avec le symbole mathématique 003C < INFÉRIEUR, qui a aussi le sens de « croissant », et qui suit lui aussi la direction de l’écriture. Voir https://fr.wikipedia.org/wiki/Discussion:Guillemet#Mise_.C3.A0_jour. Voir aussi la note de 29CE ⧎. | |||
français : guillemet gauche
pointe vers la gauche en écriture gauche-à-droite ce caractère est réflexible : il pointe vers la gauche ou la droite selon la direction de l’écriture (§04.7) ce caractère est réflexible par permutation de glyphes avec son pendant 00BB » guillemet ouvrant ou fermant selon la langue (§06.2) [i] En français, on a les moyens de distinguer les guillemets de citation et les guillemets dits d’ironie, afin de faire une différence entre une citation et une simple prise de distance. Dans la presse imprimée, cette “subtilité” est couramment implémentée, en français et dans d’autres langues. Différencier les guillemets, c’est respecter le lecteur, qui est ainsi dispensé de deviner à partir du contexte, la fonction de telle paire de guillemets. — Sur les guillemets d’ironie en français, voir http://www.ledevoir.com/societe/actualites-en-societe/488139/mises-aux-points-les-antiguillemets-comme-symboles-de-la-postverite. | |||
pour ouvrir une citation de second niveau (incluse dans une citation, nichée) en français de France, on peut utiliser le même, ou 201C “ GUILLEMET DOUBLE APOSTROPHE RETOURNÉE, ou 2039 ‹ SIMPLE GUILLEMET CROISSANT, selon les marches
pour ouvrir une citation de second niveau en français de Suisse, on utilise 2039 ‹ SIMPLE GUILLEMET CROISSANT en cas de citation nichée (incluse dans une autre citation), on préfère guillemet décroissant 00BB » simple guillemet croissant 2039 ‹ très inférieur 226A ≪ double chevron ouvrant 300A 《 | |||
00B0 | ° | SYMBOLE DEGRÉ | |
souvent utilisé à la place de 1D52 ᵒ EXPOSANT MINUSCULE LATINE O
indicateur ordinal masculin 00BA º rond haut 02DA ˚ diacritique rond en chef 030A ̊ exposant minuscule latine o 1D52 ᵒ exposant chiffre zéro 2070 ⁰ opérateur rond 2218 ∘ | |||
00B1 | ± | PLUS OU MOINS | |
moins ou plus 2213 ∓ |
00B2 | ² | EXPOSANT CHIFFRE DEUX |
exposant deux
carré, au carré lu comme un chiffre, mais non comme chiffre décimal afin d’éviter les confusions ; renvoie au chiffre décimal la plupart des chiffres arabo-occidentaux en exposant sont codés au début du bloc Exposants et indices (2070 ⁰..209F ) exposant chiffre un 00B9 ¹ <exposant> 0032 2 | ||
00B3 | ³ | EXPOSANT CHIFFRE TROIS |
exposant trois
cube, au cube exposant chiffre quatre 2074 ⁴ <exposant> 0033 3 |
00B5 | µ | SYMBOLE MICRO |
contrairement à 2126 Ω SYMBOLE OHM, le symbole micro n’a pas la lettre grecque comme forme canonique, de sorte qu’il n’est pas remplacé lors de la composition canonique
03BC μ minuscule grecque mu | ||
00B6 | ¶ | PIED-DE-MOUCHE |
fin de paragraphe
symbole paragraphe dans certains pays d’Europe pied-de-mouche réfléchi 204B ⁋ pied-de-mouche ornemental à jambage courbé 2761 ❡ capitule 2E3F ⸿ | ||
00B7 | · | POINT MÉDIAN |
point milieu, point au milieu, point central
grec : point haut (áno teleía) géorgien : virgule utilisé aussi comme séparateur décimal élevé comme symbole de multiplication en forme de point, on préfère 22C5 ⋅ OPÉRATEUR POINT point haut grec 0387 · ponctuation runique simple 16EB ᛫ puce 2022 • simple point de conduite 2024 ․ point de coupure de mot 2027 ‧ opérateur puce 2219 ∙ opérateur point 22C5 ⋅ point médian séparateur de mots 2E31 ⸱ point élevé 2E33 ⸳ point médian katakana 30FB ・ lettre latine point sinologique A78F ꞏ |
00B9 | ¹ | EXPOSANT CHIFFRE UN |
exposant un
exposant chiffre deux 00B2 ² exposant chiffre trois 00B3 ³ <exposant> 0031 1 |
00BA | º | INDICATEUR ORDINAL MASCULIN | |
castillan, galicien, italien, portugais
<exposant> 006F o | |||
00BB | » | » | GUILLEMET DÉCROISSANT |
[i] L’attribut « décroissant » est proposé pour donner à ce caractère un nom qui reste toujours vrai, quelle que soit la langue et le système d’écriture où il est utilisé. En effet, depuis que la plupart des ponctuations appariées sont réfléchies en fonction de la direction de l’écriture (bidi-mirrored dans Unicode), les attributs traditionnels « gauche » et « droit » ne sont plus valables, et on appelle ces caractères « ouvrant » ou « fermant » comme c’était proposé par Unicode (mais refusé par l’ISO/IEC), et comme c’est toujours spécifié dans le standard. Les guillemets chevrons sont en plus permutés dans certaines langues, répétés dans d’autres. Ce guillemet peut donc être nommé d’après sa ressemblance avec le symbole mathématique 003E > SUPÉRIEUR, qui a aussi le sens de « déccroissant », et qui lui aussi suit la direction de l’écriture. Voir https://fr.wikipedia.org/wiki/Discussion:Guillemet#Mise_.C3.A0_jour. | |||
français : guillemet droit
pointe vers la droite en écriture gauche-à-droite ce caractère est réflexible : il pointe vers la gauche ou la droite selon la direction de l’écriture (§04.7) ce caractère est réflexible par permutation de glyphes avec son pendant 00AB « guillemet ouvrant ou fermant selon la langue (§06.2) dans certaines langues dont le français, utilisé pour terminer une citation pour fermer une citation de second niveau (incluse dans une citation, nichée) en français de France, on peut utiliser le même, ou 201D ” GUILLEMET DOUBLE APOSTROPHE, ou 203A › SIMPLE GUILLEMET DÉCROISSANT, selon les marches pour fermer une citation de second niveau en français de Suisse, on utilise 203A › SIMPLE GUILLEMET DÉCROISSANT guillemet croissant 00AB « simple guillemet décroissant 203A › très supérieur 226B ≫ double chevron fermant 300B 》 |
La barre de fraction peut être horizontale ou oblique. — D’autres fractions précomposées sont codées dans la plage Fractions ordinaires [2150 ⅐..215F ⅟] du bloc Formes numérales (2150 ⅐..218F ). — Une barre de fraction isolée au comportement particulier est codée au point 2044 ⁄ du bloc Espaces et ponctuations générales (2000 ..206F ). |
00BC | ¼ | FRACTION ORDINAIRE UN QUART |
<fraction> 0031 2044 0034 1⁄4 | ||
00BD | ½ | FRACTION ORDINAIRE UN DEMI |
<fraction> 0031 2044 0032 1⁄2 | ||
00BE | ¾ | FRACTION ORDINAIRE TROIS QUARTS |
<fraction> 0033 2044 0034 3⁄4 |
00BF | ¿ | POINT D’INTERROGATION RETOURNÉ |
[i] En réalité il est retourné : ¿…? | ||
espagnol
point d’interrogation 003F ? point d’exclamation retourné 00A1 ¡ |
Ces plages contiennent les lettres complémentaires codées dans Latin-1. On y cherchera en vain les lettres Œ, œ et Ÿ, entrées dans la série ISO/IEC 8859 dans la partie 15 (Latin-9) ; elles sont codées aux points 0152 Œ, 0153 œ et 0178 Ÿ du bloc Latin étendu-A (0100 Ā..017F ſ). §07.1 |
00C0 | À | CAPITALE LATINE A ACCENT GRAVE |
lettre majuscule latine a accent grave
0041 0300 À | ||
00C6 | Æ | [i] Il y a une diversité de termes pour désigner cette lettre, si bien qu’on trouve aussi des discussions, par exemple http://www.languefrancaise.net/forum/viewtopic.php?id=7650. La conclusion est que le terme « e dans l’o » (et par extension, ‹ e dans l’a ›) est « devenu une expression figée et employée par le plus grand nombre », qui a « l’avantage [d’être] assez simple ». |
ae collés, ae attachés, ae liés, æ ligaturé
lettre majuscule latine æ digramme soudé majuscule latin æ ash majuscule (du vieil anglais « æsc ») danois, norvégien, islandais, féroïen, vieil anglais, français, API | ||
00C7 | Ç | CAPITALE LATINE C CÉDILLE |
0043 0327 Ç | ||
00C8 | È | CAPITALE LATINE E ACCENT GRAVE |
0045 0300 È | ||
00C9 | É | CAPITALE LATINE E ACCENT AIGU |
0045 0301 É | ||
00D0 | Ð | CAPITALE LATINE ED |
eth majuscule
islandais, féroïen, vieil anglais, API la minuscule est 00F0 ð cette capitale a le même glyphe que 0110 Đ CAPITALE LATINE D RAYÉ et 0189 Ɖ CAPITALE LATINE D AFRICAIN, mais elle doit être distinguée parce que leurs minuscules sont différentes capitale latine d rayé 0110 Đ capitale latine d africain 0189 Ɖ |
00D7 | × | CROIX DE MULTIPLICATION |
[i] | ||
notation z : produit cartésien
dans le projet ISO/IEC 8859-1, ce point de code était prévu pour la CAPITALE LATINE E DANS L’O minuscule latine x 0078 x capitale latine e dans l’o 0152 Œ croix de multiplication invisible 2062 croix saint andré 2613 ☓ grande croix de multiplication 2715 ✕ croix de multiplication épaisse 2716 ✖ croix grasse 274C ❌ croix de multiplication à première moitié pleine 29D4 ⧔ croix de multiplication à seconde moitié pleine 29D5 ⧕ produit vectoriel 2A2F ⨯ croix de multiplication doublement cerclée 2A37 ⨷ x d’annulation 1F5D9 🗙 croix saint andré au trait mince 1F7A8 🞨 |
00DE | Þ | CAPITALE LATINE THORN |
islandais, vieil anglais, phonétique
rune empruntée par l’écriture latine |
00DF | ß | MINUSCULE LATINE ESZETT |
lettre minuscule latine eszett
lettre minuscule latine s dur fricative alvéolaire sourde phonétiquement pas de « s dur » allemand la capitale est deux fois 0053 S CAPITALE LATINE S, mais elle est restée 0053 S CAPITALE LATINE S 005A Z CAPITALE LATINE Z dans certains noms propres la capitale alternative officielle est 1E9E ẞ CAPITALE LATINE ESZETT à l’origine une ligature de 017F ſ MINUSCULE LATINE S LONG et 007A z MINUSCULE LATINE Z (dont le glyphe ressemblait à celui de 0292 ʒ MINUSCULE LATINE EJ) la ligature typographique de 017F ſ MINUSCULE LATINE S LONG et 0073 s MINUSCULE LATINE S n’est pas ce caractère, elle lui ressemble seulement minuscule latine s 0073 s minuscule latine z 007A z minuscule latine s long 017F ſ minuscule latine ej 0292 ʒ minuscule grecque bêta 03B2 β capitale latine eszett 1E9E ẞ | ||
00E0 | à | MINUSCULE LATINE A ACCENT GRAVE |
lettre minuscule latine a accent grave
0061 0300 à | ||
00E1 | á | MINUSCULE LATINE A ACCENT AIGU |
0061 0301 á | ||
00E5 | å | MINUSCULE LATINE A ROND EN CHEF |
0061 030A å | ||
00E6 | æ | MINUSCULE LATINE E DANS L’A |
[i] Il y a une diversité de termes pour désigner cette lettre, si bien qu’on trouve aussi des discussions, par exemple http://www.languefrancaise.net/forum/viewtopic.php?id=7650. La conclusion est que le terme « e dans l’o » (et par extension, ‹ e dans l’a ›) est « devenu une expression figée et employée par le plus grand nombre », qui a « l’avantage [d’être] assez simple ». | ||
ae collés, ae attachés, ae liés, æ ligaturé
lettre minuscule latine æ digramme soudé minuscule latin æ ash minuscule (du vieil anglais æsc) danois, norvégien, islandais, féroïen, vieil anglais, français, API minuscule latine e dans l’o 0153 œ minuscule cyrillique ié dans l’a 04D5 ӕ | ||
00E7 | ç | MINUSCULE LATINE C CÉDILLE |
0063 0327 ç | ||
00E8 | è | MINUSCULE LATINE E ACCENT GRAVE |
0065 0300 è | ||
00E9 | é | MINUSCULE LATINE E ACCENT AIGU |
0065 0301 é | ||
00EA | ê | MINUSCULE LATINE E ACCENT CIRCONFLEXE |
0065 0302 ê | ||
00EB | ë | MINUSCULE LATINE E TRÉMA |
0065 0308 ë | ||
00F0 | ð | MINUSCULE LATINE ED |
eth minuscule
la capitale est 00D0 Ð minuscule grecque delta 03B4 δ dérivée partielle 2202 ∂ minuscule latine d insulaire A77A ꝺ | ||
00F2 | ò | MINUSCULE LATINE O ACCENT GRAVE |
006F 0300 ò | ||
00F5 | õ | MINUSCULE LATINE O TILDÉ |
006F 0303 õ |
00F7 | ÷ | OBÉLUS |
symbole de division
[i] « désambigüisation » selon l’orthographe rectifiée de 1990, conformément à la règle de placer le tréma sur la seconde lettre prononcée distinctement. https://fr.wiktionary.org/wiki/désambiguïser. | ||
usage historique comme ponctuation signalant les passages douteux dans les manuscrits
dans le projet ISO/IEC 8859-1, ce point de code était prévu pour la MINUSCULE LATINE E DANS L’O obèle syriaque héracléen 070B ܋ minuscule latine e dans l’o 0153 œ obèle 2020 † signe moins commercial 2052 ⁒ signe moins 2212 − opérateur oblique 2215 ∕ est un diviseur 2223 ∣ rapport 2236 ∶ obélus épais 2797 ➗ |
00F8 | ø | MINUSCULE LATINE O BARRÉ |
o coticé, o barre oblique, o avec trait oblique
diamètre 2300 ⌀ | ||
00F9 | ù | MINUSCULE LATINE U ACCENT GRAVE |
0075 0300 ù | ||
00FE | þ | MINUSCULE LATINE THORN |
islandais, vieil anglais, phonétique
lettre latine empruntée à l'écriture runique lettre runique thurisaz thorn thurs th 16A6 ᚦ |
Ces lettres ont été codées sous forme précomposée pour la rétrocompatibilité avec d’autres codages préexistants. Des renvois aux autres blocs latins sont réunis au début du bloc Latin étendu-B (0180 ƀ..024F ɏ). §07.1 |
0101 | ā | MINUSCULE LATINE A MACRON |
lettre minuscule latine a macron
[i] On évite de terminer les énumérations par « etc. », qui signifie « et le reste » et n’est donc pas du tout respectueux, chose dont on ne se rend pas compte quand on en a pris l’habitude. On laisse donc les points de suspension mais en prenant bien soin de les faire précéder d’une virgule et d’une espace (fine) insécable… et bien sûr de ne pas les remplacer par leur avatar ASCII tel qu’il figure encore dans le fichier d’origine. | ||
0061 0304 ā | ||
0115 | ĕ | MINUSCULE LATINE E BRÈVE |
malais, latin, …
0065 0306 ĕ | ||
0132 | IJ | [i] La longueur ne se rapporte pas à la prononciation, mais à la graphie caractérisée par la descendante du j, par opposition à « ei » ; voir https://nl.wikipedia.org/wiki/IJ_(digraaf)#Status. Cette lettre est indispensable en néerlandais pour un fonctionnement impeccable de la représentation numérique des textes. Son absence est essentiellement due aux dispositions de clavier défectueuses, liées à leur tour aux jeux de caractères incomplets des débuts de l’informatique, puis à un manque de volonté des normalisateurs préférant de multiples palliatifs à une solution nette, et aussi au fait que contrairement aux dysfonctionnements d’« oe » à la place de l’e dans l’o, ceux d’« ij » à la place de l’ij long apparaissent seulement dans certains contextes (polices, transformations du texte). |
[i] Unicode l’appelait LETTRE parce que cela correspond davantage à la réalité : Le néerlandais compte l’ij long comme une lettre, classée entre x et y. Afin d’éviter toute confusion, il a fallu rétablir LETTRE ici, jusqu’à la suppression de toutes les occurrences de LETTRE là où ce terme était accompagné de l’attribut MINUSCULE ou CAPITALE. | ||
digramme soudé majuscule latin ij
0049 004A IJ | ||
0133 | ij | MINUSCULE LATINE IJ LONG |
lettre minuscule latine ij
digramme soudé minuscule latin ij néerlandais (comptée comme une lettre de l’alphabet et présente sur les machines à écrire) la soudure de cette lettre-digramme n’apparaît pas dans toutes les polices avec accent aigu, utiliser la suite 0133 0301 ij́ DIACRITIQUE ACCENT AIGU ; les polices conformes affichent un accent aigu sur l’i et un deuxième accent aigu sur le j 0069 006A ij | ||
0138 | ĸ | MINUSCULE LATINE KRA |
groenlandais (ancienne orthographe) | ||
013F | Ŀ | CAPITALE LATINE L POINT MÉDIAN |
certaines polices affichent le point médian à l’intérieur de la lettre, mais on préfère la forme avec le point qui suit la lettre
004C 00B7 L· | ||
0140 | ŀ | MINUSCULE LATINE L POINT MÉDIAN |
014A | Ŋ | CAPITALE LATINE ENG |
le glyphe peut aussi ressembler à une grande minuscule, seul glyphe correct en bambara | ||
014B | ŋ | MINUSCULE LATINE ENG |
engma, angma
same, bambara, mendé, API, … | ||
0152 | Œ | [i] Il y a une diversité de termes pour désigner cette lettre, si bien qu’on trouve aussi des discussions, par exemple http://www.languefrancaise.net/forum/viewtopic.php?id=7650. La conclusion est que le terme « e dans l’o » est « devenu une expression figée et employée par le plus grand nombre », qui a « l’avantage [d’être] assez simple ». En français courant (https://fr.wikipedia.org/wiki/Œ), cette lettre s’appelle donc bien « e dans l’o ». D’un point de vue purement technique, l’essentiel est d’honorer le principe que les lettres comme Æ, IJ, Œ ne doivent pas porter dans leur nom le terme générique de « LIGATURE », parce que cela crée de la confusion. Dans Unicode, une ligature est une ligature typographique, dont Unicode contient un certain nombre pour la rétrocompatibilité. La présence du terme « LIGATURE » dans les noms anglais de l’e dans l’o (et de l’ij long 0132 IJ et 0133 ij) n’est due qu’à la prépondérance de forces négatives au sein de l’ISO/IEC lors de la fusion entre Unicode et ISO/IEC 10646. L’ancienne traduction française a le mérite de prendre son indépendance en évitant le terme de LIGATURE pour préférer DIGRAMME SOUDÉ, quitte à ne pas oser opter pour le LETTRE d’origine de peur de froisser certains esprits, sauf à le reprendre pour l’e dans l’a (00C6 Æ et 00E6 æ, où il a été réintroduit à la demande du Danemark). Mais puisque cette liste a toujours été en pratique une bibliothèque d’interface utilisateur, il faut remplacer les termes techniques peu usités qui prêtent à confusion, par des termes familiers aux utilisateurs. |
[i] Ce symbole a été mis à la place de la majuscule de l’e dans l’o quand un groupe de travail définissait le jeu de caractères dit « Latin-1 » (ISO/IEC 8859-1 ; http://cahiers.gutenberg.eu.org/cg-bin/article/CG_1996___25_65_0.pdf). | ||
0153 | œ | MINUSCULE LATINE E DANS L’O |
oe entrelacés
oe collés, oe attachés, oe liés, œ ligaturé [i] Ce n’est pas une ligature typographique, mais une ligature orthographique. L’Œ est la seule lettre d’entre Æ, IJ et Œ à ne pas être officiellement comptée comme une lettre. L’Æ est une lettre en danois, classée après Z, et l’IJ est une lettre en néerlandais, classée après X. Il vaut mieux éviter le mot « ligature » en parlant de ces lettres, car cela prête à confusion avec les ligatures typographiques de rétrocompatibilité codées dans la plage Ligatures latines [FB00 ff..FB06 st] du bloc Formes de présentation alphabétiques (FB00 ff..FB4F ﭏ) ; voir http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&id=UnicodeNames#_ftnref_3. Dans Unicode, le terme de « ligature » est préempté par les ligatures typographiques. Si dans Unicode, on fait un cas particulier pour l’Œ, on ne s’en sort pas, donc il vaut mieux que l’Œ soit compté comme une lettre. D’ailleurs si cela avait été fait d’emblée au niveau de l’Académie française, les ingénieurs-concepteurs des imprimantes d’ordinateur jusque dans les années 1980 n’auraient probablement pas omis ces caractères dans la mémoire ROM des appareils, et un constructeur français n’aurait pas briefé un de ses collaborateurs pour dire au groupe de travail d’ISO/IEC 8859-1 (Latin-1) qu’on n’a pas besoin de la ligature oe (http://cahiers.gutenberg.eu.org/cg-bin/article/CG_1996___25_65_0.pdf). | ||
ethel (du vieil anglais « eðel »)
français, API, ancien islandais, vieil anglais, … minuscule latine e dans l’a 00E6 æ [i] C’est ce symbole qui a pris la place de la minuscule de l’e dans l’o, arbitrairement exclu de Latin-1. | ||
minuscule latine ij long 0133 ij
petite capitale latine e dans l’o 0276 ɶ | ||
0171 | ű | MINUSCULE LATINE U DOUBLE ACCENT AIGU |
hongrois
0075 030B ű | ||
017F | ſ | MINUSCULE LATINE S LONG |
fréquemment utilisée avec les caractères romains et italiques jusqu’au XVIIIᵉ siècle
utilisée aujourd’hui avec les caractères gothiques et gaéliques 0073 s minuscule latine s |
D’autres caractères latins sont codés dans les blocs Latin étendu complémentaire (1E00 Ḁ..1EFF ỿ), Latin étendu-C (2C60 Ⱡ..2C7F Ɀ), Latin étendu-D (A720 ꜠..A7FF ꟿ), Latin étendu-E (AB30 ꬰ..AB6F ), Alphabet phonétique international (0250 ɐ..02AF ʯ), et dans la plage Ligatures latines [FB00 ff..FB06 st] du bloc Formes de présentation alphabétiques (FB00 ff..FB4F ﭏ). Voir aussi dans le bloc Lettres et chiffres mathématiques (1D400 𝐀..1D7FF 𝟿). §07.1 |
0186 | Ɔ | CAPITALE LATINE O OUVERT |
typographiquement un C retourné
africain la minuscule est 0254 ɔ chiffre romain cent réfléchi 2183 Ↄ | ||
018E | Ǝ | CAPITALE LATINE E RETOURNÉ |
[i] Dans Unicode, cette lettre est appelée « E RÉFLÉCHI » tout en étant la majuscule de l’e retourné pannigérian. En conséquence, les fontes informatiques le présentent comme tel. Mais en typographie traditionnelle, il était certainement retourné, tout comme l’o ouvert est un c retourné, non un c réfléchi. Pour pallier ce désordre, on peut appeler la capitale E RETOURNÉ pour la cohérence avec la minuscule, mais préciser qu’en typographie informatique, on rencontre l’E réfléchi. | ||
alphabet pannigérian
la minuscule est 01DD ǝ minuscule latine e retourné 01DD ǝ minuscule latine e réfléchi 0258 ɘ | ||
018F | Ə | CAPITALE LATINE SCHWA |
lettre majuscule latine chva
azéri, … la minuscule est 0259 ə parfois pris pour une variante, 018E Ǝ CAPITALE LATINE E RETOURNÉ est la capitale de 01DD ǝ MINUSCULE LATINE E RETOURNÉ capitale cyrillique schwa 04D8 Ә | ||
0190 | Ɛ | CAPITALE LATINE EPSILON |
e ouvert
langues d’Afrique la minuscule est 025B ɛ le nom en « epsilon » est préféré symbole constante d’euler 2107 ℇ chiffre trois retourné 218B ↋ | ||
0192 | ƒ | MINUSCULE LATINE F HAMEÇON |
f cursif
symbole monétaire du florin (monnaie historique des Pays-Bas) symbole fonction anglais : abréviation de folder (dossier) | ||
0196 | Ɩ | CAPITALE LATINE IOTA |
langues d’Afrique
la minuscule est 0269 ɩ | ||
019D | Ɲ | CAPITALE LATINE N HAMEÇON |
langues d’Afrique
la minuscule est 0272 ɲ | ||
019E | ƞ | [i] Parler de « long jambage de droite » est inexact à plus d’un titre, aussi la traduction officielle a-t-elle introduit cette amélioration. Le « jambage » est la partie qui dépasse en-dessous de la ligne de base, ou au-dessus de la hauteur de x, tandis que « fût » se dit de toute partie verticale (ou même oblique), y compris sur les minuscules. Voir http://caracteres.typographie.org/description/anatomie.html et https://www.youtube.com/watch?v=u8m6x1KJPcs. Lettre mentionnée dans https://www.researchgate.net/publication/228984731_Unicode_et_typographie_Un_amour_impossible page 126 (127 du PDF). |
indique la nasalisation d’une voyelle en teton (sioux lakota)
la représentation recommandée du « n » syllabique est : 006E n MINUSCULE LATINE N 0329 ̩ DIACRITIQUE LIGNE VERTICALE SOUSCRITE symbole désuet du signe japonais 3093 ん SYLLABE HIRAGANA N la capitale est 0220 Ƞ minuscule latine n 006E n diacritique ligne verticale souscrite 0329 ̩ syllabe hiragana n 3093 ん | ||
01A1 | ơ | MINUSCULE LATINE O CORNU |
vietnamien
006F 031B ơ | ||
01B1 | Ʊ | CAPITALE LATINE UPSILON |
langues d’Afrique
typographiquement dérivée d’une capitale oméga retourné la minuscule est 028A ʊ symbole ohm retourné 2127 ℧ | ||
01B2 | Ʋ | CAPITALE LATINE V DE RONDE |
[i] Cette lettre n’est ni cursive (car non assortie avec l’alphabet mathématique cursif), ni avec crosse (car il existe un v minuscule avec une vraie crosse, qui n’a pas de majuscule : 2C71 ⱱ). On est donc face à une forme particulière, d’où l’emploi de l’attribut « de ronde », qui ne sert que pour les lettres particulières. Dans tous les cas, on veillera à ce que la minuscule et la majuscule soient nommées sur le même modèle, afin d’éviter toute confusion. D’où le renommage de cette lettre. | ||
langues d’Afrique
la minuscule est 028B ʋ | ||
01B7 | Ʒ | CAPITALE LATINE EJ |
langues d’Afrique, same skolt
la minuscule est 0292 ʒ capitale latine yogh 021C Ȝ capitale cyrillique dzé abkhaze 04E0 Ӡ |
01DD | ǝ | [i] Sur « RETOURNÉ », voir l’explication à 018D ƍ. |
[i] Cette minuscule pannigériane a le même glyphe que 0259 ə MINUSCULE LATINE SCHWA, car à l’origine c’est un schwa, mais elle doit être distinguée parce que leurs capitales sont différentes. | ||
le schwa non-pannigérian est 0259 ə
la capitale est 018E Ǝ minuscule latine schwa 0259 ə minuscule latine e réfléchi 0258 ɘ | ||
01EB | ǫ | MINUSCULE LATINE O OGONEK |
same, iroquoien, ancien islandais
006F 0328 ǫ |
0219 | ș | MINUSCULE LATINE S VIRGULE SOUSCRITE |
[i] Le roumain, le letton et le live utilisent la virgule souscrite où le turc et le marshallais utilisent la cédille (sans l’exiger quant au marshallais, qui s’écrit aussi avec point souscrit à la place : https://unicode.org/mail-arch/unicode-ml/y2013-m07/0013.html). Ces deux diacritiques sont très proches et se confondent même dans certaines polices. Maintenant, dans Unicode, pour le roumain, l’s et le t avec virgule souscrite sont désambigüisés des mêmes avec cédille, mais il existe des masses de textes codés sur l’ancien modèle hérité de Latin-2 (ISO/IEC 8859-2), où 015F ş MINUSCULE LATINE S CÉDILLE représente l’s virgule souscrite en roumain. L’s et le t avec virgule souscrite (plutôt qu’avec la cédille générique, qui peut aussi prendre la forme d’une virgule) ont été ajoutés dans Unicode en 1999 (version 3.0) à la demande de l’agence roumaine de normalisation, qui avait proscrit l’année précédente la cédille en roumain, finalement sans grand succès malgré le soutien de l’Académie (2003) et du législateur (2006), car la disposition de clavier qui corespond ne fut introduite qu’en 2012 (https://en.wikipedia.org/wiki/Romanian_keyboard_layout). Voir https://unicode.org/L2/L2013/13155r-cedilla-comma.pdf. | ||
minuscule latine s cédille 015F ş
0073 0326 ș |
021C | Ȝ | CAPITALE LATINE YOGH |
capitale latine ej 01B7 Ʒ | ||
021D | ȝ | MINUSCULE LATINE YOGH |
moyen anglais, écossais
transcription de l’arabe minuscule latine ej 0292 ʒ minuscule latine g insulaire 1D79 ᵹ symbole once 2125 ℥ | ||
021F | ȟ | MINUSCULE LATINE H HATCHEK |
romani finlandais
0068 030C ȟ | ||
0220 | Ƞ | CAPITALE LATINE N LONG FÛT À DROITE |
Teton (Sioux Lakota)
la minuscule est 019E ƞ | ||
0229 | ȩ | MINUSCULE LATINE E CÉDILLE |
0065 0327 ȩ |
0241 | Ɂ | CAPITALE LATINE COUP DE GLOTTE |
0242 | ɂ | MINUSCULE LATINE COUP DE GLOTTE |
lettre bicamérale utilisée en tchipéwayan, flanc-de-chien, esclave (systèmes d’écriture autochtones canadiens)
lettre latine coup de glotte 0294 ʔ exposant lettre latine coup de glotte 02C0 ˀ | ||
0245 | Ʌ | [i] Sur « RETOURNÉ », voir l’explication à 018D ƍ. |
la minuscule est 028C ʌ | ||
024D | ɍ | MINUSCULE LATINE R RAYÉ |
r avec trait horizontal |
Pour diversifier son alphabet, l’API utilise d’une part la diacritation, en particulier : « BARRÉ » = avec trait oblique ; « RAYÉ » = avec trait horizontal ; et d’autre part les transformations géométriques du plan, dont les principaux attributs sont : « INVERSÉ » = réflexion par rapport à un axe horizontal ; « RÉFLÉCHI » = réflexion par rapport à un axe vertical ; « RETOURNÉ » = rotation de 180° ; « PIVOTÉ » = rotation de 90° : en sens horaire = « PIVOTÉ À DROITE » ; en sens antihoraire (dans la plupart des cas) = « PIVOTÉ À GAUCHE ». — D’autres lettres de l’API sont codées dans les blocs Lettres modificatives (02B0 ʰ..02FF ˿) et Extensions phonétiques complémentaires (1D80 ᶀ..1DBF ᶿ). |
Plusieurs lettres de l’API sont entrées dans l’orthographe de nombreuses langues, dont quelques-unes sont citées en exemples dans les annotations. L’API inclut les lettres latines de base, ainsi que des lettres latines et des lettres grecques codées dans les blocs Latin-1 complémentaire (0080 ..00FF ÿ), Latin étendu-A (0100 Ā..017F ſ), ou Grec et copte (0370 Ͱ..03FF Ͽ). §07.1 |
0254 | ɔ | MINUSCULE LATINE O OUVERT |
voyelle mi-basse postérieure arrondie
langues d’Afrique en vieux danois, « ɔ: » signifie « c’est-à-dire » typographiquement un c retourné la capitale est 0186 Ɔ | ||
0259 | ə | MINUSCULE LATINE SCHWA |
lettre minuscule latine chva
voyelle mi-haute centrale étirée azéri, … cette minuscule a le même glyphe que 01DD ǝ MINUSCULE LATINE E RETOURNÉ, mais elle doit être distinguée parce que leurs capitales sont différentes la capitale est 018F Ə minuscule latine e retourné 01DD ǝ minuscule cyrillique schwa 04D9 ә | ||
025B | ɛ | MINUSCULE LATINE EPSILON |
e ouvert
voyelle mi-basse antérieure étirée langues d’Afrique la capitale est 0190 Ɛ le nom en « epsilon » est préféré minuscule grecque epsilon 03B5 ε | ||
0269 | ɩ | MINUSCULE LATINE IOTA |
voyelle haute relâchée antérieure étirée | ||
026A | ɪ | PETITE CAPITALE LATINE I |
voyelle haute relâchée antérieure étirée
l’API recommande d’utiliser cette lettre plutôt que 0269 ɩ MINUSCULE LATINE IOTA [i] Avant le codage de la capitale de cette lettre pour la version 10.0 d’Unicode, c’était 0197 Ɨ CAPITALE LATINE I RAYÉ qui servait de capitale. | ||
pour l’univocité, on utilise un glyphe à empattement dans toutes les polices
capitale latine i rayé 0197 Ɨ | ||
0272 | ɲ | MINUSCULE LATINE N HAMEÇON |
nasale palatale sonore
français et italien : « gn » castillan : « ñ » la capitale est 019D Ɲ | ||
027C | ɼ | MINUSCULE LATINE R LONG FÛT |
vibrante fricative apico-alvéolaire | ||
027E | ɾ | MINUSCULE LATINE R SANS OBIT |
r en hameçon
vibrante battue alvéolaire sonore typographiquement un r sans empattement de tête | ||
028A | ʊ | MINUSCULE LATINE UPSILON |
voyelle semi-haute postérieure arrondie
variante de 0277 ɷ MINUSCULE LATINE OMÉGA FERMÉ, recommandée par l’API en anglais du Sud, le « oo » dans « book » la capitale est 01B1 Ʊ minuscule grecque upsilon 03C5 υ | ||
028B | ʋ | [i] Cette lettre n’est ni cursive (car non assortie avec l’alphabet mathématique cursif), ni avec crosse (car il existe un v minuscule avec une vraie crosse, qui n’a pas de capitale : 2C71 ⱱ). C’est donc un cas isolé, d’où l’emploi de l’attribut « de ronde », qui ne sert que pour les lettres particulières, mais alors pour la minuscule ET la capitale. Dans tous les cas, les noms des paires capitale-minuscule ne doivent se distinguer que par « capitale/minuscule ». Une norme où la capitale est avec « crosse » et la minuscule est « de ronde » est une mauvaise norme, faite au détriment de la valeur d’usage et au mépris des utilisateurs. |
approximante labiodentale sonore
la capitale est 01B2 Ʋ minuscule grecque upsilon 03C5 υ exposant minuscule latine v de ronde 1DB9 ᶹ | ||
028C | ʌ | MINUSCULE LATINE V RETOURNÉ |
chevron
voyelle mi-basse postérieure étirée la capitale est 0245 Ʌ capitale grecque lambda 039B Λ chevron d’insertion 2038 ‸ et logique 2227 ∧ | ||
0292 | ʒ | MINUSCULE LATINE EJ |
gros
fricative postalvéolaire sonore same skolt la capitale est 01B7 Ʒ minuscule latine yogh 021D ȝ minuscule cyrillique dzé abkhaze 04E1 ӡ symbole once 2125 ℥ symbole alchimique du demi-gros 1F772 🝲 | ||
0294 | ʔ | LETTRE LATINE COUP DE GLOTTE |
lettre unicamérale
utilisée en API, dans d’autres notations phonétiques et systèmes d’écriture qui utilisent un coup de glotte unicaméral capitale latine coup de glotte 0241 Ɂ exposant lettre latine coup de glotte 02C0 ˀ |
Ces caractères présentent l’attribut « exposant » en texte brut, pour les systèmes de notation, au prix de limitations pratiques en matière de polices et de style. Les noms en « lettre modificative », selon un terme technique de phonétique, expriment cette réserve. §07.8 et §22.4 |
02B0 | ʰ | [i] Il n’existe aucune raison intrinsèque pour ne pas désigner cette lettre par le terme EXPOSANT, mais par un terme technique tiré de la phonétique : « lettre modificative ». En effet, les lettres en indice ont des noms commençant par INDICE, et les deux lettres héritées ci-dessus ont des noms commençant par EXPOSANT. La raison du malnommage de tous ces caractères est extrinsèque, c’est certain bien que l’on ne puisse évidemment jamais en avoir la confirmation. Le standard déconseille explicitement de se servir de ces lettres pour écrire couramment des langues naturelles (par opposition aux systèmes de notation phonétique), les caractères sont nommées de manière à les déguiser aux yeux de l’utilisateur final, et de nombreuses polices grand-public sont non conformes à Unicode en ce qu’elles contiennent pour les lettres en exposant, des glyphes (œils) disparates, non coordonnés, prétextant quelque usage particulier alors que strictement toutes ces lettres – y compris l’ⁱ et l’ⁿ nommés « exposant » – servent en phonétique en tant que lettres modificatives. Voir https://unicode.org/versions/Unicode9.0.0/ch07.pdf#G24762 et https://unicode.org/versions/Unicode9.0.0/ch22.pdf#G42931. |
lettre modificative minuscule h
aspiré <exposant> 0068 h | ||
02B2 | ʲ | EXPOSANT MINUSCULE LATINE J |
lettre modificative minuscule j
palatalisé diacritique hameçon palatal souscrit 0321 ̡ <exposant> 006A j | ||
02B3 | ʳ | EXPOSANT MINUSCULE LATINE R |
lettre modificative minuscule r
<exposant> 0072 r | ||
02B7 | ʷ | EXPOSANT MINUSCULE LATINE W |
lettre modificative minuscule w
labialisé diacritique oméga souscrit 032B ̫ <exposant> 0077 w | ||
02B8 | ʸ | EXPOSANT MINUSCULE LATINE Y |
lettre modificative minuscule y
palatalisé sert en linguistique américaniste à la place de 02B2 ʲ EXPOSANT MINUSCULE LATINE J <exposant> 0079 y |
02BB | ʻ | [i] Par rapport au nom dans la version française héritée, « LETTRE MODIFICATIVE VIRGULE CULBUTÉE », il y a trois remarques à faire : ① Ce n’est pas toujours une « lettre modificative », terme de phonétique utilisé dans Unicode comme synonyme d’« exposant » afin de dissuader les utilisateurs d’écrire les abréviations en exposant en texte brut, car cela reviendrait à “contourner” les fonctionnalités de mise en exposant des logiciels de traitement de texte et de PAO, tandis qu’en réalité, un principe de base d’Unicode est de permettre de coder toute écriture en texte brut de manière compréhensible (ce qui en français et dans d’autres langues nécessite des minuscules en exposant) ; cela est réalisé pour les textes latins médiévaux. ② La mise à l’écart de ce synonyme d’« exposant » qu’est « lettre modificative » dans Unicode conduit à parler non plus de « virgule en exposant », mais d’apostrophe, grâce au fait que le terme d’apostrophe reprend son vrai sens d’une « virgule élevée » depuis que le trait vertical élevé qui fait partie de l’ASCII (x27 ; 0027 ' dans Unicode) est nommé plus proprement SIMPLE GUILLEMET GÉNÉRIQUE et non plus « APOSTROPHE ». ③ « Culbuté » se dit plus proprement « retourné », pour les raisons détaillées dans la note de 018D ƍ. |
sert en hawaïen à écrire le ʻokina (coup de glotte)
parfois interchangeable avec 02BD ʽ LETTRE APOSTROPHE RÉFLÉCHIE et avec 02BF ʿ LETTRE DEMI-ROND GAUCHE diacritique apostrophe retournée 0312 ̒ apostrophe n’ko de ton bas 07F5 ߵ guillemet simple apostrophe retournée 2018 ‘ | ||
02BC | ʼ | [i] Par rapport au nom dans la version française héritée, « LETTRE MODIFICATIVE APOSTROPHE », il faut savoir que n’est pas toujours une « lettre modificative », terme de phonétique utilisé dans Unicode comme synonyme d’« exposant » afin de dissuader les utilisateurs d’écrire les abréviations en exposant en texte brut, car cela reviendrait à “contourner” les fonctionnalités de mise en exposant des logiciels de traitement de texte et de PAO, tandis qu’en réalité, un principe de base d’Unicode est de permettre de coder toute écriture en texte brut de manière compréhensible (ce qui en français et dans d’autres langues nécessite des minuscules en exposant). Il ne convient donc pas de traduire mot à mot MODIFIER LETTER APOSTROPHE, attendu que ce nom partage un biais non conforme au standard et que l’attribut « modifier » est inutile pour l’univocité. — Contrairement à la ponctuation 2019 ’ GUILLEMET SIMPLE APOSTROPHE, la LETTRE APOSTROPHE ne porte pas l’attribut SIMPLE dans son nom, parce que la LETTRE DOUBLE APOSTROPHE est unique et globalement très rare, contrairement au GUILLEMET DOUBLE APOSTROPHE, et qu’il est nécessaire de pouvoir disposer d’un terme générique pour les « guillemets apostrophes », pouvant englober les doubles et les simples, tout comme « guillemets chevrons » englobe les doubles et les simples. Cette rigueur terminologique est nécessaire pour que l’usage des guillemets simples chevrons puisse se répandre en France. |
apostrophe
coup de glotte, glottalisation, éjectif [i] | ||
dans un courant de l’orthographe anglaise, c’est le caractère préféré comme apostrophe
dans d’autres langues, le caractère préféré comme apostrophe est 2019 ’ GUILLEMET SIMPLE APOSTROPHE Unicode avait abandonné l’idée de coder la ponctuation apostrophe à part, anticipant que l’utilisateur ne serait pas prêt à bien la distinguer de la ponctuation guillemet simple 2019 ’ Unicode recommandait d’utiliser la lettre apostrophe 02BC ʼ comme apostrophe, permettant à l’ordinateur de toujours distinguer entre apostrophe et guillemet simple [i] Cette décision, ou plutôt la confusion actuelle, a été vivement critiquée par Ted Clancy (Mozilla), dans un billet de blog intitulé « Which Unicode character should represent the English apostrophe? (And why the Unicode committee is very wrong.) » https://tedclancy.wordpress.com/2015/06/03/which-unicode-character-should-represent-the-english-apostrophe-and-why-the-unicode-committee-is-very-wrong/. | ||
[i] Contrairement au français, où l’apostrophe marque l’élision de fins de mot, en anglais l’apostrophe se trouve souvent à l’intérieur des mots et participe donc de l’orthographe. Lire http://chronicle.com/blogs/linguafranca/2013/03/22/being-an-apostrophe/. | ||
[i] C’est l’un des défauts du standard Unicode, expliqué dans http://www.cairn.info/article.php?ID_REVUE=DN&ID_NUMPUBLIE=DN_063&ID_ARTICLE=DN_063_0089&FRM=B#pa26. | ||
simple guillemet générique 0027 '
lettre double apostrophe 02EE ˮ diacritique apostrophe 0313 ̓ diacritique apostrophe à droite 0315 ̕ apostrophe arménienne 055A ՚ apostrophe n’ko de ton haut 07F4 ߴ guillemet simple apostrophe 2019 ’ |
02E1 | ˡ | EXPOSANT MINUSCULE LATINE L |
lettre modificative l minuscule
<exposant> 006C l | ||
02E2 | ˢ | EXPOSANT MINUSCULE LATINE S |
lettre modificative s minuscule
<exposant> 0073 s | ||
02E3 | ˣ | EXPOSANT MINUSCULE LATINE X |
lettre modificative x minuscule
<exposant> 0078 x |
Les rapports de casse entre les lettres grecques et coptes sont complexes, de sorte que la lecture des tables ne permet pas toujours de les déduire. — D’autres caractères coptes sont codés dans le bloc Copte (2C80 Ⲁ..2CFF ⳿). D’autres caractères grecs sont codés dans les blocs Grec étendu (1F00 ἀ..1FFF ), Nombres grecs anciens (10140 𐅀..1018F ), et Diacritiques (0300 ̀..036F ͯ). Voir aussi dans le bloc Lettres et chiffres mathématiques (1D400 𝐀..1D7FF 𝟿). §07.2 et §07.3 |
0398 | Θ | CAPITALE GRECQUE THÊTA |
03B3 | γ | MINUSCULE GRECQUE GAMMA |
minuscule latine gamma 0263 ɣ
minuscule gamma ajouré 213D ℽ | ||
03B8 | θ | MINUSCULE GRECQUE THÊTA |
minuscule latine o rayé 0275 ɵ
minuscule cyrillique fita 0473 ѳ |
D’autres caractères cyrilliques sont codés dans le bloc suivant ainsi que dans les blocs Cyrillique étendu-A (2DE0 ⷠ..2DFF ⷿ), Cyrillique étendu-B (A640 Ꙁ..A69F ꚟ), et Cyrillique étendu-C (1C80 ᲀ..1C8F ). §07.4 |
0436 | ж | MINUSCULE CYRILLIQUE JÉ |
D’autres caractères hébreux sont codés dans la plage Formes de présentation hébraïques [FB1D יִ..FB4F ﭏ] du bloc Formes de présentation alphabétiques (FB00 ff..FB4F ﭏ). §09.1 |
Tirées d’ISO 8859-8. |
05D0 | א | LETTRE HÉBRAÏQUE ALEF |
aleph
lettre mathématique alef 2135 ℵ |
D’autres caractères arabes sont codés dans les blocs Arabe étendu (0750 ݐ..077F ݿ), Arabe étendu-A (08A0 ࢠ..08FF ࣿ), Formes de présentation arabes-A (FB50 ﭐ..FDFF ﷿) et Formes de présentation arabes-B (FE70 ﹰ..FEFF ). §09.2 |
Tirées d’ISO 8859-6. |
0642 | ق | LETTRE ARABE QAF |
Ce bloc regroupe des caractères non API, pour la plupart issus de l’Alphabet phonétique ouralien (APO). Les petites capitales et les formes en exposant ou en indice codées dans ce bloc sont destinées aux textes phonétiques dans lesquels ces variantes de style sont sémantiquement importantes. Pour les autres textes, on peut utiliser des lettres latines, grecques ou cyrilliques habituelles avec une mise en forme. §07.1 |
D’autres lettres latines en exposant sont codées dans le bloc Lettres modificatives (02B0 ʰ..02FF ˿). |
1D43 | ᵃ | EXPOSANT MINUSCULE LATINE A |
lettre modificative minuscule a
<exposant> 0061 a | ||
1D47 | ᵇ | EXPOSANT MINUSCULE LATINE B |
lettre modificative minuscule b
<exposant> 0062 b | ||
1D48 | ᵈ | EXPOSANT MINUSCULE LATINE D |
lettre modificative minuscule d
<exposant> 0064 d | ||
1D49 | ᵉ | EXPOSANT MINUSCULE LATINE E |
lettre modificative minuscule e
<exposant> 0065 e | ||
1D4D | ᵍ | EXPOSANT MINUSCULE LATINE G |
lettre modificative minuscule g
<exposant> 0067 g | ||
1D4F | ᵏ | EXPOSANT MINUSCULE LATINE K |
lettre modificative minuscule k
<exposant> 006B k | ||
1D50 | ᵐ | EXPOSANT MINUSCULE LATINE M |
lettre modificative minuscule m
<exposant> 006D m | ||
1D52 | ᵒ | EXPOSANT MINUSCULE LATINE O |
lettre modificative minuscule o
<exposant> 006F o | ||
1D56 | ᵖ | EXPOSANT MINUSCULE LATINE P |
lettre modificative minuscule p
<exposant> 0070 p | ||
1D57 | ᵗ | EXPOSANT MINUSCULE LATINE T |
lettre modificative minuscule t
<exposant> 0074 t | ||
1D58 | ᵘ | EXPOSANT MINUSCULE LATINE U |
lettre modificative minuscule u
<exposant> 0075 u | ||
1D5B | ᵛ | EXPOSANT MINUSCULE LATINE V |
lettre modificative minuscule v
<exposant> 0076 v |
Ce bloc complète les blocs Alphabet phonétique international (0250 ɐ..02AF ʯ) et Extensions phonétiques (1D00 ᴀ..1D7F ᵿ). |
D’autres lettres modificatives sont codées dans les blocs Lettres modificatives (02B0 ʰ..02FF ˿), Extensions phonétiques (1D00 ᴀ..1D7F ᵿ), et Exposants et indices (2070 ⁰..209F ). |
1D9C | ᶜ | EXPOSANT MINUSCULE LATINE C |
lettre modificative minuscule c
<exposant> 0063 c | ||
1DA0 | ᶠ | EXPOSANT MINUSCULE LATINE F |
lettre modificative minuscule f
<exposant> 0066 f | ||
1DA3 | ᶣ | EXPOSANT MINUSCULE LATINE U FÛT DESCENDANT |
lettre modificative minuscule u fût descendant
l’u fût descendant est aussi appelé « h retourné » <exposant> 0265 ɥ | ||
1DBB | ᶻ | EXPOSANT MINUSCULE LATINE Z |
lettre modificative minuscule z
<exposant> 007A z |
Ce bloc complète les blocs jusqu’à 024F ɏ et les blocs Latin étendu-C (2C60 Ⱡ..2C7F Ɀ), Latin étendu-D (A720 ꜠..A7FF ꟿ), et Latin étendu-E (AB30 ꬰ..AB6F ). §07.1 |
1E05 | ḅ | MINUSCULE LATINE B POINT SOUSCRIT |
0062 0323 ḅ | ||
1E57 | ṗ | MINUSCULE LATINE P POINT EN CHEF |
gaélique irlandais (ancienne orthographe)
0070 0307 ṗ |
Destinées à la translittération, seules les minuscules de ces lettres ont été codées. |
1E96 | ẖ | MINUSCULE LATINE H MACRON SOUSCRIT |
translittération des langues sémitiques
0068 0331 ẖ | ||
1E97 | ẗ | MINUSCULE LATINE T TRÉMA |
translittération des langues sémitiques
0074 0308 ẗ |
1E9E | ẞ | CAPITALE LATINE ESZETT |
lettre majuscule latine s dur
fricative alvéolaire sourde phonétiquement pas de « s dur » [i] Proposée par le DIN en 2007 : https://unicode.org/L2/L2007/07108-n3227.pdf, cette capitale est aujourd’hui officielle, voir http://www.rechtschreibrat.com/DOX/rfdr_PM_2017-06-29_Aktualisierung_Regelwerk.pdf. | ||
la minuscule est 00DF ß
la caméralité par défaut n’est pas bijective (la conversion de casse ne ramène pas à 1E9E ẞ) |
1EBB | ẻ | MINUSCULE LATINE E CROCHET EN CHEF |
0065 0309 ẻ |
La plupart de ces espaces sont sécables par défaut. — Les caractères d’espacement les plus courants sont codés dans les blocs Latin de base et commandes-C0 (0000 ..007F ) et Latin-1 complémentaire et commandes-C1 (0080 ..00FF ÿ). |
2002 | ESPACE DEMI-CADRATIN | |
indiquée par l’abréviation ENSP pour « en space »
0020 espace | ||
2003 | ESPACE CADRATIN | |
espace de côté égal à la force de corps de la police utilisée
peut varier en fonction du facteur de condensation de la police utilisée en typographie anglaise, cette espace peut séparer les phrases indiquée par l’abréviation EMSP pour « em space » 0020 espace |
200C | | ANTILIANT |
[i] Comme il n’y a pas d’antiliant espaçant, on peut faire l’économie de préciser « SANS CHASSE ». | ||
signalé par un symbole en forme de coin ou de clou à tête plate triangulaire
placé au sein d’une suite, ce caractère indique au moteur de rendu de ne pas substituer de glyphe ligaturé | ||
200D | | LIANT |
[i] En anglais, il faut préciser « sans chasse » parce qu’il existe un autre joiner, le gluon 2060 WORD JOINER. Il n’y a pas de liant espaçant (avec chasse), de sorte que le français peut être plus concis. |
2010 | ‐ | [i] Ce caractère est indispensable dans les polices comme Noto et Lucida Sans Unicode, parce que le glyphe du tiret générique 002D - est trop long comme trait d’union dans la première, et que dans la seconde il ne convient ni comme trait d’union, ni comme signe moins. |
tiret quart de cadratin
[i] En typographie, « division » est le nom que prend le tiret quart de cadratin quand il sert pour les césures de fin de ligne. En pratique, c’est souvent le tiret générique 002D - qui est utilisé, car dans presque toutes les polices proportionnelles son glyphe est adapté à cet usage. | ||
tiret générique 002D -
trait de césure conditionnel 00AD | ||
2011 | ‑ | TRAIT D’UNION INSÉCABLE |
tiret quart de cadratin insécable
contrairement à 2010 ‐, ce caractère n’admet pas de saut de ligne [i] Les noms comme « St‑Michel » sont maintenus sur une ligne, car un saut de ligne après le trait d’union de ces noms est une faute typographique. | ||
tiret générique 002D -
trait de césure conditionnel 00AD <insécable> 2010 ‐ | ||
2012 | ‒ | TIRET TABULAIRE |
[i] La traduction française « tiret numérique » de l’anglais FIGURE DASH prête à malentendu. Il faut aussi faire ressortir le parallélisme entre ce caractère et 2008 ESPACE PONCTUATION TABULAIRE. | ||
[i] Cela concerne la plupart des polices proportionnelles. Par conséquent, la longueur du tiret tabulaire est généralement deux tiers de cadratin. — Comme l’espace tabulaire et l’espace ponctuation tabulaire, le tiret tabulaire servait à composer des tableaux de chiffres en typographie mécanique. | ||
[i] Pour une raison peu évidente, le standard Unicode préfère 2013 : http://www.unicode.org/versions/Unicode10.0.0/ch06.pdf#G6120. Mais en rédaction technique, on préfère 2012 : http://www.technicalauthoring.com/wiki/index.php/Figure_dash. Et O. Randier, dans http://www.cairn.info/article.php?ID_REVUE=DN&ID_NUMPUBLIE=DN_063&ID_ARTICLE=DN_063_0089&FRM=B#pa29 : « […] nous avons pris l’habitude, puisqu’il est déjà disponible dans les fontes européennes, d’utiliser ce tiret demi-cadratin pour indiquer des intervalles (par exemple dans des dates), rôle maintenant attribué au tiret numérique. » [Cité aussi dans une note de 2013 –.] | ||
[i] Cette indication provient du standard Unicode, qui explique au chapitre 6, section 2 sur la ponctuation générale : « U+2012 TIRET NUMÉRIQUE a la même sémantique (ambiguë) que U+002D TIRET GÉNÉRIQUE, mais a la même largeur que les chiffres (si elles sont à chasse fixe). » Plus loin : « En interprétant des formules, U+002D TIRET GÉNÉRIQUE, U+2012 TIRET NUMÉRIQUE et U+2212 SIGNE MOINS devraient chacun être considérés comme indiquant un signe moins, comme dans ‹ x = a − b ›, sauf si dans une couche supérieure il est précisé lequel de ces caractères porte cette signification. » (U+2012 figure dash has the same (ambiguous) semantic as the U+002D hyphen-minus, but has the same width as digits (if they are monospaced). […] When interpreting formulas, U+002D hyphen-minus, U+2012 figure dash, and U+2212 minus sign should each be taken as indicating a minus sign, as in “x = a - b”, unless a higher-level protocol precisely defines which of these characters serves that function.) https://unicode.org/versions/Unicode9.0.0/ch06.pdf#page=12. | ||
caractère de compatibilité pour les tableaux composés à l’ancienne, ensemble avec 2007 ESPACE TABULAIRE et 2008 ESPACE PONCTUATION TABULAIRE | ||
2013 | – | TIRET DEMI-CADRATIN |
tiret sur demi-cadratin
tiret d’incise court [i] La sécabilité de ce tiret est un problème en français au début des incises, car elle fait que le tiret reste à la fin de la ligne pendant que l’espace insécable introduit la ligne suivante. La solution consiste à rendre le tiret insécable en le faisant suivre d’un gluon (voir 2060 GLUON). | ||
[i] | ||
[i] Comme tiret d’intervalle, on utilise le plus souvent un tiret de largeur moyenne, sans espaces de part et d’autre. — O. Randier, dans http://www.cairn.info/article.php?ID_REVUE=DN&ID_NUMPUBLIE=DN_063&ID_ARTICLE=DN_063_0089&FRM=B#pa29 : « […] nous avons pris l’habitude, puisqu’il est déjà disponible dans les fontes européennes, d’utiliser ce tiret demi-cadratin pour indiquer des intervalles (par exemple dans des dates), rôle maintenant attribué au tiret numérique. » [Cité aussi dans une note de 2012 ‒.] | ||
2014 | — | TIRET CADRATIN |
tiret sur cadratin
tiret d’incise long [i] La sécabilité de ce tiret est un problème en français au début des incises, car elle fait que le tiret reste à la fin de la ligne pendant que l’espace insécable introduit la ligne suivante. La solution consiste à rendre le tiret insécable en l’entourant de gluons (voir 2060 GLUON). | ||
sert à noter une pause
[i] | ||
aussi long que sa chasse, il peut former une ligne continue
tiret double cadratin 2E3A ⸺ signe katakana-hiragana de son prolongé 30FC ー | ||
2015 | ― | [i] D’après son nom anglais HORIZONTAL BAR, à la place duquel Unicode propose quotation dash, cette ponctuation fut nommée BARRE HORIZONTALE. Ce nom hérité suggère que ce serait le pendant horizontal de 007C | BARRE VERTICALE, comptée comme un symbole mathématique, alors que 2015 ― est compté comme une ponctuation-tiret. Afin d’éviter toute confusion, il faut choisir un nom en TIRET. Ensuite, le mélange des noms sémantiques et graphiques prête à des malentendus (voir la note suivante) et conduit à la production de mauvaises polices où ce caractère a la même longueur que le tiret cadratin. |
tiret de dialogue, tiret de citation, barre horizontale
indique un changement d’interlocuteur dans les dialogues [i] Ces deux dernières annotations sont de Patrick Andries, l’une retrouvée dans un article d’Olivier Randier (http://www.cairn.info/article.php?ID_REVUE=DN&ID_NUMPUBLIE=DN_063&ID_ARTICLE=DN_063_0089&FRM=B#pa29). Selon O. Randier, il s’agirait d’une variante sémantique du tiret cadratin ou demi-cadratin habituellement utilisé en typographie. Noter que l’auteur se trompe en attribuant l’usage du tiret demi-cadratin aux anglosaxons, car dans les publications aux États-Unis on ne trouve quasiment que le tiret cadratin, avec ou sans espace de part et d’autre (car les manuels de style diffèrent sur ce point), tandis qu’en France on utilise souvent le demi-cadratin (sans doute à cause de l’obligation de l’entourer d’espaces). | ||
placé au début d’une réplique de dialogue ou d’un texte cité
chasse plus qu’il n’est long, et ne peut donc former de ligne continue |
L’usage des guillemets varie d’une langue à l’autre, de sorte que les noms se réfèrent à la forme plutôt qu’à la fonction. |
2018 | ‘ | [i] Par rapport au nom dans la version française héritée, « GUILLEMET-APOSTROPHE CULBUTÉ », il faut noter quatre choses : ① Le mot composé « guillemet apostrophe » s’écrit sans trait d’union, car aucune partie ne change de sens ; voir http://grammaire.reverso.net/5_3_01_trait_dunion.shtml. ② L’attribut SIMPLE doit être présent, car son absence empêche l’usage du terme générique de « guillemets apostrophes » pour désigner l’ensemble des guillemets simples et doubles apostrophes, et elle n’est pas dans l’original (RIGHT SINGLE QUOTATION MARK, sachant qu’Unicode préfère SINGLE COMMA QUOTATION MARK mais a été obligé de céder à l’ISO/IEC ; COMMA est discuté dans la note de 2019 ’). ③ Lʼadjectif « retourné » s’accorde dès lors à « apostophe », non à « guillemet », selon le même principe qui vaut pour les lettres (où il ne s’accorde pas à capitale ou minuscule). ④ L’attribut « culbuté » est remplacé par « retourné » pour les raisons présentées dans la note de 018D ƍ. |
guillemet britannique ouvrant
guillemet américain niché ouvrant ouvrant ou fermant selon la langue, par exemple fermant en allemand (§06.2) on préfère ce caractère à 201B ‛ GUILLEMET SIMPLE APOSTROPHE RÉFLÉCHIE, auquel son glyphe ressemble toutefois dans certaines polices, le rendant impropre à son utilisation en allemand simple guillemet générique 0027 ' lettre apostrophe retournée 02BB ʻ guillemet simple apostrophe retournée ornemental 275B ❛ | ||
2019 | ’ | [i] Outre l’absence de trait d’union, mentionnée dans la note précédente, il serait utile d’expliquer pourquoi utiliser « apostrophe » en français, si Unicode proposait de plutôt faire le lien avec la virgule. Certes en anglais, apostrophe est deux fois plus long à prononcer que comma, mais ce n’est pas l’essentiel. Dans l’esprit des créateurs et d’une partie des utilisateurs du standard, le terme d’apostrophe est préempté par le caractère 0027 hérité d’ASCII que nous proposons d’appeler plutôt SIMPLE GUILLEMET GÉNÉRIQUE, pour être plus proche de la réalité. L’apostrophe, la vraie, a la forme d’une virgule. En tant que ponctuation, elle n’eut pas droit de cité dans Unicode qui proposa de simplement utiliser la LETTRE APOSTROPHE 02BC ʼ, dont le nom anglais contient lui aussi le terme d’apostrophe, pendant que les caractères avant et après elle ont des noms anglais formés avec comma (une incohérence reprise dans la version française héritée, mais éliminée dans celle-ci). Maintenant on propose de rétablir dans ses droits la langue française et ses usages, où les mots gardent leur sens d’origine pour peu qu’il reste valable. C’est le cas de l’apostrophe, dont le nom évoque tout autant la forme en virgule – en apostrophe après tout – que le nom de la virgule elle-même. Voir aussi la note de 201A ‚. |
guillemet britannique fermant
guillemet américain niché fermant fermant ou ouvrant selon la langue (§06.2) en français et dans d’autres langues, c’est le caractère préféré comme apostrophe [i] | ||
dans un courant de l’orthographe anglaise, le caractère préféré comme apostrophe est 02BC ʼ LETTRE APOSTROPHE
simple guillemet générique 0027 ' lettre apostrophe 02BC ʼ guillemet simple apostrophe ornemental 275C ❜ | ||
201C | “ | GUILLEMET DOUBLE APOSTROPHE RETOURNÉE |
guillemet anglais ouvrant
guillemet américain ouvrant guillemet britannique niché ouvrant ouvrant ou fermant selon la langue, par exemple fermant en allemand (§06.2) [i] En français, on a les moyens de distinguer les guillemets de citation et les guillemets dits d’ironie, afin de faire une différence entre une citation et une simple prise de distance. Dans la presse imprimée, cette “subtilité” est couramment implémentée, en français et dans d’autres langues. Différencier les guillemets, c’est respecter le lecteur, qui est ainsi dispensé de deviner à partir du contexte, la fonction de telle paire de guillemets. — Sur les guillemets d’ironie en français, voir http://www.ledevoir.com/societe/actualites-en-societe/488139/mises-aux-points-les-antiguillemets-comme-symboles-de-la-postverite. | ||
en français, une partie de la tradition typographique utilise ce caractère au début d’une citation nichée ; le caractère recommandé est 2039 ‹ SIMPLE GUILLEMET CROISSANT
on préfère ce caractère à 201F ‟ GUILLEMET DOUBLE APOSTROPHE RÉFLÉCHIE, auquel le glyphe ressemble toutefois dans certaines polices, le rendant impropre à son utilisation en allemand double guillemet générique 0022 " guillemet double apostrophe retournée ornemental 275D ❝ guillemet double prime réfléchi 301D 〝 | ||
201D | ” | GUILLEMET DOUBLE APOSTROPHE |
guillemet anglais fermant
guillemet américain fermant guillemet britannique niché fermant fermant ou ouvrant selon la langue (§06.2) en français, ce caractère est recommandé pour fermer les guillemets d’ironie en français, une partie de la tradition typographique utilise ce caractère à la fin d’une citation nichée ; le caractère recommandé est 203A › SIMPLE GUILLEMET DÉCROISSANT double guillemet générique 0022 " double prime 2033 ″ guillemet double apostrophe ornemental 275E ❞ guillemet double prime 301E 〞 | ||
201E | „ | GUILLEMET DOUBLE VIRGULE |
guillemet allemand ouvrant
guillemet double ouvrant dans plusieurs langues guillemet double prime bas 301F 〟 |
2020 | † | OBÈLE |
croix longue, croix oblongue
obélus 00F7 ÷ obèle retourné 2E38 ⸸ | ||
2021 | ‡ | DOUBLE OBÈLE |
2022 | • | PUCE |
petit disque, petit cercle plein
point médian 00B7 · simple point de conduite 2024 ․ opérateur puce 2219 ∙ point négatif 25D8 ◘ petit cercle 25E6 ◦ | ||
2026 | … | POINTS DE SUSPENSION |
triple point de conduite
points de suspension verticaux 22EE ⋮ forme de présentation de points de suspension verticaux FE19 ︙ 002E 002E 002E ... | ||
2027 | ‧ | POINT DE COUPURE DE MOT |
sert à visualiser les points de coupure dans un but didactique |
202F | ESPACE FINE INSÉCABLE | |
[i] Cette traduction française est un calque de l’anglais, de l’époque où ce caractère ne servait pas encore en français, ayant été encodé pour le mongol ; aujourd’hui, elle ne correspond plus à l’usage de ce caractère en français. | ||
nom abrégé en EFI
indiquée par l’abréviation NNBSP pour « narrow no-break space » [i] Si 2008 ESPACE PONCTUATION TABULAIRE était insécable, elle aurait alors pu être réutilisée pour la prise en charge du français, en servant d’espace fine insécable. (avec tout ou partie des grandes ponctuations). Au lieu de quoi, la typographie française interopérable a dû attendre sept ans et plus, jusqu’à ce que le caractère U+202F ESPACE FINE INSÉCABLE soit encodé (en 1999) et disponible. Encore fut-ce pour le mongol (et le phags-pa), où elle fait entre ¹⁄₉ et ¹⁄₁₂ de cadratin. L’industrie graphique s’en est saisie pour la remployer en typographie française, mais en doublant sa largeur. Au bout de 15 ans, cet usage entra dans le standard Unicode lors de la réécriture du passage sur les espaces, en 2014. Voir http://www.unicode.org/mail-arch/unicode-ml/y2015-m06/0220.html et http://www.unicode.org/versions/Unicode7.0.0/ch06.pdf#G17097. Cf. la note de 2007 . | ||
espace insécable classique 00A0
espace quart de cadratin 2005 espace fine 2009 <insécable> 0020 |
2032 | ′ | PRIME |
minutes, pieds
simple guillemet générique 0027 ' accent aigu 00B4 ´ lettre prime 02B9 ʹ | ||
2033 | ″ | DOUBLE PRIME |
secondes, pouces
double guillemet générique 0022 " lettre seconde 02BA ʺ guillemet double apostrophe 201D ” guillemet de répétition 3003 〃 guillemet double prime 301E 〞 2032 2032 ′′ |
Ces guillemets chevrons sont réflexibles par permutation de glyphes avec leur pendant (§04.7). |
2039 | ‹ | ‹ | [i] L’attribut « croissant » est discuté dans la note de 00AB «. |
guillemet simple chevron croissant
français : simple guillemet gauche pointe vers la gauche en écriture gauche-à-droite guillemet ouvrant ou fermant selon la langue (§06.2) dans certaines langues dont le français, utilisé pour indiquer une citation nichée (incluse dans une autre citation) inférieur 003C < guillemet croissant 00AB « crochet brisé ouvrant 27E8 ⟨ simple guillemet ornemental croissant 276E ❮ chevron ouvrant 3008 〈 | |||
203A | › | › | [i] L’attribut « décroissant » est discuté dans la note de 00BB ». |
guillemet simple chevron décroissant
français : simple guillemet droit pointe vers la droite en écriture gauche-à-droite guillemet ouvrant ou fermant selon la langue (§06.2) dans certaines langues dont le français, utilisé pour indiquer une citation nichée (incluse dans une autre citation) supérieur 003E > guillemet décroissant 00BB » crochet brisé fermant 27E9 ⟩ simple guillemet ornemental décroissant 276F ❯ chevron fermant 3009 〉 |
2044 | ⁄ | BARRE DE FRACTION |
barre fractionnaire
pour composer des fractions arbitraires spécifiée pour déclencher le formatage des chiffres adjacents en numérateur et dénominateur crène de part et d’autre dans la plupart des polices proportionnelles oblique 002F / opérateur oblique 2215 ∕ |
204A | ⁊ | NOTE TIRONIENNE ET |
gaélique irlandais, vieil anglais, …
perluète 0026 & perluète italique minuscule 1F670 🙰 |
2060 | | GLUON |
espace nulle insécable
[i] En français, on n’a pas besoin de préciser « de mots », car on a un autre terme pour le LIANT 200D (ZERO-WIDTH JOINER). Ce serait aussi inexact, car le gluon ne s’utilise pas uniquement entre deux mots. | ||
une espace sans chasse insécable (et rien de plus, contrairement à l’indicateur d’ordre des octets)
[i] Dans les vieux programmes (comme Word 2010), pour obtenir l’effet du gluon, il faut utiliser l’IOO. Unicode spécifie (http://www.unicode.org/versions/Unicode10.0.0/ch23.pdf#G20199) que les nouveaux programmes doivent prendre en charge les deux. | ||
indicateur d’ordre des octets FEFF |
Les chiffres en exposant sont lus comme des chiffres, mais non comme chiffres décimaux afin d’éviter les confusions ; ils renvoient au chiffre décimal correspondant. Les lettres latines en exposant renvoient à la lettre correspondante. D’autres lettres latines en exposant sont codées dans le bloc Lettres modificatives (02B0 ʰ..02FF ˿). §22.4 |
2070 | ⁰ | EXPOSANT CHIFFRE ZÉRO |
<exposant> 0030 0 | ||
2071 | ⁱ | EXPOSANT MINUSCULE LATINE I |
lettre modificative minuscule i
[i] Le standard Unicode spécifie : « Les exposants des lettres i et n sont codés dans le bloc Exposants et indices (2070 ⁰..209F ). Le fait que les noms de ces derniers contiennent le mot ‹ exposant › au lieu de ‹ lettre modificative › est un objet historique provenant des sources originales de ces caractères, et ne vise pas à exprimer une différence fonctionnelle dans l’utilisation de ces lettres dans le Standard Unicode. » (The superscript forms of the i and n letters can be found in the Superscripts and Subscripts block (U+2070..U+209F). The fact that the latter two letters contain the word “superscript” in their names instead of “modifier letter” is an historical artifact of original sources for the characters, and is not intended to convey a functional distinction in the use of these characters in the Unicode Standard.) http://www.unicode.org/versions/Unicode9.0.0/ch07.pdf#G24762 — Cet effort de décalage sémantique d’« exposant » vers « lettre modificative » (dont les indices sont restés épargnés) témoigne d’un effort de camoufler les lettres en exposant, visant à dissuader les implémenteurs de les mettre à la disposition des utilisateurs des langues d’écriture latine qui suivent la tradition médiévale d’utiliser des exposants pour noter des abréviations (français, anglais, espagnol, italien, portugais). Cela est un artéfact contemporain de stratégie d’entreprise au service du marketing de logiciels de traitement de texte et de PAO, et ne doit pas empêcher ces utilisateurs d’insister pour qu’Unicode les autorise à écrire leur langue correctement en texte brut. Coder de quoi écrire toutes les écritures du monde en texte brut, quel que soit leur niveau de complexité, est la mission déclarée d’Unicode : http://www.unicode.org/versions/Unicode10.0.0/ch01.pdf#G7110 dans le standard ; http://www.unicode.org/standard/principles.html sur le site. L’usage de mise en forme exposant pour écrire des abréviations est une pratique héritée et reste une option, mais il n’y a pas lieu de proprement l’imposer aux utilisateurs comme meilleure pratique. Sur le plan du traitement des données c’est même une véritable ineptie, car une fois converties en texte brut (sans balisage TeX), ces abréviations peuvent devenir très difficiles à analyser. | ||
exposant chiffre un 00B9 ¹
<exposant> 0069 i | ||
2074 | ⁴ | EXPOSANT CHIFFRE QUATRE |
exposant quatre
<exposant> 0034 4 | ||
2075 | ⁵ | EXPOSANT CHIFFRE CINQ |
exposant cinq
<exposant> 0035 5 | ||
2076 | ⁶ | EXPOSANT CHIFFRE SIX |
exposant six
<exposant> 0036 6 | ||
2077 | ⁷ | EXPOSANT CHIFFRE SEPT |
exposant sept
<exposant> 0037 7 | ||
2078 | ⁸ | EXPOSANT CHIFFRE HUIT |
exposant huit
<exposant> 0038 8 | ||
2079 | ⁹ | EXPOSANT CHIFFRE NEUF |
exposant neuf
<exposant> 0039 9 | ||
207A | ⁺ | EXPOSANT SIGNE PLUS |
<exposant> 002B + | ||
207B | ⁻ | EXPOSANT SIGNE MOINS |
<exposant> 2212 − | ||
207F | ⁿ | EXPOSANT MINUSCULE LATINE N |
lettre modificative minuscule n
[i] Voir la note de 2071 ⁱ. | ||
<exposant> 006E n |
2080 | ₀ | INDICE CHIFFRE ZÉRO |
indice zéro
<indice> 0030 0 | ||
2081 | ₁ | INDICE CHIFFRE UN |
indice un
<indice> 0031 1 | ||
2082 | ₂ | INDICE CHIFFRE DEUX |
indice deux
<indice> 0032 2 | ||
2083 | ₃ | INDICE CHIFFRE TROIS |
indice trois
<indice> 0033 3 | ||
2084 | ₄ | INDICE CHIFFRE QUATRE |
indice quatre
<indice> 0034 4 | ||
2085 | ₅ | INDICE CHIFFRE CINQ |
indice cinq
<indice> 0035 5 | ||
2086 | ₆ | INDICE CHIFFRE SIX |
indice six
<indice> 0036 6 | ||
2087 | ₇ | INDICE CHIFFRE SEPT |
indice sept
<indice> 0037 7 | ||
2088 | ₈ | INDICE CHIFFRE HUIT |
indice huit
<indice> 0038 8 | ||
2089 | ₉ | INDICE CHIFFRE NEUF |
indice neuf
<indice> 0039 9 |
Des versions de pleine chasse de certains symboles monétaires sont codées dans le bloc Formes de pleine et demi-chasse (FF00 ..FFEF ). §22.1 |
Plusieurs symboles monétaires sont codés dans d’autres blocs. |
20A5 | ₥ | SYMBOLE MILLIÈME |
États-Unis
équivaut à un dixième de cent | ||
20AC | € | SYMBOLE EURO |
Union monétaire européenne
symbole écu 20A0 ₠ billet d’euro 1F4B6 💶 |
Parmi ces symboles, certains sont en réalité des lettres (appartenant à la catégorie des lettres minuscules ou à celle des lettres capitales), et servent aussi de symboles mathématiques assortis avec les lettres codées dans le bloc Lettres et chiffres mathématiques (1D400 𝐀..1D7FF 𝟿). |
2126 | Ω | SYMBOLE OHM |
unité SI de la résistance, commémore le physicien allemand Georg Ohm
la représentation recommandée est 03A9 Ω nœud ascendant 260A ☊ 03A9 Ω capitale grecque oméga |
De nombreux symboles mathématiques asymétriques, appariés (p. ex. avec < ou/et >) ou non (p. ex. avec ~), sont réflexibles (§04.7) sans que ce soit toujours indiqué dans la liste. — D’autres caractères pour les mathématiques sont codés dans le blocs Symboles mathématiques-A (27C0 ⟀..27EF ⟯), Symboles mathématiques-B (2980 ⦀..29FF ⧿), Opérateurs mathématiques complémentaires (2A00 ⨀..2AFF ⫿), Lettres et chiffres mathématiques (1D400 𝐀..1D7FF 𝟿), et Lettres mathématiques arabes (1EE00 𞸀..1EEFF ). §22.5 |
2211 | ∑ | ∑ | [i] Ce symbole est réfléchi en écriture droite-à-gauche, voir https://en.wikipedia.org/wiki/Modern_Arabic_mathematical_notation#Examples et https://www.ima.umn.edu/materials/2006-2007/SW12.8-9.06/2289/MathArabIMAe.pdf. |
[i] Le nom « symbole somme » est plus proche de l’usage, plutôt que « signe somme » qui dans la version française héritée figure en alias, sous l’influence de l’anglais. Ainsi on peut aussi éviter une impasse grammaticale à 2140 ⅀. | |||
capitale grecque sigma 03A3 Σ
symbole somme ajouré 2140 ⅀ |
2212 | − | [i] Le signe plus et le signe moins ainsi que leurs composés et dérivés sont les seuls symboles mathématiques à porter le mot « signe » dans leur nom, car en plus d’être des opérateurs, ils servent à noter le signe des nombres signés, en pratique celui des nombres négatifs. — L’utilisation de « signe » fait l’objet du commetaire de 003C <. |
soustraction
tiret générique 002D - signe moins épais 2796 ➖ |
222A | ∪ | UNION |
réunion
union de la famille 22C3 ⋃ union double 22D3 ⋓ double union 2A4A ⩊ 222A FE00 ∪︀ glyphe alternatif avec empattement |
2236 | ∶ | RAPPORT |
sert à noter la division ou le rapport en mathématiques, de préférence à 003A :
deux-points 003A : |
Les symboles d’une relation et de sa réciproque sont réflexibles par permutation de glyphes. |
2243 | ≃ | ≃ | ASYMPTOTIQUEMENT ÉGAL |
tilde sur signe moins
[i] La notation de l’approximation est si diverse que des mathématiciens ont pu affirmer qu’elle n’est pas normalisée : https://math.stackexchange.com/questions/864606/difference-between-%E2%89%88-%E2%89%83-and-%E2%89%85, https://www.quora.com/What-is-the-difference-between-%E2%89%88-and-%E2%89%85. | |||
ce caractère est réflexible par permutation de glyphes avec 22CD ⋍
asymptotiquement égal réfléchi 22CD ⋍ | |||
2248 | ≈ | ≈ | PRESQUE ÉGAL |
asymptotique
[i] La norme de référence est ISO/IEC 80000-2 https://en.wikipedia.org/wiki/ISO_80000-2. |
22C5 | ⋅ | OPÉRATEUR POINT |
produit booléen | ||
pour noter la multiplication, ce symbole est préféré à 00B7 ·
point médian 00B7 · signe plus pointé 2214 ∔ |
2300 | ⌀ | DIAMÈTRE |
minuscule latine o barré 00F8 ø
ensemble vide 2205 ∅ |
D’autres pictogrammes sont codés dans les blocs Casseau ou Dingbats (2700 ✀..27BF ➿), Symboles et pictogrammes (1F300 🌀..1F5FF 🗿), Émoticônes (1F600 😀..1F64F 🙏), Symboles cartographiques et de transports (1F680 🚀..1F6FF ), et Symboles et pictogrammes complémentaires (1F900 🤀..1F9FF 🧿). §22.9 |
2610 | ☐ | CASE À COCHER |
carré ajouré 25A1 □ |
De nombreux symboles mathématiques asymétriques, appariés ou non, sont réflexibles (§04.7) sans que ce soit toujours indiqué dans la liste. — D’autres caractères pour les mathématiques sont codés dans le blocs Opérateurs mathématiques (2200 ∀..22FF ⋿), Symboles mathématiques-B (2980 ⦀..29FF ⧿), Opérateurs mathématiques complémentaires (2A00 ⨀..2AFF ⫿), Lettres et chiffres mathématiques (1D400 𝐀..1D7FF 𝟿), et Lettres mathématiques arabes (1EE00 𞸀..1EEFF ). §22.5 |
Ces caractères servent aussi de ponctuations dans un contexte général. Ils sont réflexibles par permutation de glyphes avec leur pendant (§04.7). |
27E8 | ⟨ | ⟨ | CROCHET BRISÉ OUVRANT |
[i] « Chevron » a beaucoup de significations et prête à confusion. Comme en plus, l’usage des chevrons non CJC 2329 〈 et 232A 〉 a été perdu suite à une équivalence canonique erronée, il a fallu en ajouter d’autres (ceux-ci). Comme ils servent en mathématiques, on en a profité pour les appeler « chevrons mathématiques » d’autant plus qu’ils se trouvent au sein d’un ensemble d’autres ponctuations (symboles) mathématiques, En les appelant « crochets brisés », on récupère un nom plus maniable, qui a en sus l’avantage d’être univoque. | |||
notation z : crochet de séquence gauche
inférieur 003C < simple guillemet croissant 2039 ‹ chevron bâtard ouvrant 2329 〈 crochet brisé moyen ouvrant 276C ❬ crochet brisé épais ouvrant 2770 ❰ chevron ouvrant 3008 〈 | |||
27E9 | ⟩ | ⟩ | CROCHET BRISÉ FERMANT |
chevron mathématique fermant
notation z : crochet de séquence droit supérieur 003E > simple guillemet décroissant 203A › chevron bâtard fermant 232A 〉 crochet brisé moyen fermant 276D ❭ crochet brisé épais fermant 2771 ❱ chevron fermant 3009 〉 | |||
27EA | ⟪ | ⟪ | DOUBLE CROCHET BRISÉ OUVRANT |
double chevron mathématique ouvrant
notation z : crochet de chevrons gauche guillemet croissant 00AB « double chevron ouvrant 300A 《 | |||
27EB | ⟫ | ⟫ | DOUBLE CROCHET BRISÉ FERMANT |
double chevron mathématique fermant
notation z : crochet de chevrons droit guillemet décroissant 00BB » double chevron fermant 300B 》 |
Ce bloc complète les blocs jusqu’à 024F ɏ et les blocs Latin étendu complémentaire (1E00 Ḁ..1EFF ỿ), Latin étendu-C (2C60 Ⱡ..2C7F Ɀ), et Latin étendu-E (AB30 ꬰ..AB6F ). §07.1 |
A788 | ꞈ | LETTRE ACCENT CIRCONFLEXE BAS |
lettre accent circonflexe 02C6 ˆ
chevron d’insertion 2038 ‸ |
A78B | Ꞌ | CAPITALE LATINE SALTILLO |
mé’phâ (Mexique) | ||
A78C | ꞌ | MINUSCULE LATINE SALTILLO |
les saltillos servent de représentation bicamérale du coup de glotte
la minuscule est courante dans de nombreuses langues du Mexique et d’autres pays, dont l’izere au Nigéria simple guillemet générique 0027 ' minuscule latine coup de glotte 0242 ɂ lettre latine coup de glotte 0294 ʔ lettre apostrophe 02BC ʼ exposant lettre latine coup de glotte 02C0 ˀ |
A7AE | Ɪ | CAPITALE LATINE PETITE CAPITALE I |
sert aussi en unifon
la minuscule est 026A ɪ pour l’univocité, on utilise un glyphe à empattement dans toutes les polices |
Certains des caractères ci-dessous servent en mathématiques arabes, où les aspects contextuels d’une même lettre peuvent représenter des variables différentes. En général, la gestion préférée des formes de présentation se situe au niveau des polices et des moteurs de rendu, en utilisant les caractères du bloc Arabe (0600 ..06FF ۿ). |
FEFF | | INDICATEUR D’ORDRE DES OCTETS |
nom abrégé en IOO
indiqué par le sigle BOM pour « byte order mark » peut servir à détecter l’ordre des octets (grand-boutien, petit-boutien), parce que FFFE n’est pas un caractère espace insécable sans chasse indiquée par le sigle ZWNBSP pour « zero width no-break space » pour représenter l’insécabilité, on préfère 2060 GLUON césure conditionnelle 200B gluon 2060 <pas un caractère> FFFE |