Pourquoi la double graphie des noms compte-t-elle autant ?

Parce que tout formulaire américain, européen et onusien traite l'orthographe arabe et la translittération latine comme deux champs distincts, et l'agent consulaire les compare au passeport pixel par pixel. Si l'arabe du formulaire est محمد mais que la page photo affiche مُحَمَّد avec voyelles, ou si la translittération est Mohamed sur le formulaire et Mohammed dans le MRZ, l'agent le signale. L'IA gère cela en lisant les deux sources sur l'image du passeport : le texte arabe de la page photo et la ligne latine du MRZ. Tu vois les deux côte à côte et tu confirmes la concordance avant l'export.

Comment l'IA convertit-elle les dates hégiriennes sans erreur ?

De deux façons. La conversion Umm al-Qura (utilisée par l'Arabie saoudite et la plupart des missions diplomatiques) donne un équivalent grégorien déterministe basé sur le calcul astronomique. La conversion hégirienne tabulaire (utilisée dans beaucoup de formulaires par simplicité) peut différer d'un ou deux jours. Les deux sont valides selon la destination, donc l'IA montre laquelle le formulaire attend et convertit en conséquence. Les actes de naissance émis en hégirien sont gardés comme original hégirien plus conversion grégorienne. Ne réécris jamais la date hégirienne — garde-la comme source de vérité et ajoute le grégorien en dessous.

Quel système de chiffres utiliser : arabes orientaux ou standards ?

Toujours les chiffres standards (1, 2, 3) pour les champs système, même sur les formulaires en arabe. Les systèmes du DHS américain, les portails de visa Schengen et le HCR ne lisent que les chiffres standards. Les chiffres arabes orientaux (١، ٢، ٣) sont visuellement corrects pour les formulaires papier en arabe mais cassent le parsing dans 90 % des systèmes numériques. L'IA convertit à la saisie et te prévient quand tu colles des chiffres orientaux dans un champ qui demande les standards.

L'UX RTL importe-t-il vraiment pour remplir un formulaire ?

Oui, et la plupart des outils ratent cela. Un vrai RTL veut dire : curseur de saisie qui démarre à droite, ordre de tabulation de droite à gauche, erreurs de validation à droite du champ, listes déroulantes qui s'ouvrent vers la droite, lignes mixtes arabe-anglais qui se réordonnent correctement sans marqueur manuel. Un formulaire anglais inversé n'est pas un RTL, c'est de l'anglais dans un miroir. La différence pèse quand tu relis un DS-160 de 9 pages en arabe à 23 h. Le bon curseur, le bon ordre de tabulation, le bon alignement des erreurs transforment 40 minutes de relecture en 12.

Et si mon nom n'a pas de translittération formelle ?

Beaucoup de noms arabes — surtout les composés comme عبد الرحمن, عبد العزيز, محمد علي — ont plusieurs translittérations latines valides : Abdulrahman, Abdurahman, Abd al-Rahman ; Mohamed, Mohammed, Muhammad. La règle pour un visa : utilise l'orthographe exacte du MRZ de ton passeport actuel. Même si elle te paraît bizarre, c'est ce que les systèmes consulaires indexent. Si ton permis de conduire ou un ancien visa américain utilisait une autre orthographe, liste-la dans 'Autres noms utilisés'. L'IA signale l'écart mais ne remplace jamais l'orthographe du passeport — cette décision t'appartient.

Remplir des PDF arabes avec l'IA : double graphie, hégirien, RTL

La plupart des outils de formulaires prétendent gérer l'arabe. Regarde de près et tu trouves une étiquette d'interface traduite et un champ qui se remplit de gauche à droite. Le vrai travail sur les formulaires arabes est plus difficile. La demande de visa, la déclaration d'assurance, le dossier d'immigration : chacun encode les données selon trois modes qu'aucun outil purement anglophone n'a jamais eu à manipuler :

Deux graphies à la fois. Ton nom en arabe et en translittération latine, et les deux doivent correspondre au passeport.
Deux calendriers. Ta date de naissance en hégirien (avec lequel tu as peut-être grandi) et en grégorien (que demande la destination).
Deux systèmes de chiffres. Arabes orientaux pour l'affichage, standards pour le parsing.

Si tu rates ne serait-ce qu'un seul, le formulaire revient. Cet article explique comment l'IA traite chacun, où ton œil reste indispensable, et où passe la ligne entre automatisation et relecture personnelle.

Noms en double graphie : la règle ICAO 9303

La norme internationale des documents de voyage (ICAO 9303) définit les règles de romanisation utilisées par tous les passeports. Le MRZ (zone de lecture optique, bas de la page photo) porte la forme latine canonique. Le texte de la page photo porte la forme arabe. Les deux ensemble forment le nom sous lequel ta destination te connaît.

Quand l'IA lit une image de passeport, elle extrait les deux :

Nom en arabe depuis la zone de texte de la page photo : محمد عبد الله الفلاسي
Translittération latine depuis le MRZ : MOHAMMED ABDULLAH ALFLASI

Les deux vont sur le DS-160, la demande Schengen ou le CV arabe. Le formulaire demande en général « Nom complet en alphabet d'origine » et « Nom de famille / prénoms » comme deux champs distincts. L'IA remplit les deux et les affiche côte à côte pour confirmation.

Le piège peu évident : quand ton nom arabe a des voyelles sur le formulaire et que la page photo du passeport n'en a pas. Le système de destination retire les voyelles pour comparer, donc مُحَمَّد et محمد coïncident. Mais celui qui a conçu le formulaire attend que tu reproduises le passeport. L'IA normalise par défaut vers la forme du passeport et te laisse un bouton pour ré-ajouter les voyelles si tu en as besoin.

D'hégirien à grégorien : quel calendrier le formulaire veut-il

Trois systèmes hégiriens peuvent se rencontrer :

Umm al-Qura — utilisé par l'Arabie saoudite et la plupart des postes diplomatiques. Calcul astronomique. L'année courante est 1447 AH.
Hégirien tabulaire — utilisé dans beaucoup de formulaires de type tableur pour la simplicité. Peut différer d'Umm al-Qura d'un ou deux jours.
Hégirien civil (Iran) — noms de mois différents et base solaire. Uniquement sur les formulaires iraniens.

La plupart des formulaires américains, européens et onusiens veulent du grégorien. L'IA convertit en arrière-plan et garde l'original hégirien visible :

Hégirien : 5 رمضان 1432
Grégorien : 5 août 2011

Quand le formulaire accepte l'hégirien (Absher saoudien, certaines demandes pakistanaises, formulaires internes du Golfe), l'IA garde l'hégirien comme entrée et saute la conversion. Le principe : ne jamais écraser en silence — tu vois toujours les deux, et le bon format va au bon système.

Le problème des chiffres

Les chiffres arabes orientaux (٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩) sont visuellement natifs du texte arabe et paraissent corrects sur un formulaire papier. Ils cassent presque tous les systèmes numériques : CBP américain, portails de visa Schengen, enregistrement HCR, France Travail, Bürgergeld allemand. Tous parsent uniquement les chiffres standards.

La règle appliquée par l'IA : stocker en chiffres standards, afficher en chiffres standards dans les champs système, convertir en orientaux seulement quand les métadonnées du formulaire le demandent explicitement (Absher saoudien, certains PDF gouvernementaux irakiens et égyptiens, publications arabes classiques).

Quand tu colles un numéro de téléphone en chiffres orientaux dans un champ système américain, l'IA prévient :

٠٥٠١٢٣٤٥٦٧ détecté — conversion en 0501234567 pour compatibilité système.

Tu le vois, tu valides. Pas de réécriture silencieuse.

UX RTL en relecture : à quoi ressemble un bon outil

Un formulaire anglais inversé n'est pas un RTL. Une vraie couche de relecture RTL a :

Le curseur de saisie qui démarre à droite du champ
L'ordre de tabulation qui va de droite à gauche
Les messages d'erreur de validation qui apparaissent à droite du champ, pas à gauche
Les listes déroulantes qui s'ouvrent vers la droite
Le texte bidirectionnel (nom arabe plus translittération latine sur la même ligne) qui se réordonne correctement sans marqueur manuel
Les nombres qui se lisent de gauche à droite à l'intérieur d'une ligne autrement de droite à gauche (règle typographique arabe standard)
Les sections du formulaire qui progressent du haut vers le bas, avec l'ordre RTL de chaque section conservé

La plupart des outils en cochent une ou deux. Peu cochent les huit. La couche de relecture de FillWizard rend le formulaire dans un DOM RTL réel (dir="rtl" sur la section, pas seulement un text-align CSS), si bien que les lecteurs d'écran, les raccourcis du navigateur et le copier-coller fonctionnent comme un lecteur arabe natif s'y attend.

Ce qui demande encore tes yeux

Cinq choses que l'IA ne doit pas décider à ta place :

Quelle translittération est la tienne. Si ton passeport dit Yusuf et ton compte bancaire Yousef, l'IA ne peut pas choisir. Liste-les toutes dans « Autres noms utilisés » et laisse l'agent consulaire faire le rapprochement.
Si ta date hégirienne est Umm al-Qura ou tabulaire. Les actes de naissance des zones rurales d'Arabie saoudite et du Yémen utilisent parfois le tabulaire. Si l'année colle et que le jour est décalé d'un, c'est l'indice. Confirme avec le document d'origine avant l'export.
Appartenance religieuse sur les formulaires de visa. Certains la demandent, d'autres non. Le formulaire Schengen la place en optionnelle dans certains postes et obligatoire dans d'autres. Lis les consignes propres au poste — l'IA signale mais ne pré-remplit pas.
État civil avec subtilités arabes. « ملاك » (fiancé avec contrat civil mais sans consommation) est un statut spécifique du Golfe qui ne correspond pas à « célibataire », « marié » ou « fiancé » occidentaux. Le formulaire accepte souvent une étiquette anglaise plus simple — choisis celle attendue par la destination, pas celle qui est techniquement la plus exacte.
L'entretien lui-même. Quand l'agent consulaire demande « Quel est le nom de votre père ? » en anglais, tu réponds en anglais avec la translittération du MRZ. Pas en arabe, pas avec le surnom familial. L'IA te prépare, le moment est à toi.

Pratique : un DS-160 en arabe, de bout en bout

Une demandeuse arabophone typique du Caire, de Riyad ou de Casablanca ouvre FillWizard avec trois envois :

Page photo du passeport (en arabe et en anglais).
Étiquette de l'ancien visa américain (s'il y en a un).
Récapitulatif des voyages des cinq dernières années.

L'IA extrait le nom en double graphie, convertit la date de naissance hégirienne en grégorien, normalise les chiffres de téléphone arabes orientaux en standards et pré-remplit 80 % des champs purement données du DS-160. L'écran de relecture rend le formulaire en vrai RTL : arabe à droite, translittération latine à gauche, messages de validation ancrés à droite, listes déroulantes qui s'ouvrent à droite. Tu lis du haut vers le bas, de droite à gauche, en 12 minutes environ. Puis tu recopies la liste des champs vers le CEAC et tu réponds toi-même aux questions de sécurité.

Pour le flux DS-160 plus large, voir Comment l'IA remplit le DS-160 en 4 minutes. Pour la prise en charge multilingue côté assurance, voir La prise en charge des sinistres multilingue avec l'IA.

Quoi faire cette semaine

Si tu as bientôt un formulaire en écriture arabe — une demande Schengen, un visa américain, un dossier de candidature — sors ton passeport et un formulaire que tu as rempli à la main avant. Photographie le passeport, charge l'ancien formulaire. Regarde l'IA extraire le nom en double graphie, les dates converties depuis l'hégirien, les chiffres normalisés. La première fois que tu verras l'écran de relecture s'afficher du haut vers le bas en vrai RTL, avec les erreurs ancrées à droite et l'ordre de tabulation qui suit la façon dont ton œil lit, tu arrêteras de te demander pourquoi remplir des formulaires arabes ressemblait à un combat contre l'outil. C'était l'outil.

Formulaires en arabe avec l'IA : noms en double graphie, dates hégiriennes et RTL qui fonctionnent vraiment

Noms en double graphie : la règle ICAO 9303

D'hégirien à grégorien : quel calendrier le formulaire veut-il

Le problème des chiffres

UX RTL en relecture : à quoi ressemble un bon outil

Ce qui demande encore tes yeux

Pratique : un DS-160 en arabe, de bout en bout

Quoi faire cette semaine

Liste de contrôle

Articles liés

Comment l'IA remplit le formulaire de visa DS-160 en 4 minutes (et ce qu'elle ne peut pas faire)

Déclaration d'impôts allemande avec l'IA : guide pratique d'Elster, Anlage N, KAP et S

Intake de sinistres multilingue avec l'IA : formulaires ACORD et clients qui ne parlent pas anglais