Skip to main content

Formulaires en arabe avec l'IA : noms en double graphie, dates hégiriennes et RTL qui fonctionnent vraiment

CatégorieMultilingual Workflows
Publié le
Temps de lecture9 min de lecture
Document en écriture arabe sur un bureau en bois, prêt pour relecture dans un flux de formulaire de droite à gauche.

La plupart des outils de formulaires prétendent gérer l'arabe. Regarde de près et tu trouves une étiquette d'interface traduite et un champ qui se remplit de gauche à droite. Le vrai travail sur les formulaires arabes est plus difficile. La demande de visa, la déclaration d'assurance, le dossier d'immigration : chacun encode les données selon trois modes qu'aucun outil purement anglophone n'a jamais eu à manipuler :

  1. Deux graphies à la fois. Ton nom en arabe et en translittération latine, et les deux doivent correspondre au passeport.
  2. Deux calendriers. Ta date de naissance en hégirien (avec lequel tu as peut-être grandi) et en grégorien (que demande la destination).
  3. Deux systèmes de chiffres. Arabes orientaux pour l'affichage, standards pour le parsing.

Si tu rates ne serait-ce qu'un seul, le formulaire revient. Cet article explique comment l'IA traite chacun, où ton œil reste indispensable, et où passe la ligne entre automatisation et relecture personnelle.

Noms en double graphie : la règle ICAO 9303

La norme internationale des documents de voyage (ICAO 9303) définit les règles de romanisation utilisées par tous les passeports. Le MRZ (zone de lecture optique, bas de la page photo) porte la forme latine canonique. Le texte de la page photo porte la forme arabe. Les deux ensemble forment le nom sous lequel ta destination te connaît.

Quand l'IA lit une image de passeport, elle extrait les deux :

  • Nom en arabe depuis la zone de texte de la page photo : محمد عبد الله الفلاسي
  • Translittération latine depuis le MRZ : MOHAMMED ABDULLAH ALFLASI

Les deux vont sur le DS-160, la demande Schengen ou le CV arabe. Le formulaire demande en général « Nom complet en alphabet d'origine » et « Nom de famille / prénoms » comme deux champs distincts. L'IA remplit les deux et les affiche côte à côte pour confirmation.

Le piège peu évident : quand ton nom arabe a des voyelles sur le formulaire et que la page photo du passeport n'en a pas. Le système de destination retire les voyelles pour comparer, donc مُحَمَّد et محمد coïncident. Mais celui qui a conçu le formulaire attend que tu reproduises le passeport. L'IA normalise par défaut vers la forme du passeport et te laisse un bouton pour ré-ajouter les voyelles si tu en as besoin.

D'hégirien à grégorien : quel calendrier le formulaire veut-il

Trois systèmes hégiriens peuvent se rencontrer :

  • Umm al-Qura — utilisé par l'Arabie saoudite et la plupart des postes diplomatiques. Calcul astronomique. L'année courante est 1447 AH.
  • Hégirien tabulaire — utilisé dans beaucoup de formulaires de type tableur pour la simplicité. Peut différer d'Umm al-Qura d'un ou deux jours.
  • Hégirien civil (Iran) — noms de mois différents et base solaire. Uniquement sur les formulaires iraniens.

La plupart des formulaires américains, européens et onusiens veulent du grégorien. L'IA convertit en arrière-plan et garde l'original hégirien visible :

  • Hégirien : 5 رمضان 1432
  • Grégorien : 5 août 2011

Quand le formulaire accepte l'hégirien (Absher saoudien, certaines demandes pakistanaises, formulaires internes du Golfe), l'IA garde l'hégirien comme entrée et saute la conversion. Le principe : ne jamais écraser en silence — tu vois toujours les deux, et le bon format va au bon système.

Le problème des chiffres

Les chiffres arabes orientaux (٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩) sont visuellement natifs du texte arabe et paraissent corrects sur un formulaire papier. Ils cassent presque tous les systèmes numériques : CBP américain, portails de visa Schengen, enregistrement HCR, France Travail, Bürgergeld allemand. Tous parsent uniquement les chiffres standards.

La règle appliquée par l'IA : stocker en chiffres standards, afficher en chiffres standards dans les champs système, convertir en orientaux seulement quand les métadonnées du formulaire le demandent explicitement (Absher saoudien, certains PDF gouvernementaux irakiens et égyptiens, publications arabes classiques).

Quand tu colles un numéro de téléphone en chiffres orientaux dans un champ système américain, l'IA prévient :

٠٥٠١٢٣٤٥٦٧ détecté — conversion en 0501234567 pour compatibilité système.

Tu le vois, tu valides. Pas de réécriture silencieuse.

UX RTL en relecture : à quoi ressemble un bon outil

Un formulaire anglais inversé n'est pas un RTL. Une vraie couche de relecture RTL a :

  • Le curseur de saisie qui démarre à droite du champ
  • L'ordre de tabulation qui va de droite à gauche
  • Les messages d'erreur de validation qui apparaissent à droite du champ, pas à gauche
  • Les listes déroulantes qui s'ouvrent vers la droite
  • Le texte bidirectionnel (nom arabe plus translittération latine sur la même ligne) qui se réordonne correctement sans marqueur manuel
  • Les nombres qui se lisent de gauche à droite à l'intérieur d'une ligne autrement de droite à gauche (règle typographique arabe standard)
  • Les sections du formulaire qui progressent du haut vers le bas, avec l'ordre RTL de chaque section conservé

La plupart des outils en cochent une ou deux. Peu cochent les huit. La couche de relecture de FillWizard rend le formulaire dans un DOM RTL réel (dir="rtl" sur la section, pas seulement un text-align CSS), si bien que les lecteurs d'écran, les raccourcis du navigateur et le copier-coller fonctionnent comme un lecteur arabe natif s'y attend.

Ce qui demande encore tes yeux

Cinq choses que l'IA ne doit pas décider à ta place :

  1. Quelle translittération est la tienne. Si ton passeport dit Yusuf et ton compte bancaire Yousef, l'IA ne peut pas choisir. Liste-les toutes dans « Autres noms utilisés » et laisse l'agent consulaire faire le rapprochement.
  2. Si ta date hégirienne est Umm al-Qura ou tabulaire. Les actes de naissance des zones rurales d'Arabie saoudite et du Yémen utilisent parfois le tabulaire. Si l'année colle et que le jour est décalé d'un, c'est l'indice. Confirme avec le document d'origine avant l'export.
  3. Appartenance religieuse sur les formulaires de visa. Certains la demandent, d'autres non. Le formulaire Schengen la place en optionnelle dans certains postes et obligatoire dans d'autres. Lis les consignes propres au poste — l'IA signale mais ne pré-remplit pas.
  4. État civil avec subtilités arabes. « ملاك » (fiancé avec contrat civil mais sans consommation) est un statut spécifique du Golfe qui ne correspond pas à « célibataire », « marié » ou « fiancé » occidentaux. Le formulaire accepte souvent une étiquette anglaise plus simple — choisis celle attendue par la destination, pas celle qui est techniquement la plus exacte.
  5. L'entretien lui-même. Quand l'agent consulaire demande « Quel est le nom de votre père ? » en anglais, tu réponds en anglais avec la translittération du MRZ. Pas en arabe, pas avec le surnom familial. L'IA te prépare, le moment est à toi.

Pratique : un DS-160 en arabe, de bout en bout

Une demandeuse arabophone typique du Caire, de Riyad ou de Casablanca ouvre FillWizard avec trois envois :

  1. Page photo du passeport (en arabe et en anglais).
  2. Étiquette de l'ancien visa américain (s'il y en a un).
  3. Récapitulatif des voyages des cinq dernières années.

L'IA extrait le nom en double graphie, convertit la date de naissance hégirienne en grégorien, normalise les chiffres de téléphone arabes orientaux en standards et pré-remplit 80 % des champs purement données du DS-160. L'écran de relecture rend le formulaire en vrai RTL : arabe à droite, translittération latine à gauche, messages de validation ancrés à droite, listes déroulantes qui s'ouvrent à droite. Tu lis du haut vers le bas, de droite à gauche, en 12 minutes environ. Puis tu recopies la liste des champs vers le CEAC et tu réponds toi-même aux questions de sécurité.

Pour le flux DS-160 plus large, voir Comment l'IA remplit le DS-160 en 4 minutes. Pour la prise en charge multilingue côté assurance, voir La prise en charge des sinistres multilingue avec l'IA.

Quoi faire cette semaine

Si tu as bientôt un formulaire en écriture arabe — une demande Schengen, un visa américain, un dossier de candidature — sors ton passeport et un formulaire que tu as rempli à la main avant. Photographie le passeport, charge l'ancien formulaire. Regarde l'IA extraire le nom en double graphie, les dates converties depuis l'hégirien, les chiffres normalisés. La première fois que tu verras l'écran de relecture s'afficher du haut vers le bas en vrai RTL, avec les erreurs ancrées à droite et l'ordre de tabulation qui suit la façon dont ton œil lit, tu arrêteras de te demander pourquoi remplir des formulaires arabes ressemblait à un combat contre l'outil. C'était l'outil.

Liste de contrôle

  • Capture le nom en arabe depuis la page photo du passeport ET la translittération latine depuis le MRZ. Les deux vont au formulaire et doivent correspondre exactement au passeport.
  • Convertis les dates de naissance hégiriennes en grégorien avant tout envoi aux systèmes américains, européens ou onusiens. Garde l'original hégirien visible pour relecture.
  • Utilise les chiffres arabes standards (1, 2, 3) pour les champs système. Réserve les chiffres arabes orientaux (١، ٢، ٣) aux contextes d'affichage où le formulaire les accepte explicitement.
  • Liste chaque translittération précédente de ton nom (Yousef, Youssef, Yusuf) dans 'Autres noms utilisés'. Les écarts sont la première cause de rejet pour les demandeurs arabophones.
  • Relis le formulaire rempli dans un vrai layout RTL, pas un anglais inversé. Les messages de validation, l'ordre de saisie et la mise en évidence des erreurs doivent tous couler de droite à gauche.
F

Écrit par

FillWizard

Articles liés