Skip to main content

Formularios en árabe con IA: nombres en doble grafía, fechas Hijri y RTL que funciona de verdad

CategoríaMultilingual Workflows
Publicado
Tiempo de lectura9 min de lectura
Documento en escritura árabe sobre un escritorio de madera, listo para revisar en un flujo de formulario de derecha a izquierda.

La mayoría de herramientas afirman soportar árabe. Mira de cerca y encontrarás una etiqueta de UI traducida y un cuadro de entrada de izquierda a derecha. El trabajo real con formularios árabes es más duro. El visado, la reclamación de seguros, el paquete de inmigración: cada uno codifica datos en tres modos que las herramientas solo-inglés nunca tuvieron que tocar:

  1. Dos grafías a la vez. Tu nombre en árabe y en transliteración latina, y deben coincidir con el pasaporte.
  2. Dos calendarios. Tu fecha de nacimiento en Hijri (con la que quizá creciste) y en gregoriano (que pide el destino).
  3. Dos sistemas numéricos. Arábigos orientales para presentación, arábigos estándar para parseo.

Si fallas uno solo, el formulario rebota. Este artículo explica cómo la IA resuelve cada uno, dónde sigue haciendo falta tu ojo y dónde está la línea entre automatización y revisión personal.

Nombres en doble grafía: la regla ICAO 9303

La norma internacional para documentos de viaje (ICAO 9303) define las reglas de romanización que usa cada pasaporte. El MRZ (zona de lectura mecánica, abajo de la página de la foto) lleva la forma latina canónica. El texto de la página de la foto lleva la forma árabe. Ambas juntas son el nombre por el que te conoce el destino.

Cuando la IA lee la imagen del pasaporte, extrae ambas:

  • Nombre árabe de la región de texto de la página de la foto: محمد عبد الله الفلاسي
  • Transliteración latina del MRZ: MOHAMMED ABDULLAH ALFLASI

Ambos entran al DS-160, la solicitud Schengen o el CV en árabe. El formulario suele pedir "Nombre completo en alfabeto nativo" y "Apellido / nombres" como campos separados. La IA rellena ambos y los muestra lado a lado para tu confirmación.

El fallo no obvio: cuando tu nombre árabe tiene vocales en el formulario pero la página de la foto del pasaporte no las tiene. El sistema de destino quita las vocales para comparar, así que مُحَمَّد y محمد coinciden. Pero quien diseñó el formulario espera que reflejes lo que muestra el pasaporte. La IA normaliza a la forma del pasaporte por defecto y te da un interruptor para añadir vocales si lo necesitas.

De Hijri a gregoriano: qué calendario quiere el formulario

Hay tres sistemas Hijri que puedes encontrar:

  • Umm al-Qura: usado por Arabia Saudí y la mayoría de oficinas diplomáticas. Basado en cálculo astronómico. El año actual es 1447 AH.
  • Hijri tabular: usado en muchos formularios tipo Excel por simplicidad. Puede diferir de Umm al-Qura en uno o dos días.
  • Hijri civil (Irán): distintos nombres de meses y base de año solar. Solo en formularios iraníes.

La mayoría de formularios de EE. UU., UE y ONU pide gregoriano. La IA convierte en segundo plano y mantiene el original Hijri visible para revisión:

  • Hijri: 5 رمضان 1432
  • Gregoriano: 5 de agosto de 2011

Cuando el formulario acepta Hijri (Absher saudí, algunas aplicaciones paquistaníes, formularios internos del Golfo), la IA mantiene el Hijri como entrada y omite la conversión. La idea es nunca sobrescribir en silencio: siempre ves ambos y el formato correcto va al sistema correcto.

El problema de los numerales

Los numerales arábigos orientales (٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩) son visualmente nativos del texto árabe y se ven correctos en un formulario impreso. Rompen casi todos los sistemas digitales: la CBP de EE. UU., portales de visado Schengen, registro de ACNUR, France Travail, Bürgergeld alemán. Todos parsean solo arábigos estándar.

La regla que aplica la IA: almacena como arábigos estándar, presenta como arábigos estándar en campos de sistema, convierte a orientales solo cuando los metadatos del formulario lo piden explícitamente (Absher saudí, algunos PDF gubernamentales iraquíes y egipcios, publicaciones árabes clásicas).

Cuando pegas un número de teléfono en arábigos orientales en un campo de sistema de EE. UU., la IA avisa:

Detectado ٠٥٠١٢٣٤٥٦٧: convirtiendo a 0501234567 por compatibilidad de sistema.

Lo ves, lo apruebas. Sin reescritura silenciosa.

UX RTL: cómo se ve uno bueno

Un formulario inglés volteado no es RTL. Una capa de revisión RTL real tiene:

  • Cursor de entrada empezando en el borde derecho del campo
  • Orden de tabulación que se mueve de derecha a izquierda
  • Mensajes de error de validación a la derecha del campo, no a la izquierda
  • Desplegables que se abren hacia la derecha
  • Texto bidireccional (nombre árabe + transliteración latina en la misma línea) que se reordena correctamente sin marcadores manuales
  • Números que se leen de izquierda a derecha dentro de una línea de derecha a izquierda (la regla estándar de tipografía árabe)
  • Secciones de formulario que avanzan de arriba abajo, pero con el orden RTL de cada sección preservado

La mayoría de herramientas acierta una o dos. Pocas aciertan las ocho. La capa de revisión de FillWizard renderiza el formulario en un DOM RTL real (dir="rtl" en la sección, no solo text-align CSS), lo que hace que lectores de pantalla, atajos del navegador y copiar-pegar funcionen como espera un lector árabe nativo.

Lo que sigue necesitando tus ojos

Cinco cosas que la IA no debe decidir por ti:

  1. Qué transliteración es la tuya. Si tu pasaporte pone Yusuf pero tu cuenta del banco pone Yousef, la IA no puede elegir. Lista todas en 'Otros nombres usados' y deja que el funcionario consular cruce.
  2. Si tu fecha Hijri es Umm al-Qura o tabular. Las partidas de nacimiento rurales de Arabia Saudí y Yemen a veces usan la tabular. Si el año está bien y el día baila uno, ahí está la pista. Confirma con el documento original antes de exportar.
  3. Afiliación religiosa en formularios de visado. Algunos formularios la piden, otros no. La solicitud Schengen la tiene como opcional en algunos puestos y obligatoria en otros. Lee la guía específica del puesto: la IA la marca pero no la rellena.
  4. Estado civil con matices árabes. "ملاك" (comprometido con contrato civil pero sin consumación) es un estado del Golfo que no mapea a "soltero", "casado" o "comprometido" occidental. El formulario suele aceptar una etiqueta inglesa más simple; elige la que espera tu destino, no la técnicamente más precisa.
  5. La propia entrevista. Cuando el funcionario consular pregunta "¿Cómo se llama tu padre?" en inglés, respondes en inglés con la transliteración del MRZ. Ni el árabe ni el apodo familiar. La IA te prepara, pero el momento es tuyo.

Práctica: un DS-160 en árabe, de principio a fin

Un solicitante árabe típico de El Cairo, Riad o Casablanca abre FillWizard con tres subidas:

  1. Página de foto del pasaporte (en árabe y en inglés).
  2. Etiqueta de visado de EE. UU. anterior (si la hay).
  3. Resumen de viajes de los últimos cinco años.

La IA extrae el nombre en doble grafía, convierte la fecha de nacimiento Hijri a gregoriano, normaliza los dígitos de teléfono arábigos orientales a estándar y rellena el 80 % de los campos puros del DS-160. La pantalla de revisión renderiza el formulario en RTL real: árabe a la derecha, transliteración latina a la izquierda, mensajes de validación anclados a la derecha, desplegables que se abren hacia la derecha. Lees de arriba abajo, de derecha a izquierda, en unos 12 minutos. Luego copias la lista de campos al CEAC y respondes las preguntas de seguridad personalmente.

Para el flujo amplio del DS-160, consulta Cómo la IA rellena el DS-160 en 4 minutos. Para solicitantes de comunidades hispanohablantes en el mismo formulario, consulta Formularios de inmigración de EE. UU. en español.

Qué hacer esta semana

Si tienes pronto un formulario en árabe (una solicitud Schengen, un visado de EE. UU., un paquete de empleo), saca tu pasaporte y un formulario anterior que rellenaste a mano. Fotografía el pasaporte, sube el formulario anterior. Mira cómo la IA extrae el nombre en doble grafía, las fechas convertidas desde Hijri y los numerales normalizados. La primera vez que veas la pantalla de revisión renderizar de arriba abajo en RTL real, con errores anclados a la derecha y orden de tabulación que fluye como tu ojo lee, dejarás de preguntarte por qué antes rellenar formularios en árabe era como pelear con la herramienta. Era la herramienta.

Lista de verificación

  • Captura el nombre en árabe de la página de la foto del pasaporte Y la transliteración latina del MRZ. Ambos van al formulario y deben coincidir exactamente con el pasaporte.
  • Convierte las fechas Hijri al gregoriano antes de enviar a sistemas de EE. UU., UE u ONU. Mantén el original Hijri visible para revisión.
  • Usa dígitos arábigos estándar (1, 2, 3) para los campos de sistema. Reserva los arábigos orientales (١، ٢، ٣) solo para contextos de visualización donde el formulario los acepte explícitamente.
  • Lista cada transliteración previa de tu nombre (Yousef, Youssef, Yusuf) bajo 'Otros nombres usados'. Las discrepancias son la primera causa de rechazo para solicitantes arabófonos.
  • Revisa el formulario rellenado en un RTL real, no en un inglés volteado. Mensajes de validación, orden de entrada y resaltado de errores deben fluir de derecha a izquierda.
F

Escrito por

FillWizard

Artículos relacionados