Formularios en árabe con IA: nombres en doble grafía, fechas Hijri y RTL que funciona de verdad

La mayoría de herramientas afirman soportar árabe. Mira de cerca y encontrarás una etiqueta de UI traducida y un cuadro de entrada de izquierda a derecha. El trabajo real con formularios árabes es más duro. El visado, la reclamación de seguros, el paquete de inmigración: cada uno codifica datos en tres modos que las herramientas solo-inglés nunca tuvieron que tocar:
- Dos grafías a la vez. Tu nombre en árabe y en transliteración latina, y deben coincidir con el pasaporte.
- Dos calendarios. Tu fecha de nacimiento en Hijri (con la que quizá creciste) y en gregoriano (que pide el destino).
- Dos sistemas numéricos. Arábigos orientales para presentación, arábigos estándar para parseo.
Si fallas uno solo, el formulario rebota. Este artículo explica cómo la IA resuelve cada uno, dónde sigue haciendo falta tu ojo y dónde está la línea entre automatización y revisión personal.
Nombres en doble grafía: la regla ICAO 9303
La norma internacional para documentos de viaje (ICAO 9303) define las reglas de romanización que usa cada pasaporte. El MRZ (zona de lectura mecánica, abajo de la página de la foto) lleva la forma latina canónica. El texto de la página de la foto lleva la forma árabe. Ambas juntas son el nombre por el que te conoce el destino.
Cuando la IA lee la imagen del pasaporte, extrae ambas:
- Nombre árabe de la región de texto de la página de la foto: محمد عبد الله الفلاسي
- Transliteración latina del MRZ: MOHAMMED ABDULLAH ALFLASI
Ambos entran al DS-160, la solicitud Schengen o el CV en árabe. El formulario suele pedir "Nombre completo en alfabeto nativo" y "Apellido / nombres" como campos separados. La IA rellena ambos y los muestra lado a lado para tu confirmación.
El fallo no obvio: cuando tu nombre árabe tiene vocales en el formulario pero la página de la foto del pasaporte no las tiene. El sistema de destino quita las vocales para comparar, así que مُحَمَّد y محمد coinciden. Pero quien diseñó el formulario espera que reflejes lo que muestra el pasaporte. La IA normaliza a la forma del pasaporte por defecto y te da un interruptor para añadir vocales si lo necesitas.
De Hijri a gregoriano: qué calendario quiere el formulario
Hay tres sistemas Hijri que puedes encontrar:
- Umm al-Qura: usado por Arabia Saudí y la mayoría de oficinas diplomáticas. Basado en cálculo astronómico. El año actual es 1447 AH.
- Hijri tabular: usado en muchos formularios tipo Excel por simplicidad. Puede diferir de Umm al-Qura en uno o dos días.
- Hijri civil (Irán): distintos nombres de meses y base de año solar. Solo en formularios iraníes.
La mayoría de formularios de EE. UU., UE y ONU pide gregoriano. La IA convierte en segundo plano y mantiene el original Hijri visible para revisión:
- Hijri: 5 رمضان 1432
- Gregoriano: 5 de agosto de 2011
Cuando el formulario acepta Hijri (Absher saudí, algunas aplicaciones paquistaníes, formularios internos del Golfo), la IA mantiene el Hijri como entrada y omite la conversión. La idea es nunca sobrescribir en silencio: siempre ves ambos y el formato correcto va al sistema correcto.
El problema de los numerales
Los numerales arábigos orientales (٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩) son visualmente nativos del texto árabe y se ven correctos en un formulario impreso. Rompen casi todos los sistemas digitales: la CBP de EE. UU., portales de visado Schengen, registro de ACNUR, France Travail, Bürgergeld alemán. Todos parsean solo arábigos estándar.
La regla que aplica la IA: almacena como arábigos estándar, presenta como arábigos estándar en campos de sistema, convierte a orientales solo cuando los metadatos del formulario lo piden explícitamente (Absher saudí, algunos PDF gubernamentales iraquíes y egipcios, publicaciones árabes clásicas).
Cuando pegas un número de teléfono en arábigos orientales en un campo de sistema de EE. UU., la IA avisa:
Detectado ٠٥٠١٢٣٤٥٦٧: convirtiendo a 0501234567 por compatibilidad de sistema.
Lo ves, lo apruebas. Sin reescritura silenciosa.
UX RTL: cómo se ve uno bueno
Un formulario inglés volteado no es RTL. Una capa de revisión RTL real tiene:
- Cursor de entrada empezando en el borde derecho del campo
- Orden de tabulación que se mueve de derecha a izquierda
- Mensajes de error de validación a la derecha del campo, no a la izquierda
- Desplegables que se abren hacia la derecha
- Texto bidireccional (nombre árabe + transliteración latina en la misma línea) que se reordena correctamente sin marcadores manuales
- Números que se leen de izquierda a derecha dentro de una línea de derecha a izquierda (la regla estándar de tipografía árabe)
- Secciones de formulario que avanzan de arriba abajo, pero con el orden RTL de cada sección preservado
La mayoría de herramientas acierta una o dos. Pocas aciertan las ocho. La capa de revisión de FillWizard renderiza el formulario en un DOM RTL real (dir="rtl" en la sección, no solo text-align CSS), lo que hace que lectores de pantalla, atajos del navegador y copiar-pegar funcionen como espera un lector árabe nativo.
Lo que sigue necesitando tus ojos
Cinco cosas que la IA no debe decidir por ti:
- Qué transliteración es la tuya. Si tu pasaporte pone Yusuf pero tu cuenta del banco pone Yousef, la IA no puede elegir. Lista todas en 'Otros nombres usados' y deja que el funcionario consular cruce.
- Si tu fecha Hijri es Umm al-Qura o tabular. Las partidas de nacimiento rurales de Arabia Saudí y Yemen a veces usan la tabular. Si el año está bien y el día baila uno, ahí está la pista. Confirma con el documento original antes de exportar.
- Afiliación religiosa en formularios de visado. Algunos formularios la piden, otros no. La solicitud Schengen la tiene como opcional en algunos puestos y obligatoria en otros. Lee la guía específica del puesto: la IA la marca pero no la rellena.
- Estado civil con matices árabes. "ملاك" (comprometido con contrato civil pero sin consumación) es un estado del Golfo que no mapea a "soltero", "casado" o "comprometido" occidental. El formulario suele aceptar una etiqueta inglesa más simple; elige la que espera tu destino, no la técnicamente más precisa.
- La propia entrevista. Cuando el funcionario consular pregunta "¿Cómo se llama tu padre?" en inglés, respondes en inglés con la transliteración del MRZ. Ni el árabe ni el apodo familiar. La IA te prepara, pero el momento es tuyo.
Práctica: un DS-160 en árabe, de principio a fin
Un solicitante árabe típico de El Cairo, Riad o Casablanca abre FillWizard con tres subidas:
- Página de foto del pasaporte (en árabe y en inglés).
- Etiqueta de visado de EE. UU. anterior (si la hay).
- Resumen de viajes de los últimos cinco años.
La IA extrae el nombre en doble grafía, convierte la fecha de nacimiento Hijri a gregoriano, normaliza los dígitos de teléfono arábigos orientales a estándar y rellena el 80 % de los campos puros del DS-160. La pantalla de revisión renderiza el formulario en RTL real: árabe a la derecha, transliteración latina a la izquierda, mensajes de validación anclados a la derecha, desplegables que se abren hacia la derecha. Lees de arriba abajo, de derecha a izquierda, en unos 12 minutos. Luego copias la lista de campos al CEAC y respondes las preguntas de seguridad personalmente.
Para el flujo amplio del DS-160, consulta Cómo la IA rellena el DS-160 en 4 minutos. Para solicitantes de comunidades hispanohablantes en el mismo formulario, consulta Formularios de inmigración de EE. UU. en español.
Qué hacer esta semana
Si tienes pronto un formulario en árabe (una solicitud Schengen, un visado de EE. UU., un paquete de empleo), saca tu pasaporte y un formulario anterior que rellenaste a mano. Fotografía el pasaporte, sube el formulario anterior. Mira cómo la IA extrae el nombre en doble grafía, las fechas convertidas desde Hijri y los numerales normalizados. La primera vez que veas la pantalla de revisión renderizar de arriba abajo en RTL real, con errores anclados a la derecha y orden de tabulación que fluye como tu ojo lee, dejarás de preguntarte por qué antes rellenar formularios en árabe era como pelear con la herramienta. Era la herramienta.
Lista de verificación
- Captura el nombre en árabe de la página de la foto del pasaporte Y la transliteración latina del MRZ. Ambos van al formulario y deben coincidir exactamente con el pasaporte.
- Convierte las fechas Hijri al gregoriano antes de enviar a sistemas de EE. UU., UE u ONU. Mantén el original Hijri visible para revisión.
- Usa dígitos arábigos estándar (1, 2, 3) para los campos de sistema. Reserva los arábigos orientales (١، ٢، ٣) solo para contextos de visualización donde el formulario los acepte explícitamente.
- Lista cada transliteración previa de tu nombre (Yousef, Youssef, Yusuf) bajo 'Otros nombres usados'. Las discrepancias son la primera causa de rechazo para solicitantes arabófonos.
- Revisa el formulario rellenado en un RTL real, no en un inglés volteado. Mensajes de validación, orden de entrada y resaltado de errores deben fluir de derecha a izquierda.
Artículos relacionados
Flujos de visaCómo la IA llena el formulario DS-160 en 4 minutos (y lo que no puede hacer)
El DS-160 toma 90 minutos la primera vez y 60 la segunda. La IA llena casi todo en cuatro minutos. La entrevista sigue siendo cosa tuya y del oficial consular.
8 min de lecturaLeer más
Workflows fiscalesDeclaración de la renta alemana con IA: guía práctica de Elster, Anlage N, KAP y S
Elster es obligatorio para casi todo, pero su interfaz es dura. Así funcionan Anlage N, KAP y S en la práctica, y así los rellena la IA con tus recibos y nóminas antes de presentar por Elster.
8 min de lecturaLeer más
Workflows de segurosIntake de siniestros multilingüe con IA: formularios ACORD y clientes que no hablan inglés
Tu cliente en Queens habla español. El taller de Hialeah manda notas de voz por WhatsApp. Los ACORD solo existen en inglés. Así gestiona la IA la barrera del idioma para que el intake de siniestros pase de 50 minutos a 5.
8 min de lecturaLeer más