La extracción precisa del recuento de palabras a partir de archivos diseñados es uno de los pasos más importantes —y más frecuentemente subestimados— en la planificación de proyectos de traducción. A diferencia de la extracción del recuento de palabras de documentos de Word o archivos de texto plano, los archivos diseñados incrustan texto dentro de estructuras de maquetación complejas que las herramientas automatizadas a menudo no pueden analizar completamente. Un recuento de palabras inexacto conduce a presupuestos incorrectos, sobrecostos y retrasos en los plazos.
Nuestro proceso de extracción del recuento de palabras utiliza la aplicación nativa para cada formato de archivo. Para Adobe InDesign, empleamos la función de recuento de palabras integrada en todas las historias (cadenas de texto), incluyendo texto excedente que no es visible en la página pero está presente en el archivo. Contabilizamos por separado el texto en objetos anclados, elementos agrupados e elementos en la mesa de trabajo que pueden estar destinados a su inclusión. Para Adobe Illustrator, recorremos todas las mesas de arte y capas, incluyendo capas ocultas y bloqueadas, ya que frecuentemente contienen variantes de texto o contenido en idiomas alternativos que requieren traducción.
Para FrameMaker, procesamos el archivo de libro completo para capturar texto en todos los capítulos, incluyendo texto de encabezados/pies de página, contenido de celdas de tabla y texto de referencias cruzadas. Para QuarkXPress, extraemos texto de todas las cajas de texto, incluyendo las de las páginas maestras. Para PowerPoint, capturamos contenido de diapositivas, notas, notas del orador, texto alternativo y etiquetas de gráficos incrustados.
También identificamos y marcamos texto no editable —texto que ha sido rasterizado en imágenes o aplanado en trazados vectoriales. Este texto no se puede extraer ni traducir mediante procesos DTP normales; requiere recreación gráfica. Reportamos estas instancias por separado para que los gestores de proyectos decidan si incluirlas en el alcance o entregarlas tal como están.
El informe final del recuento de palabras desglosa los recuentos por archivo, por tipo de texto (cuerpo, encabezados, leyendas, elementos de interfaz) e indica cualquier ambigüedad. Lo proporcionamos en formato de hoja de cálculo que los gestores pueden utilizar directamente para presupuestos. Para clientes continuos, mantenemos estimaciones de aprovechamiento de la memoria de traducción a nivel de archivo que refinan aún más las proyecciones de costos.