Точното извличане на броя на думите от дизайнерски файлове е една от най-важните – и най-често подценяваните – стъпки в планирането на преводачески проекти. За разлика от извличането на броя на думите от Word документи или обикновени текстови файлове, дизайнерските файлове вграждат текст в сложни структури на оформлението, които автоматизираните инструменти често не могат да разберат напълно. Неточният брой на думите води до неправилни оферти, надхвърлени бюджети и превишени срокове.
Нашият процес за извличане на броя на думите използва собственото приложение за всеки файлов формат. За Adobe InDesign използваме вградената функция за броене на думи във всички текстови връзки (истории), включително преливен текст, който не е видим на страницата, но присъства във файла. Отделно броим текста в прикрепени обекти, групирани елементи и елементи в монтажното поле, които може да са предназначени за включване. За Adobe Illustrator обхождаме всички работни пространства и слоеве, включително скритите и заключените слоеве, тъй като те често съдържат текстови варианти или съдържание на алтернативен език, което се нуждае от превод.
За FrameMaker обработваме целия файл на книгата, за да уловим текста във всички глави, включително текста на колонтитулите, съдържанието на клетките на таблиците и текста на кръстосаните препратки. За QuarkXPress извличаме текст от всички текстови полета, включително тези на основните страници. За PowerPoint улавяме съдържанието на слайдовете, бележките, бележките на лектора, alt текста и вградените етикети на диаграми.
Също така идентифицираме и отбелязваме нередактируемия текст – текст, който е растеризиран в изображения или сплескан във векторни пътища. Този текст не може да бъде извлечен и преведен чрез нормалните DTP процеси; той изисква графично пресъздаване. Докладваме тези случаи отделно, за да могат проектните мениджъри да решат дали да ги включат в обхвата или да ги доставят както са.
Окончателният доклад за броя на думите разбива броя по файлове, по тип текст (основен текст, заглавия, надписи, UI елементи) и отбелязва всякакви неясноти. Предоставяме това в табличен формат, който PM могат да използват директно за оферти. За постоянни клиенти поддържаме оценки на нивото на файла за използване на преводаческата памет, които допълнително прецизират прогнозите за разходите.