Hoe gaat u om met woordtelextractie uit ontworpen bestanden?

Voorbereiding en controle van bestanden vóór drukwerk Veelgestelde vragen

Hoe gaat u om met woordtelextractie uit ontworpen bestanden??

Nauwkeurige woordtelextractie uit ontworpen bestanden is een van de belangrijkste — en het meest onderschatte — stappen in de planning van vertaalprojecten. In tegenstelling tot het extraheren van woordtels uit Word-documenten of platte tekstbestanden, bevatten ontworpen bestanden tekst in complexe lay-outstructuren die geautomatiseerde hulpmiddelen vaak niet volledig kunnen parseren. Een onnauwkeurige woordtel leidt tot onjuiste offertes, overschreden budgetten en vertragingen.

Ons woordtelextractieproces gebruikt de native applicatie voor elk bestandsformaat. Voor Adobe InDesign gebruiken we de ingebouwde woordtelfunctie voor alle verhalen (tekstthreads), inclusief overlopende tekst die niet zichtbaar is op de pagina maar aanwezig is in het bestand. We tellen apart de tekst in verankerde objecten, gegroepeerde items en items op de pasteboard die mogelijk bedoeld zijn voor opname. Voor Adobe Illustrator doorkruisen we alle artboards en lagen, inclusief verborgen en vergrendelde lagen, aangezien deze vaak tekstvarianten of alternatief-taalinhoud bevatten die moeten worden vertaald.

Voor FrameMaker verwerken we het volledige bookbestand om tekst in alle hoofdstukken vast te leggen, inclusief kop-/voettekst, tabelcelinhoud en kruisverwijzingstekst. Voor QuarkXPress extraheren we tekst uit alle tekstvakken, inclusief die op modellapagina's. Voor PowerPoint leggen we dia-inhoud, notities, sprekersnotities, alternatieve tekst en ingesloten grafieklaabels vast.

We identificeren en markeren ook niet-bewerkbare tekst — tekst die is gerasterd in afbeeldingen of samengevoegd in vectorpaden. Deze tekst kan niet worden geëxtraheerd en vertaald via normale DTP-processen; het vereist grafische recreatie. We rapporteren deze instanties apart zodat projectmanagers kunnen bepalen of ze in de reikwijdte willen opnemen of deze as-is willen leveren.

Het eindrapport over woordtels geeft de tellingen uitgesplitst per bestand, per teksttype (tekst, koppen, bijschriften, UI-elementen) en markeert eventuele onduidelijkheden. We leveren dit in een spreadsheetformaat dat PM's rechtstreeks voor offertes kunnen gebruiken. Voor doorlopende klanten hanteren we estimaties van bestandsniveautranslationmemory-leverage die kostprognoses verder verfijnen.


Comments