Go to main content

Waarom gestructureerde content nog steeds niet de norm is bij documentbeheer

Julianna Carlson-van Kleef

localisation-specialist-looking-at-terminology-2.webp

Samenvatting:

Gestructureerde content belooft hergebruik, schaalbaarheid en efficiënte lokalisering. De meeste ondernemingen vertrouwen echter nog steeds op ongestructureerde of deels gestructureerde opstellingen. De drempels zijn zelden van technische aard, maar hebben eerder een organisatorische grondslag: verouderde tools, angst voor complexiteit en geïsoleerde workflows. Zodra lokalisatie in de workflow wordt opgenomen, krijgt de structuur van je content een nog grotere betekenis. Documentatie wordt schaalbaar wanneer de contentarchitectuur wordt afgestemd op de lokalisatieprocessen.

Teams die werken met technische en regelgevingsdocumentatie staan vandaag meer dan ooit onder druk.

Schrijvers moeten steeds sneller werk leveren, meer productvarianten en uitvoerformaten ondersteunen, zonder de consistentie, nauwkeurigheid en naleving van regelgeving uit het oog te verliezen. Tegelijkertijd willen teams minder handmatig werk uitvoeren, repetitieve updates wegwerken en steeds complexere herzieningen stroomlijnen.

Lokalisatie maakt alles nog wat ingewikkelder.

Veel organisaties zagen vertaling als iets dat niets te maken had met het documentatieteam. Documenten werden pas vertaald zodra het originele bronmateriaal was goedgekeurd. Wanneer de bron klaar was, werden bestanden aan een regionaal kantoor, een intern team of een externe leverancier doorgegeven. Aanpassingen werden via e-mail gecommuniceerd en bijgehouden in Excel-bestanden. Documentatieteams kregen zo nauwelijks iets te zien van het lokalisatieproces.

Dat is nu aan het veranderen.

Content wordt nu overal op hetzelfde moment vrijgegeven. Producten worden in meerdere markten tegelijk gelanceerd. Updates moeten gelijktijdig worden doorgevoerd in alle talen. Vertaling is niet meer die laatste stap, maar zit ingebed in de levenscyclus van de documentatie.

Daarom heeft de manier waarop content wordt gestructureerd (of net niet) een rechtstreekse impact op hoe beheersbaar dit allemaal blijft.

Industry estimates suggest that up to 90% of enterprise data is unstructured Dat cijfer omvat alle bedrijfsgegevens en doelt niet specifiek op technische documentatie. Maar de boodschap is wel duidelijk: ongestructureerde content is nog steeds de norm.

Dat geeft teams die met bedrijfsdocumentatie werken iet om over na te denken? Als het structureren van content hergebruik, schaalbaarheid, AI-gereedheid en een efficiënte lokalisatie mogelijk maakt, waarom gebeurt dit dan niet standaard?

Gestructureerde, niet-gestructureerde of deels gestructureerde content: wat is het verschil?

Om te begrijpen waarom dit zelden wordt toegepast, moeten we eerst weten hoe content in de praktijk wordt uitgebouwd en wat dit betekent voor schaalbaarheid en lokalisatie.

Ongestructureerde content

Ongestructureerde content wordt opgesteld zonder duidelijk contentmodel of regels voor structuur. Deze content bestaat doorgaans als vrijstaande documenten (Word-bestanden, pdf's, statische webpagina's of ander media). De indeling beïnvloedt het uiterlijk, maar niet de betekenis.

Koptekst mag dan wel op koptekst lijken, maar het system herkent dit niet als een specifieke soort content, zoals een taak, waarschuwing of definitie. Content wordt in documentvorm opgesteld en niet als meerdere componenten.

Het resultaat:

  • Hergebruik gebeurt handmatig

  • Updates betekenen repetitief werk

  • Lokalisatie gebeurt doorgaans op basis van bestanden

  • Beperkte automatisering

In tegenstelling tot gestructureerde gegevens, laat ongestructureerde content zich niet netjes onderbrengen in rijen en kolommen. Het is dan ook moeilijker om dit soort content consistent op schaal te brengen, te analyseren en te automatiseren.

Gestructureerde content

Gestructureerde content wordt volgens vooraf opgestelde regels georganiseerd. In plaats van één lang document te produceren, stellen auteurs herbruikbare componenten op (taken, concepten, verwijzingen, waarschuwingen) aan de hand van een bepaalde structuur.

Deze regels (ofwel contentmodel of informatiearchitectuur) bepalen hoe content wordt aangemaakt en opgeslagen. Gestructureerde content onderscheidt zich voornamelijk door betekenis en voorstelling gescheiden te houden. Alle onderdelen krijgen een tag; lay-out en ontwerp worden afzonderlijk behandeld.

Dankzij deze scheiding kun je content sneller hergebruiken, bijwerken, publiceren in al je kanalen en consistent lokaliseren.

Denk aan XML, DITA, componentgebaseerde CMS-platformen en onderwerpgebaseerde auteurstools zoals Paligo.

Een voorbeeld uit de praktijk

Stel je een eenvoudige veiligheidskennisgeving voor.

  • Ongestructureerd (Word/pdf)

    Waarschuwing: Niet bedienen boven 50 °C.

    De temperatuurgrens wordt opgetrokken naar 55 °C:

    • Elk document moet worden opgezocht en bijgewerkt

    • Elk bestand moet opnieuw worden vertaald

    • Vertalers kijken het volledige segment opnieuw na

    • Er is risico op inconsistente updates

    • De lay-out van elke taalversie moet misschien worden aangepast

    Hoewel je maar één waarde aanpaste, gaat de volledige zin weer door de molen.

  • Gestructureerd (XML/DITA)

    Niet bedienen boven 50 °C.



    De waarde verandert:

    • De update wordt centraal doorgevoerd

    • Alle output wordt automatisch bijgewerkt

    • Vertaalgeheugens vinden het grootste deel van de zin terug

    • Alleen het aangepaste element moet worden nagekeken

    • Elke aanpassing moet niet handmatig worden opgevolgd

    • Online content, pdf en in-product help komen allemaal voort uit dezelfde bron.

    Dit lijkt misschien een klein detail in je activiteiten, maar voor je bedrijf is het verschil doorslaggevend omdat dit honderden documenten en talen beïnvloedt.



    De structuur van je content heeft een rechtstreekse impact op hoeveel handmatig werk je team moet uitvoeren.

  • Deels gestructureerde content

    Tussen volledig ongestructureerde en volledig gestructureerde content heb je deels gestructureerde content.

    In dit geval is er sprake van enkele regels of sjablonen, maar dan zonder een formeel contentmodel dat contenttypes en -relaties duidelijk afbakent.

    Denk bijvoorbeeld aan CMS- of CCMS-sjablonen met vooraf gedefinieerde velden, Markdown-documenten, gestructureerde Word-sjablonen of modulaire blokken webcontent.

    Je hebt wat beheer en consistentie, maar betekenis en voorstelling zijn niet volledig gescheiden en content wordt niet altijd opgeslagen als volledig onafhankelijke, herbruikbare componenten.

    Hergebruik is mogelijk, maar in beperkte mate. Er is sprake van automatisering, maar enkel gedeeltelijk Lokalisatie kan worden gestroomlijnd, maar niet volledig worden geïntegreerd.

    Voor veel ondernemingen is dit compromis de realiteit.

Maar als gestructureerde content zo krachtig is, waarom vermijden al die ondernemingen het dan?

De voordelen zijn duidelijk, voor de schaalbaarheid valt veel te zeggen, en toch wordt dit maar beperkt toegepast. De redenen hiervoor zijn zelden technisch, maar eerder organisatorisch.

1. Verouderde tools

Veel documentteams werken met de tools die ze kennen. Google Docs voor kleinere organisaties of het oude, vertrouwde Microsoft Office-ecosysteem voor grotere ondernemingen, bijvoorbeeld. In beide gevallen denkt men waarschijnlijk hetzelfde: roeien met de riemen die je hebt.

Gespecialiseerde software voor gestructureerd schrijven vergt meer dan enkel installatie. Je moet een business case hebben, de belanghebbenden moeten op dezelfde lijn zitten, je hebt opleiding, nieuwe beheersregels en herontworpen workflows nodig. Geen kleine upgrade dus, maar een aardverschuiving.

Voor teams die het nu al moeilijk hebben door lanceringscycli en meertalige vereisten, kan een dergelijke transformatie erg verstorend aanvoelen. Zelfs wanneer de voordelen op de lange termijn duidelijk zijn, is de kortetermijnbelasting niet te onderschatten. En dus gaan we verder met de bestaande set-up.

Werk jij ook met drukwerk, pdf's of andere verouderde indelingen?

2. Schrik voor complexiteit

Technische content wordt vaak als eerste gestructureerd beheerd: XML-schema's, DITA-specialisatie, beheer van metadata, herontwerp van informatiearchitectuur.

Voor ervaren documentatieteams is dit doorgaans geen probleem. Voor kleinere teams, of als documentatie ook onder marketing of ondersteuning valt, kan dit best overweldigend zijn.

Niet elke organisatie beschikt over een speciale functie voor technisch en regelgevend schrijven. In sommige bedrijven wordt documentatie verdeeld over meerdere functies. In deze context kan het lijken dat nieuwe terminologie en workflows eerder wrijving toevoegt dan wegneemt.

Op lange termijn vereenvoudigt gestructureerd schrijven vaak de activiteiten. Maar in de beginfases zorgt het voor verandering, en verandering vereist je vertrouwen, ervaring en investering.

Zonder een duidelijke begeleiding dreigt schrik voor complexiteit een tastbare drempel te worden.

Weet je niet goed hoe je jouw documentworkflows hoort te vereenvoudigen of op te schalen, ongeacht je huidige set-up? Wij kunnen je helpen de juiste aanpak voor je organisatie te vinden.

3. Werken in silo's

Gestructureerde content heeft betrekking op meer dan één team. Het beïnvloedt productontwikkeling, IT, online, marketing en lokalisatie. Beslissingen over contentmodellen hebben hun impact op publicatieworkflows, integraties en vertaalprocessen.

Wanneer deze functies los van elkaar bestaan, is het niet duidelijk wie net waar mee bezig is.

  • Wie bepaalt het model?

  • Wie doet het onderhoud?

  • Wie zorgt voor de fondsen?

  • Wie leidt de lokalisatie in goede banen?

Zonder een gedeeld beheer, valt het initiatief stil. Ambitie is goed, maar zolang niet alle neuzen in dezelfde richting staan, valt de implementatie uit elkaar.

Dankzij integraties en API's kan elke afdeling lokalisatie aan de eigen omgeving koppelen en het rechtstreeks in de bestaande systemen en workflows verankeren. Marketingteams lokaliseren hun content vanuit het eigen CMS, ontwikkelaars automatiseren workflows met API's en andere teams blijven hun vertrouwde tools gebruiken. Niemand hoeft anders te werk te gaan, maar de meertalige content wordt wel efficiënt opgeschaald.

4. Gebrek aan eensgezinde lokalisatie

Deze uitdaging wordt nog heel vaak over het hoofd gezien Veel teams bekijken gestructureerde content als een publicatiekwestie, waarbij ze zich richten op hergebruik en output in meerdere kanalen. Aan lokalisatie wordt soms pas later gedacht.

Maar dat is nu verleden tijd. Meertalige updates gebeuren nu gelijktijdig. Gestructureerde content komt het meest tot z'n recht wanneer lokalisatieworkflows van bij het begin worden ingebouwd.

  • Wanneer connectors het verwerken van bestanden automatiseren.

  • Wanneer vertaalgeheugens en herbruikbare componenten samenkomen.

  • Wanneer terminologie centraal wordt beheerd.

Zonder deze afstemming kunnen zelfs de best gestructureerde omgevingen problemen ondervinden van duplicatie en manuele tussenkomst.

Gestructureerde content op zich biedt geen gegarandeerde efficiëntie.

Content- en lokalisatiearchitectuur moeten hand in hand evolueren.

Wat is een contentmodel, en waarom is het belangrijk?

Een contentmodel bepaalt de contenttypes en geeft aan welke elementen ze bevatten en wat hun onderlinge relatie is.

In gestructureerde omgevingen maken schrijvers componenten aan binnen dit kader. Deze inperking maakt voorspelbaarheid, hergebruik, publicatie in meerdere kanalen en een duidelijkere vertaalsegmentatie mogelijk.

Het contentmodel geeft structuur. De operationele impact wordt zichtbaar wanneer we gaan hergebruiken.

Maar wat betekent dat nu echt, content hergebruiken?

Hergebruik is geen kwestie van kopiëren en plakken. Het wil zeggen dat een goedgekeurde component in verschillende handleidingen, indelingen en talen wordt gebruikt. Je werkt iets eenmaal bij en publiceert het overal.

Zo wordt het voor wereldwijde ondernemingen eenvoudiger om tekst te produceren, vertaling wordt goedkoper, er is minder nalevingsrisico en de marktintroductietijd wordt ingekort.

Worden verschillende contenttypes op dezelfde manier gelokaliseerd?

Nee hoor. De structuur van je content bepaalt je lokalisatieworkflow.

In ongestructureerde omgevingen gebeurt lokalisatie doorgaans met bestanden en komt er best wat handmatig opmaak- en lay-outwerk bij kijken. Dit heet dan desktoppublishing (DTP), waarbij vertaalde content met de hand in het ontwerp en de opmaak moet worden ingepast, vaak met repetitieve updates tot gevolg.

Deels gestructureerde systemen laten al wat automatisering toe, maar de kans op inconsistenties en de manuele voorbereiding blijven bestaan.

In volledig gestructureerde omgevingen vergroot segmentatie op componentniveau het hergebruik uit vertaalgeheugens en dringt het duplicatie terug, zolang lokalisatie van bij het begin is ingebouwd.

Structuur ondersteunt efficiëntie. Maar integratie bepaalt of die efficiëntie ook wordt gerealiseerd.

Een optimale lokalisatie kan ook zonder volledig gestructureerd beheer

De meeste ondernemingen werken in een soort hybride systeem: verouderde pdf's, deels gestructureerde CMS-content en volledig gestructureerde XML- of DITA-systemen. Een doeltreffende lokalisatiestrategie ondersteunt ze allemaal.

Bij LanguageWire werken we met teams voor technische documentatie voor alle contentindelingen en -omgevingen, van workflows met veel DTP-werk tot XML-gebaseerde gestructureerde content. We connecteren hiervoor met de gebruikte tools en systemen, bijvoorbeeld Paligo, Git, MadCap IXIA, Adobe Experience Manager, en Zendesk Knowledge.

Het doel is niet om een te snelle structurele transformatie te forceren.

We willen ervoor zorgen dat jouw documentatie (gestructureerd, deels gestructureerd of helemaal niet) schaalbaar, consistent en klaar voor lokalisatie is. Want optimalisatie is niet gelijk aan volledige perfectie.

Gestructureerde content mag dan wel niet de norm zijn, maar schaalbare lokalisatie zou dat wel moeten zijn

Gestructureerd schrijven is aan een opmars bezig. Documentatie die klaar is voor AI zorgt voor een versnelde toepassing, terwijl connectors en integraties knelpunten wegwerken, maar verandering is een traag proces. Intussen moeten documentatieteams wel blijven presteren: voor alle producten, in alle indelingen en talen.

Of je nu volledig gestructureerd te werk gaat of je oude systemen blijft gebruiken, er is één constante: globale documentatie moet op schaal worden gebracht.

En schaalbaarheid is net zo afhankelijk van workflowintegratie dan van contentstructuur.

Wil je anders omgaan met technische documentatie, gestructureerd beheer of niet, wij staan voor je klaar.

Zorg ervoor dat je technische en regelgevingsdocumentatie vanaf dag één kan worden gelokaliseerd.

Vermijd dubbel werk, ga voor minder uitzonderingen en lanceer met vertrouwen in elke markt.