Strukturierte und unstrukturierte Dokumente

Ein strukturiertes Dokument enthält sowohl Text als auch Elemente einer Auszeichnungssprache. Elemente einer Auszeichnungssprache legen unter anderem die Eigenschaften des Texts mithilfe von Auszeichnungsmarken, so genannten Tags, fest. So wird das Dokument gegliedert und die unterschiedlichen Textabschnitte (Überschriften, Sicherheitshinweise usw.) gekennzeichnet.

Auszeichnungssprachen werden meist auf der Basis des ISO-Standards SGML definiert. Dabei wird die Struktur von Dokumenten in einer separaten Datei festgelegt, der so genannten DTD (Document Type Definition).

Ein Congree Authoring Client erwartet als Eingabe strukturierte Dokumente (z. B. SGML- oder XML-Dokumente). Die jeweils zu Grunde liegende Definition der benutzten Strukturauszeichnungselemente dient der präzisen Steuerung der Congree Linguistic Engine-Prüfungen.

Unstrukturierte Dokumentformate verfügen in der Regel über Absatzformate, mithilfe derer z. B. das Dokument-Layout gesteuert werden kann. Wenn bestimmte Absatzformate besonders behandelt werden sollen, benötigt die Sprachprüfung eine DTD-Interpretation.