genal(1M) genal(1M)
NAME
genal - Programm zur Generierung der deutschen Ausnahmeliste
SYNTAX
/usr/bin/genal
BESCHREIBUNG
Mit dem Kommando genal wird eine neue Ausnahmeliste für die deutsche
Silbentrennung generiert. Die Datei der Ausnahmeliste kann von einem
Benutzer mit entsprechender Berechtigung mittels eines beliebigen Edi-
tors bearbeitet und dann ausführbar gemacht werden. Allerdings sind
hierbei einige Besonderheiten zu beachten.
Deutsche und englische Silbentrennung
Bei der Formatierung von Texten mit der Documenter's Workbench (DWB)
besteht die Möglichkeit, je nachdem, ob es sich um einen deutschen
oder englischen Text handelt, eine sprachspezifische Silbentrennung
einzuschalten. Die Einstellung der sprachspezifischen Silbentrennung
erfolgt mit dem Makro
.la [language]
Dabei bedeutet:
.la G deutsche Silbentrennung,
.la E englische Silbentrennung.
Voreingestellt ist die deutsche Silbentrennung, d. h. .la G oder nur
.la ohne Parameter. Die sprachspezifsche Einstellung wird direkt an
einer beliebigen Stelle (meist am Anfang) in der Textdatei oder in
einer Include-Datei (.so) vorgenommen. Bei "gemischtsprachigen" Doku-
menten mit deutschen und englischen Texten zusammen kann also mehrfach
die Silbentrennung gewechselt werden.
Zu beachten ist, daß standardmäßig keine Silbentrennung erfolgt (außer
in Wörtern, die die Zeichen "-" oder "\(em" [Minuszeichen, Gedanken-
strich; vgl. roff-charset(5)] enthalten, wo selbst bei ausgeschalteter
Silbentrennung noch getrennt wird). Das bedeutet, daß die Silbentren-
nung immer explizit eingeschaltet werden muß! Dies geschieht mit dem
Makro
.hy [N] (hyphenation)
direkt in der Quelldatei oder im zugrundegelegten Makropaket. Mit
anderen Worten:
⊕ Das Makro .la schaltet nicht implizit das Makro .hy ein.
⊕ Getrennt wird erst vom Aufruf des Makros .hy an.
Seite 1 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
Der Parameter N des Makros .hy hat folgende Bedeutung:
1 Silbentrennung ohne Einschränkung
2 keine Silbentrennung bei Seitenwechsel
4 kein Abtrennen der letzten beiden Buchstaben eines Wortes
8 kein Abtrennen der ersten beiden Buchstaben eines Wortes
0 Ausschalten der Silbentrennung (= .nh)
Die Werte 2, 4 und 8 lassen sich beliebig kombinieren, so daß z. B.
.hy 14 alle drei Einschränkungen zur Folge hat. .hy ohne Parameter ist
identisch mit .hy 1 (keine Einschränkung).
Kontrolle der Silbentrennung
Ob die Silbentrennung von nroff(1M) korrekt erfolgte, kann mit dem
Kommando hyphen(1M) überprüft werden. Dieses Kommando listet alle Wör-
ter mit Trennstrichen am Zeilende von einem formatierten Text auf.
Verwendet man hyphen als Filter, so kann man etwa mit folgendem Aufruf
die Silbentrennung von einer Datei textfile kontrollieren:
tbl textfile | neqn | nroff -man -Tlp | col -x | hyphen
Beeinflussung der Silbentrennung
Wenn die Silbentrennung fehlerhaft ist, gibt es zwei Möglichkeiten,
sie zu beeinflussen:
1) direkt im Text durch Markierung einer Solltrennstelle oder mit
Hilfe des Makros .hw (für den normalen Benutzer)
2) durch die Pflege einer (deutschen) Ausnahmeliste (nur für den
Systemverwalter).
Die Markierung einer Solltrennstelle direkt im Text erfolgt durch die
Eingabe der Zeichenfolge
\%
(falls nicht mit dem Makro .hc c ein anderes Trennvorschlagszeichen
spezifiziert wurde).
Besonders in deutschen Texten mit langen Wörtern ist es oft ange-
bracht, manuell eine mögliche Trennstelle im Wort vorzugeben. Das Wort
"Netzverwaltungsdateien" zum Beispiel wäre dann in der Quelldatei wie
folgt zu editieren: Netz\%ver\%wal\%tungs\%da\%tei\%en.
Seite 2 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
Daneben kann eine Solltrennstelle auch mit Hilfe des Makros
.hw word
vorgegeben werden. Dabei werden die Trennstellen durch Bindestriche
markiert, zum Beispiel: .hw durch-ein-an-der. Die Länge des Arguments
word beträgt 256 Bytes, die maximale Anzahl der Trennstellen pro Wort
ist 20.
Achtung:
Wird eine mögliche Trennstelle in einem Wort vorgegeben, trennt
n/troff nur noch an dieser Stelle (und beim Zeichen "-"). Daher ist es
sicherer, alle Solltrennstellen vorzugeben (wie im Beispiel oben).
Die Silbentrennung kann auf zwei Arten unterdrückt werden: generell
oder nur für ein einzelnes Wort. Generell wird die Silbentrennung mit
Hilfe der Makros
.nh bzw. .hy 0
unterdrückt.
Bei einem einzelnen Wort wird die Silbentrennung unterdrückt, indem
entweder
- ein \% an den Anfang des Wortes gesetzt wird oder
- durch Einfügen der Sonderzeichen "\(hy" (= -), "\(mi" (= -) oder
"\-" (= -) [siehe roff-charset(5)] in einem zusammengesetzten Wort.
Zwei Beispiele für das Unterdrücken der Silbentrennung in einem ein-
zelnen Wort:
\%automount oder PPP\(hyPaket.
Eleganter (aber auch aufwendiger) als die Trennvorgabe direkt im Text
ist die zweite Möglichkeit, über eine Ausnahmeliste Silbentrennstellen
vorzugeben. Dieses Verfahren lohnt sich bei häufig gebrauchten Wörten,
die systematisch falsch getrennt werden. Allerdings gilt die Ein-
schränkung, daß eine wartbare Ausnahmeliste nur für die deutsche Sil-
bentrennung existiert. Gleichwohl können in dieser Liste natürlich
auch englische Wörter eingetragen werden.
BEARBEITUNG DER AUSNAHMELISTE
Die Ausnahmeliste besteht insgesamt aus drei einzelnen Dateien:
ausnahme.txt, ausnahme.dat und ausnahme.ind. Diese Dateien liegen in
dem Verzeichnis /usr/lib. Einträge werden vom Benutzer nur in der Ein-
gabedatei ausnahme.txt vorgenommen, die beiden anderen Index-Dateien
werden erzeugt und sind nicht lesbar. Um Einträge vorzunehmen, ist die
Superuser-Berechtigung erforderlich. Die Bearbeitung der Ausnahmeliste
ist etwas kompliziert und soll daher ausführlich beschrieben werden.
Seite 3 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
Die Wörter bzw. Wortteile der Ausnahmeliste sind doppelt markiert:
a) am Beginn eines Eintrags durch einen Kennbuchstaben (Typenkennung),
der den Eintrag als Wortstamm, Wortanfang, Wortform, Fremdwort usw.
kennzeichnet;
b) innerhalb eines Eintrags durch eine Ziffer von 1 bis 4, die die
Trennstelle selbst spezifiziert.
Kennbuchstaben der Ausnahmeliste
Es folgt zunächst eine Liste der Kennbuchstaben und ihrer Bedeutungen.
a Normales Ausnahmewort (nur Wortform), d. h. das Wort kommt immer
nur für sich allein als Einzelwort vor.
Beispiele: wor-un-ter; wor-an (Eintrag: awor1un1ter; awor1an)
b Normales Ausnahmewort Wortanfang und Wortform), d. h. das Wort
kommt sowohl für sich allein vor wie auch als Anfang von zusam-
mengesetzten Wörtern.
Beispiele: Zeug-nis, Zeug-nis-ses, Zeug-nis-ar-ten (Eintrag:
bzeug1nis)
c Normales Ausnahmewort (nur Wortanfang), d. h. das Wort kommt nur
als Beginn eines zusammengesetzten Wortes vor; einem so gekenn-
zeichneten Wort muß in Texten immer ein weiterer Wortteil von
mindestens zwei Buchstaben folgen.
Beispiele: zi-vi-li-siert, zi-vi-li-sier-te (Eintrag: czi1vi1li)
e Eigenname (an den Namen kann auch die Endung "s" angehängt wer-
den).
Beispiele: Ar-me-ni-en (Eintrag: ear1me1ni1en)
f Fremdwort; das Wort kann als selbständiges Wort, als Wortanfang
in zusammengesetzten Wörtern und mit der Endung "s" vorkommen.
Beispiele: Bo-nus, bo-nus-ar-tig (Eintrag: fbo1nus)
g Fremdwort (nur Wortanfang), d. h. das Wort wird immer mit einem
weiteren Wortteil (mindestens zwei Buchstaben) zu einer Zusammen-
setzung verbunden.
Beispiele: Log-arith-mus, log-arith-misch (Eintrag: glog1arith)
k Kundeneintrag; Normales Ausnahmewort (nur Wortform), d. h. das
Wort kommt immer nur für sich allein als Einzelwort vor (wie a).
Seite 4 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
v Stamm von Verben auf "-en".
Beispiele: gra-sen, gra-sen-de, Gras-an-satz (Eintrag: vgras)
w Stamm von Verben auf "-eln" und "-ern", einschließlich der beiden
Nachsilben "el" und "er".
Beispiele: bet-teln, Bet-tel, Bett-ler, bet-teln-de (Eintrag:
wbet1tel); zau-bern, Zau-be-rer, Zau-ber-kunst (Eintrag:
wzau1ber)
z Wortform aus Stamm und Endung, die in Wortzusammensetzungen
benutzt wird.
Beispiele: Wis-sens, Wis-sens-art (Eintrag: zwis1sens)
Alle Einträge in der Ausnahmedatei müssen in Kleinbuchstaben erfolgen.
Trennstellen-Ziffern
Die Trennstellen selbst sind durch folgende Ziffern gekennzeichnet:
1 Normale Trennstelle.
Beispiel: ain1itia1ti1ve (-> In-itia-ti-ve)
2 Unästhetische Trennstelle (nicht zu verwenden!).
Unästhetische Trennungen sind unter anderem solche, bei denen die
beiden ersten oder letzten Buchstaben eines Wortes abgetrennt
werden. Eine derartige Trennung muß explizit mit .hy 1 (= unein-
geschränkte Silbentrennung) zugelassen werden. Bei Tests zeigte
sich, daß Wörter in der Ausnahmeliste, die mit der Ziffer 2 für
eine unästhetische Trennstelle markiert waren, anschließend vom
System nicht erkannt wurden. Wenn sie jedoch mit der Ziffer 1
markiert waren, wurden die Trennstellen bei uneingeschränkter
Silbentrennung auch als unästhetische Trennstelle erkannt. Der
Fehler ist somit einfach zu umgehen. Die Ursache des Fehlers ist
unbekannt.
3 Trennstelle bei Konsonanten-Ergänzung.
Beispiel: bschif3fahrt (-> Schiff-fahrt)
4 ck-Trennung.
Beispiel: vfac4kel (-> Fak-kel)
Seite 5 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
Umlaut-Darstellung
Durch die zweifache Markierung mit Kennbuchstabe und Ziffern für die
Trennstellen werden die Einträge in der Ausnahmedatei so verfremdet,
daß man sich an die Lesart erst gewöhnen muß. Hinzu kommt, daß deut-
sche Umlaute in der Ausnahmedatei durch besondere nicht-alphabetische
Zeichen eingegeben werden müssen:
{ für ä Beispiel: d{1cher (= Dä-cher)
| für ö Beispiel: d|r1fer (= Dör-fer)
} für ü Beispiel: f}n1fer (= Fün-fer)
~ für ß Beispiel: au1~en (= au-ßen)
Zusammen machen alle diese Konventionen (Kennbuchstabe, Ziffern,
Umlaut-Darstellung, Kleinschreibung) auf den ersten Blick die Pflege
der Ausnahmedatei schwierig. Darüber hinaus sind noch weitere Regeln
unbedingt zu beachten. Sie betreffen die Sortierreihenfolge der Ein-
träge.
Sortierregeln
Entscheidend für das Funktionieren der Ausnahmeliste ist die korrekte
Reihenfolge der Einträge. Damit das Trenn-Programm gegebenenfalls
einen Eintrag in der Ausnahmeliste findet, müssen die Einträge natür-
lich alphabetisch korrekt eingeordnet sein. Dabei werden die Wörter
ohne Kennbuchstabe und ohne Trennstellenziffern als Basis genommen.
Dies ist die Grundregel.
Einträge wiederum können nicht nur aus kompletten Wörtern bestehen,
sondern auch aus Wortteilen (Wortstamm, Wortanfang, Wortform). Entge-
gen sonstigen Sortierkonventionen muß in der Ausnahmedatei immer die
Langform vor der Kurzform eines Worts bzw. Wortteils stehen. Dazu ein
Beispiel. In der Ausnahmedatei gibt es 4 Einträge des Wortteils
"gewinn". Die Reihenfolge für diese 4 Einträge muß folgende sein:
bge1win1ner
zge1win3num1mern
age1win3num1mer
vge1winn
Dieses Beispiel verdeutlicht die ersten beiden Sortierregeln:
⊕ Langform vor Kurzform
"gewinner" vor "gewinn" und "gewinnummern" vor "gewinnummer"
⊕ Alphabetische Ordnung
"gewinner" vor "gewinnummern"
Seite 6 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
Weitere Sortierregeln betreffen die Einordnung von Einträgen mit den
Ersatzdarstellungen (nicht-alphabetischen Zeichen) der Umlaute. Hier-
bei ist zu beachten, daß die nicht-alphabetischen Zeichen für Umlaute
immer nach den alphabetischen Zeichen einzuordnen sind. Weiterhin ist
zu beachten, daß Umlaute unter sich unabhängig von ihrer Ersatzdar-
stellung ganz normal alphabetisch eingeordnet werden: also ä vor ö vor
ü. Auch hierzu ein Beispiel aus der Ausnahmedatei:
bge1fl}1gel (= "geflügel")
bge1f{ng1nis (= "gefängnis")
bge1f{~ (= "gefäß")
zge1f}hls (= "gefühls")
Dieses Beispiel verdeutlicht die weiteren Sortierregeln:
⊕ Nicht-alphabetische Zeichen (Umlaute) nach den alphabetischen
bge1f{ng1nis ["gefängnis"] nach bge1fl}1gel ["geflügel"], also "f{"
nach "fl}"
⊕ Umlaute untereinander gemäß der alphabetischen Folge
"gefängnis" alphabetisch vor "gefäß"; "gefäß" wiederum alphabetisch
vor "gefühls"
Das nächste Beispiel aus der Ausnahmedatei zeigt dasselbe noch einmal
ausführlicher:
bbu~ (= "buß")
bb{c4ker (= "bäcker")
zb{1ren (= "bären")
zb|r1sen (= "börsen")
cb|r1sia (= "börsia")
cb|s1ar (= "bösar")
zb}1cher (= "bücher")
bb}1fett (= "büfett")
bb}f1fe1lei (= "büffelei")
wb}f1fel (= "büffel")
wb}1gel (= "bügel")
zb}h1nen (= "bühnen")
bb}n1de1lei (= "bündelei")
bb}n1del (= "bündel")
vb}rg (= "bürg")
bb}1ro (= "büro")
zb}r1sten (= "bürsten")
vb}rst (= "bürst")
bb}t1tel (= "büttel")
zb}t1ten (= "bütten")
vb}~ (= "büß")
Seite 7 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
Dieses Beispiel verdeutlicht die bisher bekannten Sortierregeln:
⊕ Langform vor Kurzform
"büffelei" vor "büffel" u. a.
⊕ Alphabetische Ordnung der Wortteile
"börsen" vor "börsia" u. a.
⊕ Umlaute untereinander nach der alphabetischen Folge
"bäcker" usw. vor "börsen" usw. vor "bücher" usw.
⊕ Nicht-alphabetische Zeichen (Umlaute) nach den alphabetischen
bb{c4ker ("bäcker") nach bbu~ ("buß") und nicht umgekehrt; vb}~
("büß") nach zb}t1ten ("bütten") und nicht umgekehrt
Aus den bisherigen Beispielen ergibt sich bezüglich der nicht-alphabe-
tischen Zeichen für die Umlaute eine letzte Sortierregel, die es zu
beachten gilt. Da die nicht-alphabetischen Zeichen immer hinter den
alphabetischen Zeichen eingeordnet werden müssen, werden auch Einträge
von Wörtern oder Wortteilen, die mit einem Umlaut beginnen, hinter den
alphabetischen Einträgen (also hinter dem Buchstaben "z") eingeordnet.
Ein letztes Beispiel:
bzy1lin1der (= "zylinder")
c{gyp (= "ägyp")
c{ngst (= "ängst")
b|l1ofen (= "ölofen")
b}ber1ein (= "überein")
b}ber1haupt (= "überhaupt")
Dieses Beispiel verdeutlicht die Sortierregeln:
⊕ Umlaute untereinander nach der alphabetischen Folge
"ägyp" usw. vor "ölofen" usw. vor "überein" usw.
⊕ Nicht-alphabetische Zeichen als Eintragsbeginn hinter dem Buchsta-
ben "z"
c{gyp ("ägyp") usw. hinter bzy1lin1der ("zylinder")
Neben den Regeln für die korrekte Einordnung der Einträge sind noch
andere Gesichtspunkte zu beachten, die jedoch nicht unmittelbar das
Funktionieren der Ausnahmeliste beeinträchtigen.
Seite 8 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
Hinweise
Als allgemeiner Hinweis gilt:
- Wenn bestimmte Wörter oder Wortteile in die Ausnahmeliste aufgenom-
men werden, bedeutet dies nicht unbedingt, daß das Programm ohne
einen solchen Eintrag falsch trennen würde. Eine Aufnahme in die
Liste kann auch notwendig sein, um Wortzusammensetzungen mit diesen
Einträgen richtig zu trennen.
- Das Trenn-Programm arbeitet aufgrund grammatischer Regeln und Wahr-
scheinlichkeiten, so daß keine 100%ige Genauigkeit erreicht werden
kann. Einträge der Ausnahmeliste haben Priorität vor den Regeln des
Trenn-Algorithmus.
Ein anderer Hinweis betrifft mögliche Fehlerquellen für das Trenn-
Programm:
- Generell sind im Deutschen außer Fremdwörtern vor allem Wortzusam-
mensetzungen Fehlerquellen, obgleich das Trenn-Programm grundsätz-
lich darauf abgestimmt ist. Insbesondere sind deutsche Wörter mit
sog. "Fugen-Zeichen" fehleranfällig. Es folgen Beispiele mit Wör-
tern, die ohne die Ausnahmeliste falsch getrennt werden.
Fugen-s Beispiel: Abschnittsanzahl
Trennfehler ohne Ausnahmeliste: Ab-schnitt-san-zahl
Fugen-e Beispiel: Schweinefleisch
Trennfehler ohne Ausnahmeliste: Schwei-nef-leisch
Fugen-en Beispiel: Gruppenarbeiten
Trennfehler ohne Ausnahmeliste: Grup-pe-nar-bei-ten
Wortzusammensetzungen
Beispiel: dialogorientiert
Trennfehler ohne Ausnahmeliste: dia-lo-go-rien-tiert
Ein weiterer Hinweis betrifft Besonderheiten der deutschen Silbentren-
nung.
- In die Ausnahmeliste aufzunehmen sind Wörter, die innerhalb der
deutschen Silbentrennung nicht nach den sonstigen Regeln getrennt
werden. Dies betrifft insbesondere die Regel, daß im Deutschen "st"
nicht getrennt wird. Ausnahmen von dieser Regel wie z. B. die Wör-
ter "Dienstag" (zu trennen: Diens-tag), "Bistum" (zu trennen: Bis-
tum) oder "Ostern" (bleibt ungetrennt) müssen auf jeden Fall in die
Ausnahmeliste aufgenommen werden.
Seite 9 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
Achtung:
Soll ein Wort nicht getrennt werden, ist es folgendermaßen einzu-
tragen: z. B. bostern (für "Ostern") oder bangst (für "Angst",
"Angsthase" usw.) oder fguide (für das englische Fremdwort
"guide"). Es wird also keine Ziffer für die Trennstelle vergeben,
auch nicht am Ende des Wortes, wo generell keine Ziffer angegeben
wird.
Hinsichtlich der Anzahl der Einträge sollte man beachten, daß die Aus-
nahmeliste beliebig erweitert werden kann, es aber effektiver ist,
wenn eine gewisse Ökonomie eingehalten wird.
- Statt jedes Wort, das falsch getrennt worden ist, als solches in
die Ausnahmeliste aufzunehmen, sollte man überlegen, ob nicht ein
Wortteil genügt. So könnte man das falsch getrennte Wort
"Abschnittsanzahl" als solches mit aab1schnitts1an1zahl aufnehmen.
Besser ist es jedoch, nur den Wortteil zschnitts einzutragen, weil
damit gleichzeitig verschiedene Wortzusammensetzungen wie "Durch-
schnittsanalyse", "Querschnittsermittlung" usw. mit abgedeckt sind.
Um ein solches ökonomisches Vorgehen zu unterstützen, sind nicht
zuletzt die Kennbuchstaben in der Ausnahmedatei vorgesehen.
Der nächste Hinweis betrifft die Umlautdarstellungen bei troff.
- Umlaut-Ersatzdarstellungen in der Quelldatei, wie sie troff(1M)
(\(^a = ä, \(^o = ö usw.) kennt, können in dieser Form in der Aus-
nahmeliste nicht berücksichtigt werden. Wörter mit der troff-
Ersatzdarstellung im Quellcode können nur dann korrekt getrennt
werden, wenn der jeweilige Umlaut direkt von der Tastatur eingege-
ben wird. Ist die Trennung dennoch falsch, muß die Trennstelle vom
Benutzer mit \% vorgegeben werden, also z. B.: \(^uber\%haupt oder
.hw Ka-pi-tel-über-schrift.
Probleme mit der Silbentrennung sind auf jeden Fall zu erwarten,
wenn statt echter Umlaute Darstellungen in der Form ae, oe, ue usw.
im Text verwendet werden.
GENERIERUNG DER NEUEN AUSNAHMELISTE
Nachdem der Benutzer die neuen Einträge in der Eingabedatei
ausnahme.txt vorgenommen hat, muß eine neue ausführbare Ausnahmeliste
generiert werden. Dies geschieht mit dem Kommando:
genal (ohne Parameter)
Dieses Kommando liest die Einträge der Eingabedatei nacheinander ein
und baut eine neue ausführbare Ausnahmeliste auf. Dabei werden die
beiden Dateien, aus denen die Ausnahmeliste besteht (ausnahme.dat und
ausnahme.ind), überschrieben. Das Kommando ist in dem Verzeichnis auf-
zurufen, in dem sich die Eingabedatei und die Ausnahmeliste befinden.
Seite 10 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
Während der Formatierung sucht n/troff die Ausnahmeliste zuerst in dem
aktuellen Verzeichnis und anschließend, falls dort nicht vorhanden,
unter /usr/lib.
PROBLEME TROTZ NEUER AUSNAHMELISTE
Nach Generierung einer neuen Ausnahmeliste können Wörter, die fehler-
haft getrennt wurden, mit einer kleine Routine auf korrekte Silben-
trennung getestet werden. So wären etwa die oben angeführten Beispiele
falsch getrennter Wörter in eine Testdatei "testfile" folgenden
Inhalts zu schreiben:
.hy 1 \" uneingeschränkte Silbentrennung
.ll 2n \" Verkürzung der Zeilenlänge
Abschnittsanzahl
\" echte Leerzeilen, kein Nofill-Modus!
Schweinefleisch
Gruppenarbeiten
dialogorientiert
Der Aufruf lautet nur: nroff testfile | hyphen. Wurden die Einträge
ordnungsgemäß in der Ausnahmeliste vorgenommen, sind jetzt die korrek-
ten Silbentrennungen am Bildschirm zu sehen.
Wenn sich das gewünschte Ergebnis allerdings nicht einstellt und ein
Wort weiterhin falsch getrennt wird, muß der Eintrag in der Eingabeda-
tei ausnahme.txt überprüft werden. Mitunter liegt der Fehler daran,
daß ein unzutreffender Kennbuchstabe gewählt wurde; häufiger aber
wurde die Sortierreihenfolge der Einträge nicht streng genug beachtet,
so daß der ansonsten richtige Eintrag gar nicht erst gefunden wurde.
Auf jeden Fall ist die Prozedur solange zu wiederholen, bis das Ergeb-
nis in Ordnung ist.
Für die Richtigkeit der Silbentrennung selbst ist es unerheblich, ob
eine nroff- oder troff-Formatierung vorgenommen wird. Bei einigen Wör-
tern können bei der deutschen Silbentrennung semantische Konflikte
auftauchen, die auch nicht durch eine Ausnahmeliste abzufangen sind.
So ist es vom Kontext abhängig, ob z. B. das Wort "Baumast" als Baum-
ast oder als Bau-mast zu trennen ist. In einem solchen Fall muß der
Benutzer selbst durch Einfügung von \% direkt vorgeben, was gemeint
ist, also: Baum\%ast oder Bau\%mast.
RECHTSCHREIBREFORM
Der deutsche Silbentrenn-Algorithmus arbeitet nach den zur Zeit noch
gültigen Trennregeln. So wird die Zeichenfolge "ck" eines Wortes für
die Trennung durch "k-k" (z. B. Druk-ker) ersetzt oder gegebenenfalls
ein dritter Konsonant (z. B. Schiffahrt -> Schiff-fahrt) eingesetzt.
Seite 11 Reliant UNIX 5.44 Gedruckt 11/98
genal(1M) genal(1M)
DATEIEN
/usr/lib/ausnahme.txt
Wartbare Ausnahmeliste
/usr/lib/ausnahme.dat
Nicht-lesbare Indexdatei
/usr/lib/ausnahme.ind
Nicht-lesbare Indexdatei
SIEHE AUCH
hyphen(1M), roff-charset(5).
Seite 12 Reliant UNIX 5.44 Gedruckt 11/98