genal(1M) — Reliant UNIX 5.44c4

genal(1M)                                                         genal(1M)

NAME
     genal - Programm zur Generierung der deutschen Ausnahmeliste

SYNTAX
     /usr/bin/genal

BESCHREIBUNG
     Mit dem Kommando genal wird eine neue Ausnahmeliste für die deutsche
     Silbentrennung generiert. Die Datei der Ausnahmeliste kann von einem
     Benutzer mit entsprechender Berechtigung mittels eines beliebigen Edi-
     tors bearbeitet und dann ausführbar gemacht werden. Allerdings sind
     hierbei einige Besonderheiten zu beachten.

   Deutsche und englische Silbentrennung

     Bei der Formatierung von Texten mit der Documenter's Workbench (DWB)
     besteht die Möglichkeit, je nachdem, ob es sich um einen deutschen
     oder englischen Text handelt, eine sprachspezifische Silbentrennung
     einzuschalten. Die Einstellung der sprachspezifischen Silbentrennung
     erfolgt mit dem Makro

          .la [language]

     Dabei bedeutet:

          .la G   deutsche Silbentrennung,

          .la E   englische Silbentrennung.

     Voreingestellt ist die deutsche Silbentrennung, d. h. .la G oder nur
     .la ohne Parameter. Die sprachspezifsche Einstellung wird direkt an
     einer beliebigen Stelle (meist am Anfang) in der Textdatei oder in
     einer Include-Datei (.so) vorgenommen. Bei "gemischtsprachigen" Doku-
     menten mit deutschen und englischen Texten zusammen kann also mehrfach
     die Silbentrennung gewechselt werden.

     Zu beachten ist, daß standardmäßig keine Silbentrennung erfolgt (außer
     in Wörtern, die die Zeichen "-" oder "\(em" [Minuszeichen, Gedanken-
     strich; vgl. roff-charset(5)] enthalten, wo selbst bei ausgeschalteter
     Silbentrennung noch getrennt wird). Das bedeutet, daß die Silbentren-
     nung immer explizit eingeschaltet werden muß! Dies geschieht mit dem
     Makro

          .hy [N] (hyphenation)

     direkt in der Quelldatei oder im zugrundegelegten Makropaket. Mit
     anderen Worten:

     ⊕  Das Makro .la schaltet nicht implizit das Makro .hy ein.

     ⊕  Getrennt wird erst vom Aufruf des Makros .hy an.




Seite 1                      Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

     Der Parameter N des Makros .hy hat folgende Bedeutung:

          1    Silbentrennung ohne Einschränkung

          2    keine Silbentrennung bei Seitenwechsel

          4    kein Abtrennen der letzten beiden Buchstaben eines Wortes

          8    kein Abtrennen der ersten beiden Buchstaben eines Wortes

          0    Ausschalten der Silbentrennung (= .nh)

     Die Werte 2, 4 und 8 lassen sich beliebig kombinieren, so daß z. B.
     .hy 14 alle drei Einschränkungen zur Folge hat. .hy ohne Parameter ist
     identisch mit .hy 1 (keine Einschränkung).

   Kontrolle der Silbentrennung

     Ob die Silbentrennung von nroff(1M) korrekt erfolgte, kann mit dem
     Kommando hyphen(1M) überprüft werden. Dieses Kommando listet alle Wör-
     ter mit Trennstrichen am Zeilende von einem formatierten Text auf.
     Verwendet man hyphen als Filter, so kann man etwa mit folgendem Aufruf
     die Silbentrennung von einer Datei textfile kontrollieren:

     tbl textfile | neqn | nroff -man -Tlp | col -x | hyphen

   Beeinflussung der Silbentrennung

     Wenn die Silbentrennung fehlerhaft ist, gibt es zwei Möglichkeiten,
     sie zu beeinflussen:

     1) direkt im Text durch Markierung einer Solltrennstelle oder mit
        Hilfe des Makros .hw (für den normalen Benutzer)

     2) durch die Pflege einer (deutschen) Ausnahmeliste (nur für den
        Systemverwalter).

     Die Markierung einer Solltrennstelle direkt im Text erfolgt durch die
     Eingabe der Zeichenfolge

          \%

     (falls nicht mit dem Makro .hc c ein anderes Trennvorschlagszeichen
     spezifiziert wurde).

     Besonders in deutschen Texten mit langen Wörtern ist es oft ange-
     bracht, manuell eine mögliche Trennstelle im Wort vorzugeben. Das Wort
     "Netzverwaltungsdateien" zum Beispiel wäre dann in der Quelldatei wie
     folgt zu editieren: Netz\%ver\%wal\%tungs\%da\%tei\%en.





Seite 2                      Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

     Daneben kann eine Solltrennstelle auch mit Hilfe des Makros

          .hw word

     vorgegeben werden. Dabei werden die Trennstellen durch Bindestriche
     markiert, zum Beispiel: .hw durch-ein-an-der. Die Länge des Arguments
     word beträgt 256 Bytes, die maximale Anzahl der Trennstellen pro Wort
     ist 20.

     Achtung:

     Wird eine mögliche Trennstelle in einem Wort vorgegeben, trennt
     n/troff nur noch an dieser Stelle (und beim Zeichen "-"). Daher ist es
     sicherer, alle Solltrennstellen vorzugeben (wie im Beispiel oben).

     Die Silbentrennung kann auf zwei Arten unterdrückt werden: generell
     oder nur für ein einzelnes Wort. Generell wird die Silbentrennung mit
     Hilfe der Makros

          .nh  bzw.  .hy 0

     unterdrückt.

     Bei einem einzelnen Wort wird die Silbentrennung unterdrückt, indem
     entweder

     -  ein \% an den Anfang des Wortes gesetzt wird oder

     -  durch Einfügen der Sonderzeichen "\(hy" (= -), "\(mi" (= -) oder
        "\-" (= -) [siehe roff-charset(5)] in einem zusammengesetzten Wort.

     Zwei Beispiele für das Unterdrücken der Silbentrennung in einem ein-
     zelnen Wort:

     \%automount oder PPP\(hyPaket.

     Eleganter (aber auch aufwendiger) als die Trennvorgabe direkt im Text
     ist die zweite Möglichkeit, über eine Ausnahmeliste Silbentrennstellen
     vorzugeben. Dieses Verfahren lohnt sich bei häufig gebrauchten Wörten,
     die systematisch falsch getrennt werden. Allerdings gilt die Ein-
     schränkung, daß eine wartbare Ausnahmeliste nur für die deutsche Sil-
     bentrennung existiert. Gleichwohl können in dieser Liste natürlich
     auch englische Wörter eingetragen werden.

BEARBEITUNG DER AUSNAHMELISTE
     Die Ausnahmeliste besteht insgesamt aus drei einzelnen Dateien:
     ausnahme.txt, ausnahme.dat und ausnahme.ind. Diese Dateien liegen in
     dem Verzeichnis /usr/lib. Einträge werden vom Benutzer nur in der Ein-
     gabedatei ausnahme.txt vorgenommen, die beiden anderen Index-Dateien
     werden erzeugt und sind nicht lesbar. Um Einträge vorzunehmen, ist die
     Superuser-Berechtigung erforderlich. Die Bearbeitung der Ausnahmeliste
     ist etwas kompliziert und soll daher ausführlich beschrieben werden.


Seite 3                      Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

     Die Wörter bzw. Wortteile der Ausnahmeliste sind doppelt markiert:

     a) am Beginn eines Eintrags durch einen Kennbuchstaben (Typenkennung),
        der den Eintrag als Wortstamm, Wortanfang, Wortform, Fremdwort usw.
        kennzeichnet;

     b) innerhalb eines Eintrags durch eine Ziffer von 1 bis 4, die die
        Trennstelle selbst spezifiziert.

   Kennbuchstaben der Ausnahmeliste

     Es folgt zunächst eine Liste der Kennbuchstaben und ihrer Bedeutungen.

     a    Normales Ausnahmewort (nur Wortform), d. h. das Wort kommt immer
          nur für sich allein als Einzelwort vor.

          Beispiele: wor-un-ter; wor-an (Eintrag: awor1un1ter; awor1an)

     b    Normales Ausnahmewort Wortanfang und Wortform), d. h. das Wort
          kommt sowohl für sich allein vor wie auch als Anfang von zusam-
          mengesetzten Wörtern.

          Beispiele: Zeug-nis, Zeug-nis-ses, Zeug-nis-ar-ten (Eintrag:
          bzeug1nis)

     c    Normales Ausnahmewort (nur Wortanfang), d. h. das Wort kommt nur
          als Beginn eines zusammengesetzten Wortes vor; einem so gekenn-
          zeichneten Wort muß in Texten immer ein weiterer Wortteil von
          mindestens zwei Buchstaben folgen.

          Beispiele: zi-vi-li-siert, zi-vi-li-sier-te (Eintrag: czi1vi1li)

     e    Eigenname (an den Namen kann auch die Endung "s" angehängt wer-
          den).

          Beispiele: Ar-me-ni-en (Eintrag: ear1me1ni1en)

     f    Fremdwort; das Wort kann als selbständiges Wort, als Wortanfang
          in zusammengesetzten Wörtern und mit der Endung "s" vorkommen.

          Beispiele: Bo-nus, bo-nus-ar-tig (Eintrag: fbo1nus)

     g    Fremdwort (nur Wortanfang), d. h. das Wort wird immer mit einem
          weiteren Wortteil (mindestens zwei Buchstaben) zu einer Zusammen-
          setzung verbunden.

          Beispiele: Log-arith-mus, log-arith-misch (Eintrag: glog1arith)

     k    Kundeneintrag; Normales Ausnahmewort (nur Wortform), d. h. das
          Wort kommt immer nur für sich allein als Einzelwort vor (wie a).




Seite 4                      Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

     v    Stamm von Verben auf "-en".

          Beispiele: gra-sen, gra-sen-de, Gras-an-satz (Eintrag: vgras)

     w    Stamm von Verben auf "-eln" und "-ern", einschließlich der beiden
          Nachsilben "el" und "er".

          Beispiele: bet-teln, Bet-tel, Bett-ler, bet-teln-de (Eintrag:
          wbet1tel); zau-bern, Zau-be-rer, Zau-ber-kunst (Eintrag:
          wzau1ber)

     z    Wortform aus Stamm und Endung, die in Wortzusammensetzungen
          benutzt wird.

          Beispiele: Wis-sens, Wis-sens-art (Eintrag: zwis1sens)

     Alle Einträge in der Ausnahmedatei müssen in Kleinbuchstaben erfolgen.

   Trennstellen-Ziffern

     Die Trennstellen selbst sind durch folgende Ziffern gekennzeichnet:

     1    Normale Trennstelle.

          Beispiel: ain1itia1ti1ve (-> In-itia-ti-ve)

     2    Unästhetische Trennstelle (nicht zu verwenden!).

          Unästhetische Trennungen sind unter anderem solche, bei denen die
          beiden ersten oder letzten Buchstaben eines Wortes abgetrennt
          werden. Eine derartige Trennung muß explizit mit .hy 1 (= unein-
          geschränkte Silbentrennung) zugelassen werden. Bei Tests zeigte
          sich, daß Wörter in der Ausnahmeliste, die mit der Ziffer 2 für
          eine unästhetische Trennstelle markiert waren, anschließend vom
          System nicht erkannt wurden. Wenn sie jedoch mit der Ziffer 1
          markiert waren, wurden die Trennstellen bei uneingeschränkter
          Silbentrennung auch als unästhetische Trennstelle erkannt. Der
          Fehler ist somit einfach zu umgehen. Die Ursache des Fehlers ist
          unbekannt.

     3    Trennstelle bei Konsonanten-Ergänzung.

          Beispiel: bschif3fahrt (-> Schiff-fahrt)

     4    ck-Trennung.

          Beispiel: vfac4kel (-> Fak-kel)







Seite 5                      Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

   Umlaut-Darstellung

     Durch die zweifache Markierung mit Kennbuchstabe und Ziffern für die
     Trennstellen werden die Einträge in der Ausnahmedatei so verfremdet,
     daß man sich an die Lesart erst gewöhnen muß. Hinzu kommt, daß deut-
     sche Umlaute in der Ausnahmedatei durch besondere nicht-alphabetische
     Zeichen eingegeben werden müssen:

     { für ä     Beispiel:   d{1cher (= Dä-cher)

     | für ö     Beispiel:   d|r1fer (= Dör-fer)

     } für ü     Beispiel:   f}n1fer (= Fün-fer)

     ~ für ß     Beispiel:   au1~en (= au-ßen)

     Zusammen machen alle diese Konventionen (Kennbuchstabe, Ziffern,
     Umlaut-Darstellung, Kleinschreibung) auf den ersten Blick die Pflege
     der Ausnahmedatei schwierig. Darüber hinaus sind noch weitere Regeln
     unbedingt zu beachten. Sie betreffen die Sortierreihenfolge der Ein-
     träge.

   Sortierregeln

     Entscheidend für das Funktionieren der Ausnahmeliste ist die korrekte
     Reihenfolge der Einträge. Damit das Trenn-Programm gegebenenfalls
     einen Eintrag in der Ausnahmeliste findet, müssen die Einträge natür-
     lich alphabetisch korrekt eingeordnet sein. Dabei werden die Wörter
     ohne Kennbuchstabe und ohne Trennstellenziffern als Basis genommen.
     Dies ist die Grundregel.

     Einträge wiederum können nicht nur aus kompletten Wörtern bestehen,
     sondern auch aus Wortteilen (Wortstamm, Wortanfang, Wortform). Entge-
     gen sonstigen Sortierkonventionen muß in der Ausnahmedatei immer die
     Langform vor der Kurzform eines Worts bzw. Wortteils stehen. Dazu ein
     Beispiel. In der Ausnahmedatei gibt es 4 Einträge des Wortteils
     "gewinn". Die Reihenfolge für diese 4 Einträge muß folgende sein:

     bge1win1ner
     zge1win3num1mern
     age1win3num1mer
     vge1winn

     Dieses Beispiel verdeutlicht die ersten beiden Sortierregeln:

     ⊕  Langform vor Kurzform

        "gewinner" vor "gewinn" und "gewinnummern" vor "gewinnummer"

     ⊕  Alphabetische Ordnung

        "gewinner" vor "gewinnummern"


Seite 6                      Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

     Weitere Sortierregeln betreffen die Einordnung von Einträgen mit den
     Ersatzdarstellungen (nicht-alphabetischen Zeichen) der Umlaute. Hier-
     bei ist zu beachten, daß die nicht-alphabetischen Zeichen für Umlaute
     immer nach den alphabetischen Zeichen einzuordnen sind. Weiterhin ist
     zu beachten, daß Umlaute unter sich unabhängig von ihrer Ersatzdar-
     stellung ganz normal alphabetisch eingeordnet werden: also ä vor ö vor
     ü. Auch hierzu ein Beispiel aus der Ausnahmedatei:

     bge1fl}1gel    (= "geflügel")
     bge1f{ng1nis   (= "gefängnis")
     bge1f{~        (= "gefäß")
     zge1f}hls      (= "gefühls")

     Dieses Beispiel verdeutlicht die weiteren Sortierregeln:

     ⊕  Nicht-alphabetische Zeichen (Umlaute) nach den alphabetischen

        bge1f{ng1nis ["gefängnis"] nach bge1fl}1gel ["geflügel"], also "f{"
        nach "fl}"

     ⊕  Umlaute untereinander gemäß der alphabetischen Folge

        "gefängnis" alphabetisch vor "gefäß"; "gefäß" wiederum alphabetisch
        vor "gefühls"

     Das nächste Beispiel aus der Ausnahmedatei zeigt dasselbe noch einmal
     ausführlicher:

     bbu~          (= "buß")
     bb{c4ker      (= "bäcker")
     zb{1ren       (= "bären")
     zb|r1sen      (= "börsen")
     cb|r1sia      (= "börsia")
     cb|s1ar       (= "bösar")
     zb}1cher      (= "bücher")
     bb}1fett      (= "büfett")
     bb}f1fe1lei   (= "büffelei")
     wb}f1fel      (= "büffel")
     wb}1gel       (= "bügel")
     zb}h1nen      (= "bühnen")
     bb}n1de1lei   (= "bündelei")
     bb}n1del      (= "bündel")
     vb}rg         (= "bürg")
     bb}1ro        (= "büro")
     zb}r1sten     (= "bürsten")
     vb}rst        (= "bürst")
     bb}t1tel      (= "büttel")
     zb}t1ten      (= "bütten")
     vb}~          (= "büß")





Seite 7                      Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

     Dieses Beispiel verdeutlicht die bisher bekannten Sortierregeln:

     ⊕  Langform vor Kurzform

        "büffelei" vor "büffel" u. a.

     ⊕  Alphabetische Ordnung der Wortteile

        "börsen" vor "börsia" u. a.

     ⊕  Umlaute untereinander nach der alphabetischen Folge

        "bäcker" usw. vor "börsen" usw. vor "bücher" usw.

     ⊕  Nicht-alphabetische Zeichen (Umlaute) nach den alphabetischen

        bb{c4ker ("bäcker") nach bbu~ ("buß") und nicht umgekehrt; vb}~
        ("büß") nach zb}t1ten ("bütten") und nicht umgekehrt

     Aus den bisherigen Beispielen ergibt sich bezüglich der nicht-alphabe-
     tischen Zeichen für die Umlaute eine letzte Sortierregel, die es zu
     beachten gilt. Da die nicht-alphabetischen Zeichen immer hinter den
     alphabetischen Zeichen eingeordnet werden müssen, werden auch Einträge
     von Wörtern oder Wortteilen, die mit einem Umlaut beginnen, hinter den
     alphabetischen Einträgen (also hinter dem Buchstaben "z") eingeordnet.
     Ein letztes Beispiel:

     bzy1lin1der   (= "zylinder")
     c{gyp         (= "ägyp")
     c{ngst        (= "ängst")
     b|l1ofen      (= "ölofen")
     b}ber1ein     (= "überein")
     b}ber1haupt   (= "überhaupt")

     Dieses Beispiel verdeutlicht die Sortierregeln:

     ⊕  Umlaute untereinander nach der alphabetischen Folge

        "ägyp" usw. vor "ölofen" usw. vor "überein" usw.

     ⊕  Nicht-alphabetische Zeichen als Eintragsbeginn hinter dem Buchsta-
        ben "z"

        c{gyp ("ägyp") usw. hinter bzy1lin1der ("zylinder")

     Neben den Regeln für die korrekte Einordnung der Einträge sind noch
     andere Gesichtspunkte zu beachten, die jedoch nicht unmittelbar das
     Funktionieren der Ausnahmeliste beeinträchtigen.






Seite 8                      Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

   Hinweise

     Als allgemeiner Hinweis gilt:

     -  Wenn bestimmte Wörter oder Wortteile in die Ausnahmeliste aufgenom-
        men werden, bedeutet dies nicht unbedingt, daß das Programm ohne
        einen solchen Eintrag falsch trennen würde. Eine Aufnahme in die
        Liste kann auch notwendig sein, um Wortzusammensetzungen mit diesen
        Einträgen richtig zu trennen.

     -  Das Trenn-Programm arbeitet aufgrund grammatischer Regeln und Wahr-
        scheinlichkeiten, so daß keine 100%ige Genauigkeit erreicht werden
        kann. Einträge der Ausnahmeliste haben Priorität vor den Regeln des
        Trenn-Algorithmus.

     Ein anderer Hinweis betrifft mögliche Fehlerquellen für das Trenn-
     Programm:

     -  Generell sind im Deutschen außer Fremdwörtern vor allem Wortzusam-
        mensetzungen Fehlerquellen, obgleich das Trenn-Programm grundsätz-
        lich darauf abgestimmt ist. Insbesondere sind deutsche Wörter mit
        sog. "Fugen-Zeichen" fehleranfällig. Es folgen Beispiele mit Wör-
        tern, die ohne die Ausnahmeliste falsch getrennt werden.

        Fugen-s     Beispiel: Abschnittsanzahl

                    Trennfehler ohne Ausnahmeliste: Ab-schnitt-san-zahl

        Fugen-e     Beispiel: Schweinefleisch

                    Trennfehler ohne Ausnahmeliste: Schwei-nef-leisch

        Fugen-en    Beispiel: Gruppenarbeiten

                    Trennfehler ohne Ausnahmeliste: Grup-pe-nar-bei-ten

        Wortzusammensetzungen
                    Beispiel: dialogorientiert

                    Trennfehler ohne Ausnahmeliste: dia-lo-go-rien-tiert

     Ein weiterer Hinweis betrifft Besonderheiten der deutschen Silbentren-
     nung.

     -  In die Ausnahmeliste aufzunehmen sind Wörter, die innerhalb der
        deutschen Silbentrennung nicht nach den sonstigen Regeln getrennt
        werden. Dies betrifft insbesondere die Regel, daß im Deutschen "st"
        nicht getrennt wird. Ausnahmen von dieser Regel wie z. B. die Wör-
        ter "Dienstag" (zu trennen: Diens-tag), "Bistum" (zu trennen: Bis-
        tum) oder "Ostern" (bleibt ungetrennt) müssen auf jeden Fall in die
        Ausnahmeliste aufgenommen werden.



Seite 9                      Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

        Achtung:

        Soll ein Wort nicht getrennt werden, ist es folgendermaßen einzu-
        tragen: z. B. bostern (für "Ostern") oder bangst (für "Angst",
        "Angsthase" usw.) oder fguide (für das englische Fremdwort
        "guide"). Es wird also keine Ziffer für die Trennstelle vergeben,
        auch nicht am Ende des Wortes, wo generell keine Ziffer angegeben
        wird.

     Hinsichtlich der Anzahl der Einträge sollte man beachten, daß die Aus-
     nahmeliste beliebig erweitert werden kann, es aber effektiver ist,
     wenn eine gewisse Ökonomie eingehalten wird.

     -  Statt jedes Wort, das falsch getrennt worden ist, als solches in
        die Ausnahmeliste aufzunehmen, sollte man überlegen, ob nicht ein
        Wortteil genügt. So könnte man das falsch getrennte Wort
        "Abschnittsanzahl" als solches mit aab1schnitts1an1zahl aufnehmen.
        Besser ist es jedoch, nur den Wortteil zschnitts einzutragen, weil
        damit gleichzeitig verschiedene Wortzusammensetzungen wie "Durch-
        schnittsanalyse", "Querschnittsermittlung" usw. mit abgedeckt sind.
        Um ein solches ökonomisches Vorgehen zu unterstützen, sind nicht
        zuletzt die Kennbuchstaben in der Ausnahmedatei vorgesehen.

     Der nächste Hinweis betrifft die Umlautdarstellungen bei troff.

     -  Umlaut-Ersatzdarstellungen in der Quelldatei, wie sie troff(1M)
        (\(^a = ä, \(^o = ö usw.) kennt, können in dieser Form in der Aus-
        nahmeliste nicht berücksichtigt werden. Wörter mit der troff-
        Ersatzdarstellung im Quellcode können nur dann korrekt getrennt
        werden, wenn der jeweilige Umlaut direkt von der Tastatur eingege-
        ben wird. Ist die Trennung dennoch falsch, muß die Trennstelle vom
        Benutzer mit \% vorgegeben werden, also z. B.: \(^uber\%haupt oder
        .hw Ka-pi-tel-über-schrift.

        Probleme mit der Silbentrennung sind auf jeden Fall zu erwarten,
        wenn statt echter Umlaute Darstellungen in der Form ae, oe, ue usw.
        im Text verwendet werden.

GENERIERUNG DER NEUEN AUSNAHMELISTE
     Nachdem der Benutzer die neuen Einträge in der Eingabedatei
     ausnahme.txt vorgenommen hat, muß eine neue ausführbare Ausnahmeliste
     generiert werden. Dies geschieht mit dem Kommando:

          genal (ohne Parameter)

     Dieses Kommando liest die Einträge der Eingabedatei nacheinander ein
     und baut eine neue ausführbare Ausnahmeliste auf. Dabei werden die
     beiden Dateien, aus denen die Ausnahmeliste besteht (ausnahme.dat und
     ausnahme.ind), überschrieben. Das Kommando ist in dem Verzeichnis auf-
     zurufen, in dem sich die Eingabedatei und die Ausnahmeliste befinden.




Seite 10                     Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

     Während der Formatierung sucht n/troff die Ausnahmeliste zuerst in dem
     aktuellen Verzeichnis und anschließend, falls dort nicht vorhanden,
     unter /usr/lib.

PROBLEME TROTZ NEUER AUSNAHMELISTE
     Nach Generierung einer neuen Ausnahmeliste können Wörter, die fehler-
     haft getrennt wurden, mit einer kleine Routine auf korrekte Silben-
     trennung getestet werden. So wären etwa die oben angeführten Beispiele
     falsch getrennter Wörter in eine Testdatei "testfile" folgenden
     Inhalts zu schreiben:

     .hy 1             \" uneingeschränkte Silbentrennung
     .ll 2n            \" Verkürzung der Zeilenlänge
     Abschnittsanzahl
                       \" echte Leerzeilen, kein Nofill-Modus!
     Schweinefleisch

     Gruppenarbeiten

     dialogorientiert

     Der Aufruf lautet nur: nroff testfile | hyphen. Wurden die Einträge
     ordnungsgemäß in der Ausnahmeliste vorgenommen, sind jetzt die korrek-
     ten Silbentrennungen am Bildschirm zu sehen.

     Wenn sich das gewünschte Ergebnis allerdings nicht einstellt und ein
     Wort weiterhin falsch getrennt wird, muß der Eintrag in der Eingabeda-
     tei ausnahme.txt überprüft werden. Mitunter liegt der Fehler daran,
     daß ein unzutreffender Kennbuchstabe gewählt wurde; häufiger aber
     wurde die Sortierreihenfolge der Einträge nicht streng genug beachtet,
     so daß der ansonsten richtige Eintrag gar nicht erst gefunden wurde.
     Auf jeden Fall ist die Prozedur solange zu wiederholen, bis das Ergeb-
     nis in Ordnung ist.

     Für die Richtigkeit der Silbentrennung selbst ist es unerheblich, ob
     eine nroff- oder troff-Formatierung vorgenommen wird. Bei einigen Wör-
     tern können bei der deutschen Silbentrennung semantische Konflikte
     auftauchen, die auch nicht durch eine Ausnahmeliste abzufangen sind.
     So ist es vom Kontext abhängig, ob z. B. das Wort "Baumast" als Baum-
     ast oder als Bau-mast zu trennen ist. In einem solchen Fall muß der
     Benutzer selbst durch Einfügung von \% direkt vorgeben, was gemeint
     ist, also: Baum\%ast oder Bau\%mast.

RECHTSCHREIBREFORM
     Der deutsche Silbentrenn-Algorithmus arbeitet nach den zur Zeit noch
     gültigen Trennregeln. So wird die Zeichenfolge "ck" eines Wortes für
     die Trennung durch "k-k" (z. B. Druk-ker) ersetzt oder gegebenenfalls
     ein dritter Konsonant (z. B. Schiffahrt -> Schiff-fahrt) eingesetzt.






Seite 11                     Reliant UNIX 5.44               Gedruckt 11/98

genal(1M)                                                         genal(1M)

DATEIEN
     /usr/lib/ausnahme.txt
          Wartbare Ausnahmeliste

     /usr/lib/ausnahme.dat
          Nicht-lesbare Indexdatei

     /usr/lib/ausnahme.ind
          Nicht-lesbare Indexdatei

SIEHE AUCH
     hyphen(1M), roff-charset(5).










































Seite 12                     Reliant UNIX 5.44               Gedruckt 11/98

Museum

Related Articles