diff options
author | Arno Teigseth <arno@teigseth.no> | 2011-02-05 08:48:27 +0000 |
---|---|---|
committer | Arno Teigseth <arno@teigseth.no> | 2011-02-05 08:48:27 +0000 |
commit | 4f3d565a5e5ede6eb6fd1f276d4e8ad37b67b5ce (patch) | |
tree | 7af736540eca93034428a975bd850e709fbbe2e5 /JLanguageTool/src/rules/da | |
parent | ecaee85ab5984ebadd56721c295dc26b3335f7ce (diff) | |
download | grammar-norwegian-master.tar.gz grammar-norwegian-master.tar.bz2 grammar-norwegian-master.tar.xz |
Diffstat (limited to 'JLanguageTool/src/rules/da')
-rw-r--r-- | JLanguageTool/src/rules/da/grammar.xml | 294 |
1 files changed, 294 insertions, 0 deletions
diff --git a/JLanguageTool/src/rules/da/grammar.xml b/JLanguageTool/src/rules/da/grammar.xml new file mode 100644 index 0000000..8d39e70 --- /dev/null +++ b/JLanguageTool/src/rules/da/grammar.xml @@ -0,0 +1,294 @@ +<?xml version="1.0" encoding="UTF-8"?> +<?xml-stylesheet type="text/xsl" href="../print.xsl" ?> +<?xml-stylesheet type="text/css" href="../rules.css" +title="Easy editing stylesheet" ?> +<!-- +Danish Grammar and Typo Rules for LanguageTool +See danish_tags.txt for the meaning of the POS tags +Copyright (C) 2009 Esben Aaberg, Foreningen for frit tilgængelige sprogværktøjer +$Id$ +--> +<rules lang="da" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" + xsi:noNamespaceSchemaLocation="../rules.xsd"> + <!-- ====================================================================== --> + <!-- Diverse - Misc --> + <!-- ====================================================================== --> + <category name="Diverse"> + <rulegroup id="Ordgentagelse" name="Ordgentagelse"> + <rule id="Ordgentagelse1"> + <pattern> + <token><exception postag="SENT_START"/></token> + <token><match no="0"/><exception regexp="yes">.|000|av|bang|bred|bib|bip|bling|bom|bro|Cha|det|duer|fars|faster|fatter|gak|grynt|ha|he|hej|hi|hip|ho|hopper|hurra|kvier|led|marie|men|mobil|mors|normal|original|piller|rap|ren|ride|sej|smed|så|taget|takker|tik-tak|tog|tut|uniform|vov|øf</exception></token> + </pattern> + <message>Ordgentagelse: Du har gentaget <suggestion>\1</suggestion>.</message> + <short>Ordgentagelse</short> + <example type="incorrect">Nu har <marker>jeg jeg</marker> aldrig hørt magen.</example> + <example type="correct">Så så drengen en drage.</example> + <example type="correct">Han har taget taget af hundehuset.</example> + <example type="correct">"Rap rap" sagde anden.</example> + </rule> + </rulegroup> + </category> + <!-- ====================================================================== --> + <!-- Mulig slåfejl - Possible Typos --> + <!-- ====================================================================== --> + <category name="Mulige slåfejl"> + <rule id="bindestreg_og" name="Manglende mellemrum efter bindestreg"> + <pattern> + <token regexp="yes">(.*)-(og|eller)</token> + </pattern> + <message>Mulig slåfejl manglende mellemrum efter bindestreg: <suggestion><match no="1" regexp_match="(.*)-(og|eller)" regexp_replace="$1- $2"/></suggestion>.</message> + <short>Mulig slåfejl</short> + <example type="correct">Vi skal på oplevelses- eller badeferie.</example> + <example correction="oplevelses- eller" type="incorrect">Vi skal på <marker>oplevelses-eller</marker> badeferie.</example> + <example type="correct">De er <marker>hus- og</marker> haveejere.</example> + <example correction="hus- og" type="incorrect">De er <marker>hus-og</marker> haveejere.</example> + </rule> + </category> + <!-- ====================================================================== --> + <!-- Mulig ordforveksling - Possible word confusion --> + <!-- ====================================================================== --> + <category name="Mulige ordforveksling"> + <rulegroup id="bor_bord" name="bor↔bord"> + <rule> + <pattern> + <token regexp="yes">(aftens|alter|anretter|arbejds|billard|bridge|cafe|camping|computer|eksamens|frokost|gave|have|jule|kaffe|kage|konference|konsol|køkken|middags|morgen|møde|nadver|nat|omstillings|pusle|pølse|salat|senge|skole|sminke|sofa|spille|spise|stue|stam|styr|sy|tagselv|te|.*tennis|terminal|toilet|udtræks|vindues)(bor)(|et|e|ene|s|ets|es|enes)</token> + </pattern> + <message>Et bord sidder man ved, et bor laver man huller med: <suggestion><match no="1" regexp_match="(aftens|alter|anretter|arbejds|billard|bridge|cafe|camping|computer|eksamens|frokost|gave|have|jule|kaffe|kage|konference|konsol|køkken|middags|morgen|møde|nadver|nat|omstillings|pusle|pølse|salat|senge|skole|sminke|sofa|spille|spise|stue|stam|styr|sy|tagselv|te|.*tennis|terminal|toilet|udtræks|vindues)(bor)(|et|e|ene|s|ets|es|enes)" regexp_replace="$1$2d$3"/></suggestion>.</message> + <short>Mulige ordforveksling - stumt d</short> + <example correction="havebordet" type="incorrect">Jeg sætter <marker>haveboret</marker> ud.</example> + <example type="correct">Eleven sidder ved skolebordet.</example> + </rule> + <rule> + <pattern> + <token regexp="yes">(diamant|dril|kaliber|.*luft|.*lufts|næse|slag)(bord)(|et|ene|s|ets|enes)</token> + </pattern> + <message>Et bord sidder man ved, et bor laver man huller med: <suggestion><match no="1" regexp_match="(diamant|dril|kaliber|.*luft|.*lufts|næse|slag)(bord)(|et|ene|s|ets|enes)" regexp_replace="$1bor$3"/></suggestion>.</message> + <short>Mulige ordforveksling - uden stumt d</short> + <example correction="slagbor" type="incorrect">Muren bruger et <marker>slagbord</marker> til at lave huller med.</example> + <example type="correct">Vejen bliver brudt op med et trykluftsbor.</example> + </rule> + </rulegroup> + <rulegroup id="heder_hedder" name="heder→hedder"> + <!-- heder_hedder mønster --> + <rule> + <pattern mark_from="1" mark_to="-1"> + <token regexp="yes">I|jeg|du|vi|de|den|det|han|hun|hvad|nu</token> + <token>heder</token> + <token><exception regexp="yes">på|vil|skal|kan|er|har</exception></token> + </pattern> + <message>Mente du: <suggestion>hedder</suggestion>=navn eller heder=lyngarealer</message> + <short>Mulige ordforveksling</short> + <example correction="hedder" type="incorrect">Jeg <marker>heder</marker> Jens.</example> + <example type="correct">Jeg hedder Jens.</example> + <example type="correct">De heder på landet er bevaringsværdige.</example> + <example type="correct">Jeg heder vil vandre.</example> + </rule> + <rule> + <pattern mark_from="1" mark_to="-1"> + <token>det</token> + <token>heder</token> + <token><exception regexp="yes">vil|skal|kan|er|har</exception></token> + </pattern> + <message>Mente du: <suggestion>hedder</suggestion>=navn eller heder=lyngarealer</message> + <short>Mulige ordforveksling</short> + <example correction="hedder" type="incorrect">Det <marker>heder</marker> på Sjælland, da det er en ø.</example> + <example type="correct">Det hedder Jens.</example> + </rule> + <!-- heder_hedder Egennavn efter --> + <rule> + <pattern mark_from="1" mark_to="-1"> + <token><exception>de</exception></token> + <token>heder</token> + <token postag="pro:.*" postag_regexp="yes"><exception regexp="yes">Jylland|Vestjylland</exception></token> + </pattern> + <message>Mente du: <suggestion>hedder</suggestion>=navn eller heder=lyngarealer</message> + <short>Mulige ordforveksling</short> + <example correction="hedder" type="incorrect">Jeg <marker>heder</marker> Jens.</example> + <example type="correct">Jeg hedder Jens.</example> + <example type="correct">De heder Jens passer.</example> + </rule> + <!-- heder_hedder Egennavn før --> + <rule> + <pattern mark_from="1"> + <token postag="pro:nom" postag_regexp="yes"/> + <token>heder</token> + </pattern> + <message>Mente du: <suggestion>hedder</suggestion>=navn eller heder=lyngarealer</message> + <short>Mulige ordforveksling</short> + <example correction="hedder" type="incorrect">Peder <marker>heder</marker> Sørnsen til efternavn.</example> + <example type="correct">Peter hedder Sørnsen til efternavn.</example> + <example type="correct">Peters heder er vel plejet.</example> + </rule> + </rulegroup> + <!-- kunne_kunde --> + <rulegroup id="kunne_kunde" name="kunne↔kunde"> + <rule> + <pattern mark_from="0" mark_to="-1"> + <token>kunne</token> + <token regexp="yes">har|købte</token> + </pattern> + <message>Mente du: <suggestion>kunde</suggestion>=butikskunde eller kunne=kan</message> + <short>Mulige ordforveksling - stumt d</short> + <example correction="kunde" type="incorrect">En <marker>kunne</marker> har altid ret!</example> + <example type="correct">Som kunde har du fri support.</example> + </rule> + <rule> + <pattern mark_from="1"> + <token regexp="yes">bliv(|e)</token> + <token>kunne</token> + </pattern> + <message>Mente du: <suggestion>kunde</suggestion>=butikskunde eller kunne=kan</message> + <short>Mulige ordforveksling - stumt d</short> + <example correction="kunde" type="incorrect">Bliv <marker>kunne</marker> hos os.</example> + <example type="correct">Vil du blive kunde hos os.</example> + </rule> + <rule> + <pattern mark_from="0" mark_to="-1"> + <token>kunde</token> + <token regexp="yes">forstå|stikke|være</token> + </pattern> + <message>Mente du: <suggestion>kunne</suggestion>=kan eller kunde=butikskunde</message> + <short>Mulige ordforveksling - uden stumt d</short> + <example correction="kunne" type="incorrect">Kan ske, at vi måske <marker>kunde</marker> stikke hovederne sammen.</example> + <example type="correct">Ville vi kunne forstå Gorm den Gamle?</example> + </rule> + <rule> + <pattern mark_from="1"> + <token regexp="yes">det|hvornår</token> + <token>kunde</token> + </pattern> + <message>Mente du: <suggestion>kunne</suggestion>=kan eller kunde=butikskunde</message> + <short>Mulige ordforveksling - uden stumt d</short> + <example correction="kunne" type="incorrect">Det <marker>kunde</marker> bageren ikke vide.</example> + <example type="correct">Der skulde rigtignok have været læst, men det kunne han jo ikke nu.</example> + <example type="correct">Hvordan bliver vi så kunde?</example> + <example type="correct">Hvordan bliver han kunde?</example> + <example type="correct">Hvordan bilver vi kunde?</example> + </rule> + <rule> + <pattern mark_from="1" mark_to="-1"> + <token regexp="yes">han|hun|vi</token> + <token>kunde</token> + <!-- TODO: Make token postag for verbs, when they becomes available in tagger. --> + <token regexp="yes">ha'|have|ikke|være|købe</token> + </pattern> + <message>Mente du: <suggestion>kunne</suggestion>=kan eller kunde=butikskunde</message> + <short>Mulige ordforveksling - uden stumt d</short> + <example correction="kunne" type="incorrect">Han <marker>kunde</marker> ikke komme.</example> + <example type="correct">En middag, som vi kunne være bekendt.</example> + </rule> + </rulegroup> + <rulegroup id="natural_naturel" name="natural→naturel"> + <rule> + <pattern mark_from="0" mark_to="-1"> + <token>natural</token> + <token regexp="yes">yoghurt|tun|hummer|a38|Aloe|flødeost|soya|tufu|ylette|østers|krabbekød</token> + </pattern> + <message>Mente du: <suggestion>naturel</suggestion>=i sin naturlige, ubearbejdede, rene form især om mad</message> + <short>Mulige ordforveksling</short> + <example correction="naturel" type="incorrect">Opskrifter som indeholder <marker>natural</marker> yoghurt.</example> + <example type="correct">Tufu naturel restaurationen.</example> + <example type="correct">Opskrifter som indeholder naturel yoghurt.</example> + </rule> + <rule> + <pattern mark_from="1"> + <token regexp="yes">yoghurt|tun|hummer|contrat|a38|Vera|flødeost|soya|tufu|ylette|østers|krabbekød</token> + <token>natural</token> + </pattern> + <message>Mente du: <suggestion>naturel</suggestion>=i sin naturlige, ubearbejdede, rene form især om mad</message> + <short>Mulige ordforveksling</short> + <example correction="naturel" type="incorrect">Opskrifter som indeholder Yoghurt <marker>natural</marker>.</example> + <example type="correct">Restaurationen byder på både gratineret hummer og hummer naturel.</example> + <example type="correct">Opskrifter som indeholder Yoghurt naturel.</example> + </rule> + </rulegroup> + <rule id="ombord" name="ombord→om bord"> + <pattern mark_from="0" > + <token>ombord</token> + </pattern> + <message>Det skal skrives i to ord <suggestion>om bord</suggestion>.</message> + <short>Om bord er i to ord</short> + <example correction="om bord" type="incorrect">Kaptajnen gik <marker>ombord</marker> på skibet.</example> + <example type="correct">Han havde været om bord på skibet længe.</example> + </rule> + </category> + <!-- ====================================================================== --> + <!-- Mulig ordforveksling med sjældent ord - Possible word confusion with rare words --> + <!-- ====================================================================== --> + <category name="Mulige ordforveksling med sjældent ord"> + <rule id="egenavn_egennavn" name="egenavn→egennavn"> + <pattern mark_from="0" > + <token regexp="yes">(egenavn)(|et|e|ene|s|ets|es|enes)</token> + </pattern> + <message>Et egenavn er navnet på et specifik egetræ, f.eks. Dun-Eg og Vinter-Eg. Hvor <suggestion><match no="1" regexp_match="(egenavn)(|et|e|ene|s|ets|es|enes)" regexp_replace="egennavn$2"/></suggestion> er alle navne f.eks. Jens, Sørnsen, Odense, og Vestas.</message> + <short>Mulige ordforveksling</short> + <example correction="egennavn" type="incorrect">Jens er et <marker>egenavn</marker>.</example> + <example type="correct">Et egennavn skrives med stort begyndelsesbogstav.</example> + </rule> + <rule id="overbord" name="overbord→over bord"> + <pattern mark_from="0" > + <token>overbord</token> + </pattern> + <message>Et overbord er et bord der kan skubbes hen over et andet bord, hvor man falder <suggestion>over bord</suggestion> på et skib.</message> + <short>Mulige ordforveksling</short> + <example correction="over bord" type="incorrect">Kaptajnen faldt <marker>overbord</marker> i den høje sø.</example> + <example type="correct">Han kastede resterne over bord, til mågernes fornøjelse.</example> + <!-- <example type="correct">Det er et fint overbord, men der er ridser i underbordet.</example> --> + </rule> + <rule id="standart_standard" name="standart→standard"> + <pattern mark_from="0"> + <token regexp="yes">.*standart.*</token> + </pattern> + <message>Mente du: <suggestion><match no="1" regexp_match="(.*)standart(.*)" regexp_replace="$1standard$2"/></suggestion> som standard=niveau, procedure, el. norm eller standart=fane</message> + <short>Mulige ordforveksling</short> + <example correction="dokumentstandard" type="incorrect">Den der <marker>dokumentstandart</marker> følger vi.</example> + <example type="correct">Den der dokumentstandard følger vi.</example> + </rule> + <rule id="vad" name="vad→hvad"> + <pattern mark_from="1" > + <token><exception postag="pro:.*" postag_regexp="yes"/></token> + <token>vad</token> + </pattern> + <message>Vad er et efternavn eller et vadested, mener du <suggestion>hvad</suggestion>.</message> + <short>Mulige ordforveksling</short> + <example correction="hvad" type="incorrect">Den er fundet, <marker>vad</marker> så nu.</example> + <example type="correct">Hvad end de gjorde, så havde de held med det.</example> + </rule> + </category> + <!-- ====================================================================== --> + <!-- Forkortelser med eller uden punktum - abbreviation --> + <!-- ====================================================================== --> + <category name="Forkortelser med eller uden punktum"> + <rule id="fx" name="fx.→fx"> + <pattern mark_from="0" > + <token>fx</token> + <token>.</token> + </pattern> + <message>For eksempel forkortes <suggestion>fx</suggestion> uden punktum eller <suggestion>f.eks.</suggestion></message> + <short>Mulig overflødigt punktum</short> + <example correction="fx|f.eks." type="incorrect">Som <marker>fx.</marker> jern.</example> + <example type="correct">Som fx jern.</example> + <example type="correct">Som f.eks. jern.</example> + </rule> + </category> + <!-- ====================================================================== --> + <!-- Grammatik - Grammar --> + <!-- ====================================================================== --> + <category name="Grammatik"> + <rule id="adj-ube-sin-utr-pos" name="(fejlbehæftet regel) Tillægsord ental ubestemt i forkert bøjningsform" default="off"> + <pattern mark_from="1" > + <token regexp="yes">et|det</token> + <!-- TODO: Make exception for adverbs, when they becomes available in tagger or analyzes the relationship between adjectives and other parts of speech. --> + <token postag="adj:ube:sin:utr:pos" postag_regexp="yes" regexp="yes">.*[a-s,u-å]<exception postag="sub:.*:neu:.*" postag_regexp="yes">før</exception></token> + </pattern> + <message>Ved at der står "\1" skal tilægsord <suggestion>\2t</suggestion> være intetkøn</message> + <short>Muligvis tillægsord i forker form</short> + <example correction="syndigt" type="incorrect">Et <marker>syndig</marker> rod.</example> + <example correction="ovalt" type="incorrect">Det er et <marker>oval</marker> køkkenbord.</example> + <example type="correct">Det er et ret visende eksempel.</example> + <example type="correct">Et syndigt rod.</example> + <example type="correct">Tidligere var det syndigt at vise sine ankler.</example> + </rule> + </category> +</rules> |