diff options
Diffstat (limited to 'JLanguageTool/src/resource/ru')
-rw-r--r-- | JLanguageTool/src/resource/ru/compounds_ru.txt | 187 | ||||
-rw-r--r-- | JLanguageTool/src/resource/ru/disambiguation.xml | 147 | ||||
-rw-r--r-- | JLanguageTool/src/resource/ru/make-dict-ru.sh | 16 | ||||
-rw-r--r-- | JLanguageTool/src/resource/ru/russian.dict | bin | 0 -> 1665990 bytes | |||
-rw-r--r-- | JLanguageTool/src/resource/ru/russian.info | 14 | ||||
-rw-r--r-- | JLanguageTool/src/resource/ru/russian_synth.dict | bin | 0 -> 1122232 bytes | |||
-rw-r--r-- | JLanguageTool/src/resource/ru/russian_synth.info | 15 | ||||
-rw-r--r-- | JLanguageTool/src/resource/ru/russian_tags.txt | 584 | ||||
-rw-r--r-- | JLanguageTool/src/resource/ru/synteza.awk | 2 | ||||
-rw-r--r-- | JLanguageTool/src/resource/ru/tags.awk | 2 | ||||
-rw-r--r-- | JLanguageTool/src/resource/ru/tags_russian.txt | 398 |
11 files changed, 1365 insertions, 0 deletions
diff --git a/JLanguageTool/src/resource/ru/compounds_ru.txt b/JLanguageTool/src/resource/ru/compounds_ru.txt new file mode 100644 index 0000000..03a06e5 --- /dev/null +++ b/JLanguageTool/src/resource/ru/compounds_ru.txt @@ -0,0 +1,187 @@ +# LanguageTool, a natural language style checker (http://www.languagetool.org) +# Copyright (C) 2005 Daniel Naber (http://www.danielnaber.de) + +# Russian compound words that are usually not written as +# separate words. +# Encoding: UTF-8 +# All words must contain at least one hyphen, even if the +# word is usually not spelled with a hyphen +# "+" at the end of the line will turn of the suggestion that +# Все слова в этом списке должны содержать дефис, даже в которых дефис не должен употребляться. + +# @author Yakov Reztsov + +# uses a hyphen +# слитно или через дефис + +естественно-научный +# Discussion about this word: http://forum.gramota.ru/forum/read.php?f=2&i=1125&t=1125 + + +# "+" at end of line = no hyphen suggestion: +# только слитно + +кругло-суточный+ +черно-морский+ + + +# "*" at end of line = only offer hyphen suggestion: +# только через дефис + +Алма-Ата* +аварийно-спасательный* +альфа-версия* +бизнес-план* +бета-версия* +#в-третьих* +#в-четвертых* +#в-четвёртых* +#в-пятых* +#в-шестых* +валютно-кредитных* +#во-вторых* +во-первых* +Волго-Вятский* +всё-таки* +государственно-правовой* +денежно-кредитное* +еле-еле* +Западно-Сибирский* +идейно-художественное* +из-за* +инженерно-саперный* +информационно-вычислительный* +Кабардино-Балкария* +какие-нибудь* +какие-то* +какие-либо* +какой-нубудь* +какой-то* +какой-либо* +какое-либо* +какое-то* +какое-нибудь* +какому-либо* +какому-то* +какому-нибудь* +конференц-зал* +Карачаево-Черкессия* +Китай-Город* +кое-где* +кое-кто* +кое-что* +кое-кому* +кое-чему* +кое-кого* +кое-чего* +кое-кем* +кое-чем* +кой-кого* +кой-кому* +кому-то* +кому-либо* +кому-нибудь* +Конституционно-демократическая* +контр-адмирал* +кто-либо* +кто-нибудь* +кто-то* +логико-методологический* +любо-дорого* +Маныч-Гудило* +микро-математическая* +Монголо-татарское* +научно-производственный* +Нью-Йорк* +организационно-научный* +по-видимому* +#по-моему* +#по-настоящему* +#по-разному* +по-над* +по-за* +подобру-поздорову* +природно-климатический* +программно-технический* +рок-музыка* +рок-н-ролл* +Ростов-на-Дону* +Сан-Франциско* +Санкт-Петербург* +Северо-Западный* +социально-ориентированной* +социально-экономический* +так-таки* +такому-то* +такому-либо* +такому-нибудь* +технико-экономический* +точь-в-точь* +тихо-тихо* +Усть-Лабинск* +финансово-экономический* +фирма-производитель* +функционально-стоимостной* +цвето-звуковой* +Центрально-Черноземный* +Центрально-Чернозёмный* +что-нибудь* +что-либо* +что-нибудь* +хард-рок* +северо-западный* +северо-западного* +северо-западному* +северо-западным* +северо-западном* +северо-западная* +северо-западной* +северо-западную* +северо-западное* +северо-западные* +северо-западных* +северо-западным* +северо-западными* +юго-западный* +юго-западного* +юго-западному* +юго-западным* +юго-западном* +юго-западная* +юго-западной* +юго-западную* +юго-западное* +юго-западные* +юго-западных* +юго-западным* +юго-западными* +северо-восточный* +северо-восточного* +северо-восточному* +северо-восточным* +северо-восточном* +северо-восточная* +северо-восточной* +северо-восточную* +северо-восточное* +северо-восточные* +северо-восточных* +северо-восточным* +северо-восточными* +юго-восточный* +юго-восточного* +юго-восточному* +юго-восточным* +юго-восточном* +юго-восточная* +юго-восточной* +юго-восточную* +юго-восточное* +юго-восточные* +юго-восточных* +юго-восточным* +юго-восточными* +юго-восток* +северо-восток* +юго-запад* +северо-запад* diff --git a/JLanguageTool/src/resource/ru/disambiguation.xml b/JLanguageTool/src/resource/ru/disambiguation.xml new file mode 100644 index 0000000..9d22cea --- /dev/null +++ b/JLanguageTool/src/resource/ru/disambiguation.xml @@ -0,0 +1,147 @@ +<?xml version="1.0" encoding="utf-8"?> +<!-- +Disambiguation Russian Rules for LanguageTool (www.languagetool.org) +Copyright (C) 2009-2010 Yakov Reztsov +$Id$ +--> +<rules lang="ru" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" + xsi:noNamespaceSchemaLocation="../disambiguation.xsd"> + <!-- prepositions + R: + без, вместо, вокруг (prep & adv), для, до, из (изо), из-за, из-под, кроме, + напротив (prep & adv), около, от, после (prep & adv), посреди (prep & adv), + против, с*, со*, среди, у + + D: + к, ко, по* + + V: + в*, за*, на*, по*, под*, сквозь, через; о* + + T: + за*, между (prep & adv), над, перед, под*, с* + + P: + в*, на*, о*, при; по* + + --> + + <!-- disambiguation for nouns' --> + <rule name="NOUN_V" id="NOUN_V"> + <pattern mark="1"> + <token regexp="yes" skip="1">в|на|сквозь|через</token> + <and> + <token postag="NN:.*:.*:Nom" postag_regexp="yes"/> + <token postag="NN:.*:.*:V" postag_regexp="yes"><exception postag="NN:.*:.*:P" postag_regexp="yes" /></token> + </and> + </pattern> + <disambig><match no="2" postag="NN:.*:.*:V" postag_regexp="yes"/></disambig> + </rule> + <rule name="NOUN_V2" id="NOUN_V2"> + <pattern mark="1"> + <token regexp="yes" skip="1">за|под</token> + <and> + <token postag="NN:.*:.*:Nom" postag_regexp="yes"/> + <token postag="NN:.*:.*:V" postag_regexp="yes"><exception postag="NN:.*:.*:T" postag_regexp="yes" /></token> + </and> + </pattern> + <disambig><match no="2" postag="NN:.*:.*:V" postag_regexp="yes"/></disambig> + </rule> + <rule name="NOUN_R" id="NOUN_R"> + <pattern mark="1"> + <!-- без - родительный --> + <token skip="1" regexp="yes">без|безо|вместо|для|до|из|изо|из-за|из-под|кроме|около|от|против|среди|у</token> + <and> + <token postag="NN:.*:.*:V" postag_regexp="yes"/> + <token postag="NN:.*:.*:R" postag_regexp="yes"/> + </and> + </pattern> + <disambig><match no="2" postag="NN:.*:.*:R" postag_regexp="yes"/></disambig> + </rule> + <rule name="NOUN_D" id="NOUN_D"> + <pattern mark="1"> + <token regexp="yes" skip="1">к|ко</token> + <!-- по - дательный, винительный, предложный --> + <!-- к - дательный --> + <and> + <token postag="NN:.*:.*:P" postag_regexp="yes"/> + <token postag="NN:.*:.*:D" postag_regexp="yes"/> + </and> + </pattern> + <disambig><match no="2" postag="NN:.*:.*:D" postag_regexp="yes"/></disambig> + </rule> + <rule name="NOUN_P" id="NOUN_P"> + <pattern mark="1"> + <!-- о - винительный, предложный --> + <token regexp="yes" skip="1">о|при</token> + <and> + <token postag="NN:.*:.*:D" postag_regexp="yes"/> + <token postag="NN:.*:.*:P" postag_regexp="yes"><exception postag="NN:.*:.*:V" postag_regexp="yes" /></token> + </and> + </pattern> + <disambig><match no="2" postag="NN:.*:.*:P" postag_regexp="yes"/></disambig> + </rule> + <!-- disambiguation for adj.' --> + <rule name="ADJ_T" id="ADJ_T"> + <pattern mark="1"> + <!-- с - родительный, винительный, творительный --> + <!-- под - винительный, творительный --> + <token regexp="yes">под|подо|над|перед</token> + <and> + <token postag="ADJ:.*:R" postag_regexp="yes"/> + <token postag="ADJ:.*:T" postag_regexp="yes"/> + </and> + </pattern> + <disambig><match no="2" postag="ADJ:.*:T" postag_regexp="yes"/></disambig> + </rule> + <rule name="ADJ_V" id="ADJ_V"> + <pattern mark="1"> + <token regexp="yes">в|за|на|под|сквозь|через</token> + <and> + <token postag="ADJ:.*:Nom" postag_regexp="yes"/> + <token postag="ADJ:.*:V" postag_regexp="yes" ><exception postag="ADJ:.*:P" postag_regexp="yes" /></token> + </and> + </pattern> + <disambig><match no="2" postag="ADJ:.*:V" postag_regexp="yes"/></disambig> + </rule> + <rule name="ADJ_V2" id="ADJ_V2"> + <pattern mark="1"> + <token regexp="yes">за|под</token> + <and> + <token postag="ADJ:.*:Nom" postag_regexp="yes"/> + <token postag="ADJ:.*:V" postag_regexp="yes" ><exception postag="ADJ:.*:T" postag_regexp="yes" /></token> + </and> + </pattern> + <disambig><match no="2" postag="ADJ:.*:V" postag_regexp="yes"/></disambig> + </rule> + <rule name="ADJ_R" id="ADJ_R"> + <pattern mark="1"> + <token regexp="yes">без|безо|вместо|для|до|из|изо|из-за|из-под|кроме|около|от|против|среди|у</token> + <and> + <token postag="ADJ:.*:D" postag_regexp="yes"/> + <token postag="ADJ:.*:R" postag_regexp="yes"/> + </and> + </pattern> + <disambig><match no="2" postag="ADJ:.*:R" postag_regexp="yes"/></disambig> + </rule> + <rule name="ADJ_D" id="ADJ_D"> + <pattern mark="1"> + <token regexp="yes">к|ко</token> + <and> + <token postag="ADJ:.*:P" postag_regexp="yes"/> + <token postag="ADJ:.*:D" postag_regexp="yes"><exception postag="ADJ:.*:V" postag_regexp="yes" /></token> + </and> + </pattern> + <disambig><match no="2" postag="ADJ:.*:D" postag_regexp="yes"/></disambig> + </rule> + <rule name="ADJ_P" id="ADJ_P"> + <pattern mark="1"> + <token regexp="yes">о|при</token> + <and> + <token postag="ADJ:.*:D" postag_regexp="yes"/> + <token postag="ADJ:.*:P" postag_regexp="yes"><exception postag="ADJ:.*:V" postag_regexp="yes" /></token> + </and> + </pattern> + <disambig><match no="2" postag="ADJ:.*:P" postag_regexp="yes"/></disambig> + </rule> +</rules>
\ No newline at end of file diff --git a/JLanguageTool/src/resource/ru/make-dict-ru.sh b/JLanguageTool/src/resource/ru/make-dict-ru.sh new file mode 100644 index 0000000..64fe938 --- /dev/null +++ b/JLanguageTool/src/resource/ru/make-dict-ru.sh @@ -0,0 +1,16 @@ +#!/bin/sh + +LANG=POSIX +TMP_OUTPUT=inp1.txt +TMP_GET=input.txt +OUTPUT=russian.dict +OUTPUT_SYNTH=russian_synth.dict +rm $TMP_OUTPUT +cat $TMP_GET | sort -u >$TMP_OUTPUT +#create normal dictionary +gawk -f morph_data.awk $TMP_OUTPUT | ./fsa_ubuild -O -o $OUTPUT +echo "Output written to $OUTPUT" +#create synthesis dictionary +gawk -f synteza.awk $TMP_OUTPUT | gawk -f morph_data.awk | sort -u | ./fsa_ubuild -O -o $OUTPUT_SYNTH +gawk -f tags.awk $TMP_OUTPUT |sort -u >tags_russian.txt +echo "Output written to $OUTPUT_SYNTH" diff --git a/JLanguageTool/src/resource/ru/russian.dict b/JLanguageTool/src/resource/ru/russian.dict Binary files differnew file mode 100644 index 0000000..8986cf1 --- /dev/null +++ b/JLanguageTool/src/resource/ru/russian.dict diff --git a/JLanguageTool/src/resource/ru/russian.info b/JLanguageTool/src/resource/ru/russian.info new file mode 100644 index 0000000..c232936 --- /dev/null +++ b/JLanguageTool/src/resource/ru/russian.info @@ -0,0 +1,14 @@ +# +# Dictionary properties. +# +# Russian dictionary originally developed by www.aot.ru and licensing under LGPL. +# http://www.aot.ru/download.php file rus-src-morph.tar.gz +# or http://seman.svn.sourceforge.net/viewvc/seman/trunk/Dicts/SrcMorph/RusSrc/morphs.mrd?revision=99 +# It was partially converted to fsa format in 2008, 2010 by Yakov Reztsov. + + +fsa.dict.separator=+ +fsa.dict.encoding=koi8-r + +fsa.dict.uses-prefixes=false +fsa.dict.uses-infixes=false
\ No newline at end of file diff --git a/JLanguageTool/src/resource/ru/russian_synth.dict b/JLanguageTool/src/resource/ru/russian_synth.dict Binary files differnew file mode 100644 index 0000000..80da016 --- /dev/null +++ b/JLanguageTool/src/resource/ru/russian_synth.dict diff --git a/JLanguageTool/src/resource/ru/russian_synth.info b/JLanguageTool/src/resource/ru/russian_synth.info new file mode 100644 index 0000000..0cfa496 --- /dev/null +++ b/JLanguageTool/src/resource/ru/russian_synth.info @@ -0,0 +1,15 @@ +# +# Dictionary properties. +# +# Russian dictionary originally developed by www.aot.ru and licensing under LGPL. +# http://www.aot.ru/download.php file rus-src-morph.tar.gz +# or http://seman.svn.sourceforge.net/viewvc/seman/trunk/Dicts/SrcMorph/RusSrc/morphs.mrd?revision=99 +# It was partially converted to synthesizer dictionary +# in fsa format in 2009, 2010 by Yakov Reztsov. + + +fsa.dict.separator=+ +fsa.dict.encoding=koi8-r + +fsa.dict.uses-prefixes=false +fsa.dict.uses-infixes=false
\ No newline at end of file diff --git a/JLanguageTool/src/resource/ru/russian_tags.txt b/JLanguageTool/src/resource/ru/russian_tags.txt new file mode 100644 index 0000000..85494b5 --- /dev/null +++ b/JLanguageTool/src/resource/ru/russian_tags.txt @@ -0,0 +1,584 @@ +# Russian dictionary originaly developed by www.aot.ru and licensing under LGPL. +# It partially converted to fsa format in 2008, 2010 by Yakov Reztsov. + +# Table of conversion between aot's ancodes and fsa's tags. +# + + + аа NN:Masc:Sin:Nom + аб NN:Masc:Sin:R + ав NN:Masc:Sin:D + аг NN:Masc:Sin:V + ад NN:Masc:Sin:T + ае NN:Masc:Sin:P + аж NN:Masc:PL:Nom + аз NN:Masc:PL:R + аи NN:Masc:PL:D + ай NN:Masc:PL:V + ак NN:Masc:PL:T + ал NN:Masc:PL:P + яа ADV + ам NN:Masc + ан NN:Masc + ао ABR + ап ABR + ас NN:Masc + ат ABR + ау ABR + ач ABR + аъ ABR + га NN:Fem:Sin:Nom + гб NN:Fem:Sin:R + гв NN:Fem:Sin:D + гг NN:Fem:Sin:V + гд NN:Fem:Sin:T + гд NN:Fem:Sin:T + ге NN:Fem:Sin:P + гж NN:Fem:PL:Nom + гз NN:Fem:PL:R + ги NN:Fem:PL:D + гй NN:Fem:PL:V + гк NN:Fem:PL:T + гл NN:Fem:PL:P + гн NN:Fem + еа NN:Neut:Sin:Nom + еб NN:Neut:Sin:R + ев NN:Neut:Sin:D + ег NN:Neut:Sin:V + ед NN:Neut:Sin:T + ее NN:Neut:Sin:P + еж NN:Neut:PL:Nom + еж NN:Neut:PL:Nom + ез NN:Neut:PL:R + ез NN:Neut:PL:R + еи NN:Neut:PL:D + еи NN:Neut:PL:D + ей NN:Neut:PL:V + ей NN:Neut:PL:V + ек NN:Neut:PL:T + ек NN:Neut:PL:T + ел NN:Neut:PL:P + ел NN:Neut:PL:P + бН NNN:Masc + бо NNN:Masc:Sin:Nom + бп NNN:Masc:Sin:R + бр NNN:Masc:Sin:D + бс NNN:Masc:Sin:V + бт NNN:Masc:Sin:T + бу NNN:Masc:Sin:P + бф NNN:Masc:PL:Nom + бх NNN:Masc:PL:R + бц NNN:Masc:PL:D + бч NNN:Masc:PL:V + бш NNN:Masc:PL:T + бщ NNN:Masc:PL:P + Ра NNP:Masc:Sin:Nom + Рб NNP:Masc:Sin:R + Рв NNP:Masc:Sin:D + Рг NNP:Masc:Sin:V + Рд NNP:Masc:Sin:T + Ре NNP:Masc:Sin:P + Рн NNP:Masc:PL:Nom + Ро NNP:Masc:PL:R + Рп NNP:Masc:PL:D + Рр NNP:Masc:PL:V + Рс NNP:Masc:PL:T + Рт NNP:Masc:PL:P + Рж NNP:Fem:Sin:Nom + Рз NNP:Fem:Sin:R + Ри NNP:Fem:Sin:D + Рк NNP:Fem:Sin:V + Рл NNP:Fem:Sin:T + Рм NNP:Fem:Sin:P + Ру NNP:Fem:PL:Nom + Рф NNP:Fem:PL:R + Рх NNP:Fem:PL:D + Рц NNP:Fem:PL:V + Рч NNP:Fem:PL:T + Рш NNP:Fem:PL:P + Та NNP:Masc:Sin:Nom:Talk + Тб NNP:Masc:Sin:R:Talk + Тв NNP:Masc:Sin:D:Talk + Тг NNP:Masc:Sin:V:Talk + Тд NNP:Masc:Sin:T:Talk + Те NNP:Masc:Sin:P:Talk + Тн NNP:Masc:PL:Nom:Talk + То NNP:Masc:PL:R:Talk + Тп NNP:Masc:PL:D:Talk + Тр NNP:Masc:PL:V:Talk + Тс NNP:Masc:PL:T:Talk + Тт NNP:Masc:PL:P:Talk + до NNN:Fem:Sin:Nom + дп NNN:Fem:Sin:R + др NNN:Fem:Sin:D + дс NNN:Fem:Sin:V + дт NNN:Fem:Sin:T + дт NNN:Fem:Sin:T + ду NNN:Fem:Sin:P + дф NNN:Fem:PL:Nom + дх NNN:Fem:PL:R + дц NNN:Fem:PL:D + дч NNN:Fem:PL:V + дш NNN:Fem:PL:T + дщ NNN:Fem:PL:P + йа ADJ:Masc:Nom + йб ADJ:Masc:R + йв ADJ:Masc:D + йг ADJ:Masc:V + Рщ ADJ:Masc:V + йд ADJ:Masc:T + йе ADJ:Masc:P + йж ADJ:Fem:Nom + йз ADJ:Fem:R + йи ADJ:Fem:D + йй ADJ:Fem:V + йк ADJ:Fem:T + йл ADJ:Fem:P + йм ADJ:Neut:Nom + йн ADJ:Neut:R + йо ADJ:Neut:D + йп ADJ:Neut:V + йр ADJ:Neut:T + йс ADJ:Neut:P + йт ADJ:PL:Nom + йу ADJ:PL:R + йф ADJ:PL:D + йх ADJ:PL:V + Рь ADJ:PL:V + йц ADJ:PL:T + йч ADJ:PL:P + йш ADJ_Short:Masc + йщ ADJ_Short:Fem + йы ADJ_Short:Neut + йэ ADJ_Short:PL + йю ADJ_Comp + йъ ADJ_Comp + ка VB:INF + кз VB:Past:Masc + ки VB:Past:Fem + кй VB:Past:Neut + кк VB:Past:PL + кп VB:Fut:Sin:P1 + кр VB:Fut:PL:P1 + кс VB:Fut:Sin:P2 + кт VB:Fut:PL:P2 + ку VB:Fut:Sin:P3 + кф VB:Fut:PL:P3 + ко DPT:Past + но VB:IMP:Sin:P1 + нп VB:IMP:PL:P1 + кл VB:IMP:Sin:P2 + км VB:IMP:PL:P2 + ма PT:Past:Masc:Nom + мб PT:Past:Masc:R + мв PT:Past:Masc:D + мг PT:Past:Masc:V + Лб PT:Past:Masc:V + мд PT:Past:Masc:T + ме PT:Past:Masc:P + мз PT:Past:Fem:Nom + ми PT:Past:Fem:R + мй PT:Past:Fem:D + мк PT:Past:Fem:V + мл PT:Past:Fem:T + мм PT:Past:Fem:P + мо PT:Past:Fem:Nom + мп PT:Past:Masc:R + мр PT:Past:Masc:D + мс PT:Past:Masc:V + мт PT:Past:Masc:T + му PT:Past:Masc:P + мх PT:Past:PL:Nom + мц PT:Past:PL:R + мч PT:Past:PL:D + мш PT:Past:PL:V + Лк PT:Past:PL:V + мщ PT:Past:PL:T + мы PT:Past:PL:P + са PT:Past:Masc:Nom + сб PT:Past:Masc:R + св PT:Past:Masc:D + сг PT:Past:Masc:V + Ле PT:Past:Masc:V + сд PT:Past:Masc:T + се PT:Past:Masc:P + сж PT:Past:Masc + сз PT:Past:Fem:Nom + си PT:Past:Fem:R + сй PT:Past:Fem:D + ск PT:Past:Fem:V + сл PT:Past:Fem:T + сл PT:Past:Fem:T + см PT:Past:Fem:P + сн PT:Past:Fem + со PT:Past:Neut + сп PT:Past:Masc:R + ср PT:Past:Masc:D + сс PT:Past:Neut + ст PT:Past:Masc:T + су PT:Past:Masc:P + сф PT:Past:Neut + сх PT:Past:PL:Nom + сц PT:Past:PL:R + сч PT:Past:PL:D + сш PT:Past:PL:V + Ло PT:Past:PL:V + сщ PT:Past:PL:T + сы PT:Past:PL:P + сэ PT:Past:PL + кб VB:Real:Sin:P1 + кв VB:Real:PL:P1 + кг VB:Real:Sin:P2 + кд VB:Real:PL:P2 + ке VB:Real:Sin:P3 + кж VB:Real:PL:P3 + кн DPT:Real + па PT:Real:Masc:Nom + пб PT:Real:Masc:R + пв PT:Real:Masc:D + пг PT:Real:Masc:V + Лг PT:Real:Masc:V + пд PT:Real:Masc:T + пе PT:Real:Masc:P + пж PT_Short:Real:Masc + пз PT:Real:Fem:Nom + пи PT:Real:Fem:R + пй PT:Real:Fem:D + пк PT:Real:Fem:V + пл PT:Real:Fem:T + пм PT:Real:Fem:P + пн PT_Short:Real:Fem + по PT:Real:Neut:Nom + пп PT:Real:Neut:R + пр PT:Real:Neut:D + пс PT:Real:Neut:V + пт PT:Real:Neut:T + пу PT:Real:Neut:P + пф PT_Short:Real:Neut + пх PT:Real:PL:Nom + пц PT:Real:PL:R + пч PT:Real:PL:D + пш PT:Real:PL:V + Лм PT:Real:PL:V + пщ PT:Real:PL:T + пы PT:Real:PL:P + пэ PT_Short:Real:PL + ла PT:Real:Masc:Nom + лб PT:Real:Masc:R + лв PT:Real:Masc:D + лг PT:Real:Masc:V + Ла PT:Real:Masc:V + лд PT:Real:Masc:T + ле PT:Real:Masc:P + лз PT:Real:Fem:Nom + ли PT:Real:Fem:R + лй PT:Real:Fem:D + лк PT:Real:Fem:V + лл PT:Real:Fem:T + лл PT:Real:Fem:T + лм PT:Real:Fem:P + ло PT:Real:Neut:Nom + лп PT:Real:Neut:R + лр PT:Real:Neut:D + лс PT:Real:Neut:V + лт PT:Real:Neut:T + лу PT:Real:Neut:P + лх PT:Real:PL:Nom + лц PT:Real:PL:R + лч PT:Real:PL:D + лш PT:Real:PL:V + Лй PT:Real:PL:V + лщ PT:Real:PL:T + лы PT:Real:PL:P + ка VB:INF + кз VB:Past:Masc + ки VB:Past:Fem + кй VB:Past:Neut + кк VB:Past:PL + кп VB:Fut:Sin:P1 + кр VB:Fut:PL:P1 + кс VB:Fut:Sin:P2 + кт VB:Fut:PL:P2 + ку VB:Fut:Sin:P3 + кф VB:Fut:PL:P3 + ко DPT:Past + яб PRDC + яв PREP + яд CONJ + яе INTERJECTION + яж PARTICLE + яз PARENTHESIS + вж NNF:Nom:PL + вз NNF:PL:R + ви NNF:PL:D + вй NNF:PL:V + вк NNF:PL:T + вл NNF:PL:P + гм NNN:Fem:Sin + ид ADJ_S:Masc:Nom + ие ADJ_S:Masc:T + иа ADJ_S:Masc:Nom + иб ADJ_S:Masc:R + ив ADJ_S:Masc:D + иг ADJ_S:Masc:V + Гб ADJ_S:Masc:P + Гв ADJ_S:Fem:Nom + Гг ADJ_S:Fem:R + Гд ADJ_S:Fem:D + Ге ADJ_S:Fem:V + Гж ADJ_S:Fem:T + Гз ADJ_S:Fem:P + ин ADJ_S:Neut:Nom + ио ADJ_S:Neut:R + ип ADJ_S:Neut:D + ир ADJ_S:Neut:V + ис ADJ_S:Neut:T + ит ADJ_S:Neut:P + иу ADJ_S:PL:Nom + иф ADJ_S:PL:R + их ADJ_S:PL:D + иц ADJ_S:PL:V + ич ADJ_S:PL:V + иш ADJ_S:PL:T + ищ ADJ_S:PL:P + иж NN::PL:Nom + из NN::PL:R + ии NN::PL:D + ий NN::PL:V + ик NN::PL:T + ил NN::PL:P + ем NN:Neut + ва NN:Masc:Sin:Nom + NN:Fem:Sin:Nom + вб NN:Masc:Sin:R + NN:Fem:Sin:R + вв NN:Masc:Sin:D + NN:Fem:Sin:D + вг NN:Masc:Sin:V + NN:Fem:Sin:V + вд NN:Masc:Sin:T + NN:Fem:Sin:T + вд NN:Masc:Sin:T + NN:Fem:Sin:T + ве NN:Masc:Sin:P + NN:Fem:Sin:P + Тж NNP:Fem:Sin:Nom:Talk + Тз NNP:Fem:Sin:R:Talk + Ти NNP:Fem:Sin:D:Talk + Тк NNP:Fem:Sin:V:Talk + Тл NNP:Fem:Sin:T:Talk + Тм NNP:Fem:Sin:P:Talk + Ту NNP:Fem:PL:Nom:Talk + Тф NNP:Fem:PL:R:Talk + Тх NNP:Fem:PL:D:Talk + Тц NNP:Fem:PL:V:Talk + Тч NNP:Fem:PL:T:Talk + Тш NNP:Fem:PL:P:Talk + ыа PADJ:Masc:Nom + ыб PADJ:Masc:R + ыв PADJ:Masc:D + ыг PADJ:Masc:V + Лф PADJ:Masc:V + ыд PADJ:Masc:T + ые PADJ:Masc:P + ыж PADJ:Fem:Nom + ыз PADJ:Fem:R + ыи PADJ:Fem:D + ый PADJ:Fem:V + ык PADJ:Fem:T + ыл PADJ:Fem:P + ым PADJ:Neut:Nom + ын PADJ:Neut:R + ыо PADJ:Neut:D + ып PADJ:Neut:V + ыр PADJ:Neut:T + ыс PADJ:Neut:P + ыт PADJ:PL:Nom + ыу PADJ:PL:R + ыф PADJ:PL:D + ых PADJ:PL:V + Лх PADJ:PL:V + ыц PADJ:PL:T + ыч PADJ:PL:P + дН NN:Fem + эа NumC:Nom + эб NumC:R + эв NumC:D + эг NumC:V + эг NumC:V + эд NumC:T + эе NumC:P + юа Ord:Masc:Nom + юб Ord:Masc:R + юв Ord:Masc:D + юг Ord:Masc:V + Лт Ord:Masc:V + юд Ord:Masc:T + юе Ord:Masc:P + юж Ord:Fem:Nom + юз Ord:Fem:R + юи Ord:Fem:D + юк Ord:Fem:T + юл Ord:Fem:P + юм Ord:Neut:Nom + юн Ord:Neut:R + юо Ord:Neut:D + юп Ord:Neut:V + юр Ord:Neut:T + юс Ord:Neut:P + ют Ord:PL:Nom + юу Ord:PL:R + юф Ord:PL:D + юх Ord:PL:V + Лу Ord:PL:V + юц Ord:PL:T + юц Ord:PL:P + ча PNN:Sin:Nom:P1 + чб PNN:Sin:R:P1 + чв PNN:Sin:D:P1 + чг PNN:Sin:V:P1 + чд PNN:Sin:T:P1 + че PNN:Sin:P:P1 + вм NNF + ен NNN:Neut + Ют NN:Masc:Sin:T:Talk + Яа NN:Masc:R:Talk + ям PRDC + вО NNN:Masc:Sin:Nom + NNN:Fem:Sin:Nom + вП NNN:Masc:Sin:R + NNN:Fem:Sin:R + вР NNN:Masc:Sin:D + NNN:Fem:Sin:D + вС NNN:Masc:Sin:V + NNN:Fem:Sin:V + вТ NNN:Masc:Sin:T + NNN:Fem:Sin:T + вУ NNN:Masc:Sin:P + NNN:Fem:Sin:P + вФ NNN:Masc:PL:Nom + NNN:Fem:PL:Nom + вХ NNN:Masc:PL:R + NNN:Fem:PL:R + вЦ NNN:Masc:PL:D + NNN:Fem:PL:D + вЧ NNN:Masc:PL:V + NNN:Fem:PL:V + вШ NNN:Masc:PL:T + NNN:Fem:PL:T + вЩ NNN:Masc:PL:P + NNN:Fem:PL:P + щм PNN:Sin:Nom + щн PNN:Sin:R + щу PNN:Sin:D + щп PNN:Sin:V + щр PNN:Sin:T + щс PNN:Sin:P + щт PNN:PL:Nom + щу PNN:PL:P + щф PNN:PL:D + щх PNN:PL:V + щц PNN:PL:T + щч PNN:PL:P + чт PNN:PL:Nom:P2 + чу PNN:PL:R:P2 + чф PNN:PL:D:P2 + чх PNN:PL:V:P2 + чц PNN:PL:T:P2 + чч PNN:PL:P:P2 + эж Num:Masc:Nom + эз Num:Masc:R + эи Num:Masc:D + эй Num:Masc:V + эк Num:Masc:T + эл Num:Masc:P + эм Num:Fem:Nom + эн Num:Fem:R + эо Num:Fem:D + эп Num:Fem:V + эр Num:Fem:T + эс Num:Fem:P + эт Num:Neut:Nom + эу Num:Neut:R + эф Num:Neut:D + эх Num:Neut:V + эц Num:Neut:T + эч Num:Neut:P + юй Ord:Fem:V + юч Ord:PL:P + яё INTERJECTION + Эх NN:Masc:Sin:P + йя ADJ + бь NNN:Masc:Sin::Talk + Эф NN:Masc:Sin:R + дь NNN:Fem:Sin::Talk + щж PNN:Sin:Nom + щз PNN:Sin:R + щи PNN:Sin:D + щй PNN:Sin:V + щк PNN:Sin:T + щл PNN:Sin:P + ща PNN:Sin:Nom + щб PNN:Sin:R + щв PNN:Sin:D + щг PNN:Sin:V + щд PNN:Sin:T + ще PNN:Sin:P + що PNN:Sin:D + ян ADV + ша PNN:Sin:Nom:P3 + шб PNN:Sin:R:P3 + шв PNN:Sin:D:P3 + шг PNN:Sin:V:P3 + шд PNN:Sin:T:P3 + ше PNN:Sin:P:P3 + шж PNN:Sin:Nom:P3 + шз PNN:Sin:R:P3 + ши PNN:Sin:D:P3 + шй PNN:Sin:V:P3 + шк PNN:Sin:T:P3 + шл PNN:Sin:P:P3 + шт PNN:PL:Nom:P3 + шу PNN:PL:R:P3 + шф PNN:PL:D:P3 + шх PNN:PL:V:P3 + шц PNN:PL:T:P3 + шч PNN:PL:P:P3 + шм PNN:Sin:Nom:P3 + шн PNN:Sin:R:P3 + шо PNN:Sin:D:P3 + шп PNN:Sin:V:P3 + шр PNN:Sin:T:P3 + шс PNN:Sin:P:P3 + яо ADV + чм PNN:Sin:Nom:P2 + чн PNN:Sin:R:P2 + чо PNN:Sin:D:P2 + чп PNN:Sin:V:P2 + чр PNN:Sin:T:P2 + чс PNN:Sin:P:P2 + яй Misc + нр VB:INF + нт VB:Past + ну VB:Real + нс VB:Fut + Яб NN:Masc:PL:Nom:Talk + Яв NN:Masc:PL:D:Talk + Яа NN:Masc:PL:R:Talk + Яг NN:Masc:PL:V:Talk + Яд NN:Masc:PL:T:Talk + Яж NN:Masc:PL:P:Talk + Йх NNN:Fem:PL:Nom:Talk + Йу NNN:Fem:PL:R:Talk + Йф NNN:Fem:PL:D:Talk + Йх NNN:Fem:PL:V:Talk + Йц NNN:Fem:PL:T:Talk + Йч NNN:Fem:PL:P:Talk + ял PRDC + чж PNN:PL:Nom:P1 + чз PNN:PL:R:P1 + чи PNN:PL:D:P1 + чй PNN:PL:V:P1 + чк PNN:PL:T:P1 + чл PNN:PL:P:P1 + diff --git a/JLanguageTool/src/resource/ru/synteza.awk b/JLanguageTool/src/resource/ru/synteza.awk new file mode 100644 index 0000000..6769579 --- /dev/null +++ b/JLanguageTool/src/resource/ru/synteza.awk @@ -0,0 +1,2 @@ +BEGIN {FS="\t"} +{print $2"|"$3"\t"$1} diff --git a/JLanguageTool/src/resource/ru/tags.awk b/JLanguageTool/src/resource/ru/tags.awk new file mode 100644 index 0000000..691d8b3 --- /dev/null +++ b/JLanguageTool/src/resource/ru/tags.awk @@ -0,0 +1,2 @@ +BEGIN {FS="\t"} +{print $3}
\ No newline at end of file diff --git a/JLanguageTool/src/resource/ru/tags_russian.txt b/JLanguageTool/src/resource/ru/tags_russian.txt new file mode 100644 index 0000000..bfe7160 --- /dev/null +++ b/JLanguageTool/src/resource/ru/tags_russian.txt @@ -0,0 +1,398 @@ +ABR +ADJ +ADJ:Fem:D +ADJ:Fem:Nom +ADJ:Fem:P +ADJ:Fem:R +ADJ:Fem:T +ADJ:Fem:V +ADJ:Masc:D +ADJ:Masc:Nom +ADJ:Masc:P +ADJ:Masc:R +ADJ:Masc:T +ADJ:Masc:V +ADJ:Neut:D +ADJ:Neut:Nom +ADJ:Neut:P +ADJ:Neut:R +ADJ:Neut:T +ADJ:Neut:V +ADJ:PL:D +ADJ:PL:Nom +ADJ:PL:P +ADJ:PL:R +ADJ:PL:T +ADJ:PL:V +ADJ_Comp +ADJ_S:Fem:D +ADJ_S:Fem:Nom +ADJ_S:Fem:P +ADJ_S:Fem:R +ADJ_S:Fem:T +ADJ_S:Fem:V +ADJ_S:Masc:D +ADJ_S:Masc:Nom +ADJ_S:Masc:P +ADJ_S:Masc:R +ADJ_S:Masc:T +ADJ_S:Masc:V +ADJ_S:Neut:D +ADJ_S:Neut:Nom +ADJ_S:Neut:P +ADJ_S:Neut:R +ADJ_S:Neut:T +ADJ_S:Neut:V +ADJ_S:PL:D +ADJ_S:PL:Nom +ADJ_S:PL:P +ADJ_S:PL:R +ADJ_S:PL:T +ADJ_S:PL:V +ADJ_Short:Fem +ADJ_Short:Masc +ADJ_Short:Neut +ADJ_Short:PL +ADV +CONJ +DPT:Past +DPT:Real +INTERJECTION +Misc +NN::PL:D +NN::PL:Nom +NN::PL:P +NN::PL:R +NN::PL:T +NN::PL:V +NN:Fem +NN:Fem:PL:D +NN:Fem:PL:Nom +NN:Fem:PL:P +NN:Fem:PL:R +NN:Fem:PL:T +NN:Fem:PL:V +NN:Fem:Sin:D +NN:Fem:Sin:Nom +NN:Fem:Sin:P +NN:Fem:Sin:R +NN:Fem:Sin:T +NN:Fem:Sin:V +NN:Masc +NN:Masc:PL:D +NN:Masc:PL:D:Talk +NN:Masc:PL:Nom +NN:Masc:PL:Nom:Talk +NN:Masc:PL:P +NN:Masc:PL:P:Talk +NN:Masc:PL:R +NN:Masc:PL:T +NN:Masc:PL:T:Talk +NN:Masc:PL:V +NN:Masc:PL:V:Talk +NN:Masc:R:Talk +NN:Masc:Sin:D +NN:Masc:Sin:Nom +NN:Masc:Sin:P +NN:Masc:Sin:R +NN:Masc:Sin:T +NN:Masc:Sin:T:Talk +NN:Masc:Sin:V +NN:Mascx:Sin:D +NN:Neut +NN:Neut:PL:D +NN:Neut:PL:Nom +NN:Neut:PL:P +NN:Neut:PL:R +NN:Neut:PL:T +NN:Neut:PL:V +NN:Neut:Sin:D +NN:Neut:Sin:Nom +NN:Neut:Sin:P +NN:Neut:Sin:R +NN:Neut:Sin:T +NN:Neut:Sin:V +NNF +NNF:Nom:PL +NNF:PL:D +NNF:PL:P +NNF:PL:R +NNF:PL:T +NNF:PL:V +NNN:Fem:PL:D +NNN:Fem:PL:D:Talk +NNN:Fem:PL:Nom +NNN:Fem:PL:Nom:Talk +NNN:Fem:PL:P +NNN:Fem:PL:R +NNN:Fem:PL:R:Talk +NNN:Fem:PL:T +NNN:Fem:PL:T:Talk +NNN:Fem:PL:V +NNN:Fem:Sin +NNN:Fem:Sin::Talk +NNN:Fem:Sin:D +NNN:Fem:Sin:Nom +NNN:Fem:Sin:P +NNN:Fem:Sin:R +NNN:Fem:Sin:T +NNN:Fem:Sin:V +NNN:Masc +NNN:Masc:PL:D +NNN:Masc:PL:Nom +NNN:Masc:PL:P +NNN:Masc:PL:R +NNN:Masc:PL:T +NNN:Masc:PL:V +NNN:Masc:Sin::Talk +NNN:Masc:Sin:D +NNN:Masc:Sin:Nom +NNN:Masc:Sin:P +NNN:Masc:Sin:R +NNN:Masc:Sin:T +NNN:Masc:Sin:V +NNN:Neut +NNP:Fem:PL:D +NNP:Fem:PL:D:Talk +NNP:Fem:PL:Nom +NNP:Fem:PL:Nom:Talk +NNP:Fem:PL:P +NNP:Fem:PL:P:Talk +NNP:Fem:PL:R +NNP:Fem:PL:R:Talk +NNP:Fem:PL:T +NNP:Fem:PL:T:Talk +NNP:Fem:PL:V +NNP:Fem:PL:V:Talk +NNP:Fem:Sin:D +NNP:Fem:Sin:D:Talk +NNP:Fem:Sin:Nom +NNP:Fem:Sin:Nom:Talk +NNP:Fem:Sin:P +NNP:Fem:Sin:P:Talk +NNP:Fem:Sin:R +NNP:Fem:Sin:R:Talk +NNP:Fem:Sin:T +NNP:Fem:Sin:T:Talk +NNP:Fem:Sin:V +NNP:Fem:Sin:V:Talk +NNP:Masc:PL:D +NNP:Masc:PL:D:Talk +NNP:Masc:PL:Nom +NNP:Masc:PL:Nom:Talk +NNP:Masc:PL:P +NNP:Masc:PL:P:Talk +NNP:Masc:PL:R +NNP:Masc:PL:R:Talk +NNP:Masc:PL:T +NNP:Masc:PL:T:Talk +NNP:Masc:PL:V +NNP:Masc:PL:V:Talk +NNP:Masc:Sin:D +NNP:Masc:Sin:D:Talk +NNP:Masc:Sin:Nom +NNP:Masc:Sin:Nom:Talk +NNP:Masc:Sin:P +NNP:Masc:Sin:P:Talk +NNP:Masc:Sin:R +NNP:Masc:Sin:R:Talk +NNP:Masc:Sin:T +NNP:Masc:Sin:T:Talk +NNP:Masc:Sin:V +NNP:Masc:Sin:V:Talk +Num:Fem:D +Num:Fem:Nom +Num:Fem:P +Num:Fem:R +Num:Fem:T +Num:Fem:V +Num:Masc:D +Num:Masc:Nom +Num:Masc:P +Num:Masc:R +Num:Masc:T +Num:Masc:V +Num:Neut:D +Num:Neut:Nom +Num:Neut:P +Num:Neut:R +Num:Neut:T +Num:Neut:V +NumC:D +NumC:Nom +NumC:P +NumC:R +NumC:T +NumC:V +Ord:Fem:D +Ord:Fem:Nom +Ord:Fem:P +Ord:Fem:R +Ord:Fem:T +Ord:Fem:V +Ord:Masc:D +Ord:Masc:Nom +Ord:Masc:P +Ord:Masc:R +Ord:Masc:T +Ord:Masc:V +Ord:Neut:D +Ord:Neut:Nom +Ord:Neut:P +Ord:Neut:R +Ord:Neut:T +Ord:Neut:V +Ord:PL:D +Ord:PL:Nom +Ord:PL:P +Ord:PL:R +Ord:PL:T +Ord:PL:V +PADJ:Fem:D +PADJ:Fem:Nom +PADJ:Fem:P +PADJ:Fem:R +PADJ:Fem:T +PADJ:Fem:V +PADJ:Masc:D +PADJ:Masc:Nom +PADJ:Masc:P +PADJ:Masc:R +PADJ:Masc:T +PADJ:Masc:V +PADJ:Neut:D +PADJ:Neut:Nom +PADJ:Neut:P +PADJ:Neut:R +PADJ:Neut:T +PADJ:Neut:V +PADJ:PL:D +PADJ:PL:Nom +PADJ:PL:P +PADJ:PL:R +PADJ:PL:T +PADJ:PL:V +PARENTHESIS +PARTICLE +PNN:PL:D +PNN:PL:D:P1 +PNN:PL:D:P2 +PNN:PL:D:P3 +PNN:PL:Nom +PNN:PL:Nom:P1 +PNN:PL:Nom:P2 +PNN:PL:Nom:P3 +PNN:PL:P +PNN:PL:P:P1 +PNN:PL:P:P2 +PNN:PL:P:P3 +PNN:PL:R:P1 +PNN:PL:R:P2 +PNN:PL:R:P3 +PNN:PL:T +PNN:PL:T:P1 +PNN:PL:T:P2 +PNN:PL:T:P3 +PNN:PL:V +PNN:PL:V:P1 +PNN:PL:V:P2 +PNN:PL:V:P3 +PNN:Sin:D +PNN:Sin:D:P1 +PNN:Sin:D:P2 +PNN:Sin:D:P3 +PNN:Sin:Nom +PNN:Sin:Nom:P1 +PNN:Sin:Nom:P2 +PNN:Sin:Nom:P3 +PNN:Sin:P +PNN:Sin:P:P1 +PNN:Sin:P:P2 +PNN:Sin:P:P3 +PNN:Sin:R +PNN:Sin:R:P1 +PNN:Sin:R:P2 +PNN:Sin:R:P3 +PNN:Sin:T +PNN:Sin:T:P1 +PNN:Sin:T:P2 +PNN:Sin:T:P3 +PNN:Sin:V +PNN:Sin:V:P1 +PNN:Sin:V:P2 +PNN:Sin:V:P3 +PRDC +PREP +PT:Past:Fem +PT:Past:Fem:D +PT:Past:Fem:Nom +PT:Past:Fem:P +PT:Past:Fem:R +PT:Past:Fem:T +PT:Past:Fem:V +PT:Past:Masc +PT:Past:Masc:D +PT:Past:Masc:Nom +PT:Past:Masc:P +PT:Past:Masc:R +PT:Past:Masc:T +PT:Past:Masc:V +PT:Past:Neut +PT:Past:PL +PT:Past:PL:D +PT:Past:PL:Nom +PT:Past:PL:P +PT:Past:PL:R +PT:Past:PL:T +PT:Past:PL:V +PT:Real:Fem:D +PT:Real:Fem:Nom +PT:Real:Fem:P +PT:Real:Fem:R +PT:Real:Fem:T +PT:Real:Fem:V +PT:Real:Masc:D +PT:Real:Masc:Nom +PT:Real:Masc:P +PT:Real:Masc:R +PT:Real:Masc:T +PT:Real:Masc:V +PT:Real:Neut:D +PT:Real:Neut:Nom +PT:Real:Neut:P +PT:Real:Neut:R +PT:Real:Neut:T +PT:Real:Neut:V +PT:Real:PL:D +PT:Real:PL:Nom +PT:Real:PL:P +PT:Real:PL:R +PT:Real:PL:T +PT:Real:PL:V +PT_Short:Real:Fem +PT_Short:Real:Masc +PT_Short:Real:Neut +PT_Short:Real:PL +VB:Fut +VB:Fut:PL:P1 +VB:Fut:PL:P2 +VB:Fut:PL:P3 +VB:Fut:Sin:P1 +VB:Fut:Sin:P2 +VB:Fut:Sin:P3 +VB:IMP:PL:P1 +VB:IMP:PL:P2 +VB:IMP:Sin:P2 +VB:INF +VB:Past +VB:Past:Fem +VB:Past:Masc +VB:Past:Neut +VB:Past:PL +VB:Real +VB:Real:PL:P1 +VB:Real:PL:P2 +VB:Real:PL:P3 +VB:Real:Sin:P1 +VB:Real:Sin:P2 +VB:Real:Sin:P3 |