1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
|
**** BEGIN LOGGING AT Mon Feb 6 17:55:11 2006
feb 06 17:55:45 * korsi has changed the topic to: Koordineringsm�te for spell-norwegian
feb 06 17:55:52 korsi Hei
feb 06 18:00:13 pere hei. :)
feb 06 18:00:31 pere da var det norske stavekontrollprosjektet samlet. :)
feb 06 18:00:47 pere har du anledning til � skrive referat?
feb 06 18:01:17 korsi Jepp, det kan eg gjere.
feb 06 18:01:46 korsi Batteriet p� musa mi konka nettopp. Men f�r klare meg utan.
feb 06 18:02:07 pere da er vi igang. trist at Axel var opptatt.
feb 06 18:02:17 korsi Jepp
feb 06 18:02:49 korsi Eg har oppretta ei side p� wikien http://wiki.debian.org/SpellNorwegian/Meeting/20060206
feb 06 18:03:17 pere heh, den s� litt kjent ut. :)
feb 06 18:04:04 korsi Det kan du seie. Resultat av eit halvt minutts arbeid :)
feb 06 18:04:29 pere vi b�r diskutere pressemelding, ordklasseinfo, synonymordliste og generering av stavekontroll.
feb 06 18:04:50 korsi Ok, skal vi ta det i den rekkef�lga?
feb 06 18:04:55 pere la oss starte med pressemeldingen. har du sett p� utkastet? tror du den begynner � bli klar?
feb 06 18:05:19 korsi Eg har ikkje lest det grundig. Berre ein rask kikk.
feb 06 18:05:44 pere Ser at <URL:http://no.speling.org/pressrelease-200601.html > ikke er oppdatert. :(
feb 06 18:06:18 korsi Ok, kan du gi meg eit minutt p� � finne nye batteri til musa?
feb 06 18:06:27 pere jada
feb 06 18:09:33 pere ah, <URL: http://no.speling.org/pressemelding-2006-01-29.txt > er en bedre utgave.
feb 06 18:09:56 korsi slik ja, fann ei ny mus
feb 06 18:11:15 korsi Ok, det ser greit ut. Er det noko vi manglar?
feb 06 18:11:45 pere vet ikke. er den god nok til at journalister vil skrive om det?
feb 06 18:12:29 korsi Tja, vi b�r kanskje vinkle det meir mot OpenOffice og poengtere at det har vore eit problem lenge med d�rleg stavekontroll.
feb 06 18:13:04 korsi OpenOffice har meir gjennomslagskraft enn fri programvare generellt.
feb 06 18:13:31 pere hva har disse problemene med d�rlig stavekontroll g�tt ut p�? jeg fant ikke mye feil da jeg unders�kte OOo-pakken. to byggefeil var alt.
feb 06 18:15:03 korsi �Problemet� er at brukarar, kanskje spesiellt l�rarar, synes at stavekontrollen har for d�rleg kvalitet.
feb 06 18:15:31 pere hva betyr det? kan det etterpr�ves, eller er det bare en udefinerbar f�lelse?
feb 06 18:16:11 korsi Det kan heilt sikkert visast. Men eg kan ikkje vise til nokre unders�kjingar som seier det.
feb 06 18:16:43 pere ok, da g�r vi videre. hva mer b�r inn i pressemeldingen?
feb 06 18:17:24 korsi Vi treng ikkje skrive noko om at dagens stavekontroll er d�rleg. Men vi kan skrive at vi no har mulighet til � forbedre stavekontrollen i OpenOffice.
feb 06 18:18:02 * pere synes slutten p� meldingen er litt br�. det b�r ogs� inn et sitat fra en eller annen, slik at journalistene kan gi inntrykk av � ha snakket med noen hvis de lager artikkel. :)
feb 06 18:18:49 pere noe ala "bla bla stavekontroll er viktig bla bla", eller "bla bla bedrer kvaliteten p� spr�ket bla bla". :)
feb 06 18:19:43 korsi Jepp, det kan vi pr�ve � f� til. Skal vi pr�ve � f� ein uttalelse fr� nokon i skulen?
feb 06 18:19:48 pere jeg tror axel tok jobben med � fullf�re pressemeldingen, s� disse innspillene b�r til ham (f.eks. via referatet).
feb 06 18:20:06 korsi Notert.
feb 06 18:20:23 pere korsi: tror en uttalelse fra noen i prosjektet er bedre. f.eks. prosjektleder H�vard eller korrekturleser Axel. :)
feb 06 18:20:53 korsi Kanskje det er like greit, og litt enklare.
feb 06 18:21:01 pere noe mer om pressemeldingen? neste tema er ordklasser.
feb 06 18:21:13 korsi Vi g�r over til ordklassar.
feb 06 18:21:33 * pere har ikke peiling p� ordklasser, og overlater innholdet til andre.
feb 06 18:22:06 * korsi har lest over dokumentet i dag, og synes det byrjar � smake fisk.
feb 06 18:22:18 pere dog tror jeg det er lurt � begrense seg til en infoside som beskriver formatet, og samle bokm�l og nynorsk p� samme side (reduserer sjansen for sprik i forklaring av formatet).
feb 06 18:22:25 korsi Eller kva det var det smakte.
feb 06 18:22:30 pere fugl?
feb 06 18:22:41 korsi Einig med � samle begge m�la p� ei side.
feb 06 18:22:54 korsi Det er eitt punkt eg meiner vi m� klargjere
feb 06 18:23:09 pere dog er det �penbart av b�yningsm�nstrene er forskjellige, s� der m� det skrives to ulike blokker for nb og nn.
feb 06 18:23:10 korsi Det er CONJUGATION-RULE:
feb 06 18:23:47 korsi Der b�r vi ha inn referansane til b�yingsformane
feb 06 18:24:17 pere ja. hva skal formatet v�re?
feb 06 18:24:41 korsi Slik at entall/flertall og bestemt/ubestemt havnar i CONJUGATION, s� hamnar f1/m1/m2 osb. i CONJUGATION-RULE:
feb 06 18:25:23 pere nettopp. ogs� b�r vi v�re flink � bruke ROOT, som kan brukes til � samle alle b�yninger av samme ordet.
feb 06 18:25:40 korsi Einig.
feb 06 18:26:29 pere kan vi bruke samme navn i CLASS og CONJUGATION for nb og nn?
feb 06 18:27:00 pere CONJUGATION-RULE m� �penbart v�re forskjellig, da nb og nn jo b�yes forskjellig.
feb 06 18:27:21 korsi Ja det synes eg. Eg for min del trur det g�r greit � godtta fleire namn. Det er ikkje noko problem � lage skript som godttar det.
feb 06 18:27:29 pere hvis f1 brukes for nb, s� m� vi ha et annet navn for nn-hunnkj�nnsregel 1
feb 06 18:27:52 korsi Nei, det er ikkje n�dvendig. Det er to avskilte databasar
feb 06 18:27:58 pere kanskje f1n og f2b?
feb 06 18:28:27 korsi Vi har berre to tabellar, ein for bokm�l og ein for nynorsk.
feb 06 18:28:40 * pere er ikke s� sikker p� det. tror vi �nsker � prosessere dem i lag slik det gj�res med dagens byggsystem.
feb 06 18:29:22 pere i og med at det er mange ord som er like for begge.
feb 06 18:29:42 korsi Det er riktig, s� lenge vi snakkar om ein enkel �dum� stavekontroll, men n�r vi skal lage gramatisk kontroll m� vi noko dele.
feb 06 18:29:50 pere axel har skrevet bokm�l, hvem skriver nynorsk?
feb 06 18:30:13 korsi Eg kan gjere det. Skal f� nokon m�lfolk til � hjelpe meg.
feb 06 18:30:22 pere korsi: din optimisme er beundringsverdig. :) Det er vel ingen som er i n�rheten av � lage en fritt tilgjengelig gramatikk-kontroll.
feb 06 18:30:47 korsi Nettopp, derfor er det lenge til vi har bruk for den informasjonen vi samlar inn.
feb 06 18:31:05 pere hvis jeg har forst�tt formatet p� CONJUGATION_RULE korrekt, s� skal den inneholde referanse til regelsamling. hva skal vi skrive der?
feb 06 18:32:15 korsi Vi kan bruke felta slik vi sj�lv ynskjer. Eg ser det mest hensiktsmessig � setje inn kodane f1/m1/m2 i dette feltet.
feb 06 18:32:55 korsi Men vi kan self�lgelig referere til ei offisiell regelsamling
feb 06 18:33:53 pere formatet sier 'som <ord>' eller '<regelsamling>: <regel>'. 'f1' vil vel g� inn i '<regelsamling>: f1'?
feb 06 18:34:08 korsi Akkurat
feb 06 18:34:15 pere jeg lurer alts� p� hva vi skal skrive som <regelsamling>.
feb 06 18:35:09 korsi Jepp, det finst nokre offisielle dokument p� det trur eg. Trur Axel har brukt dei. Han har kanskje referansane.
feb 06 18:36:01 korsi N�r det gjeld orddeling, er det greit det som st�r i det feltet trur du?
feb 06 18:36:06 pere jeg mistenker at vi er bedre rustet hvis vi refererer til v�r egen regelsamling.
feb 06 18:36:49 korsi Kanskje det.
feb 06 18:37:01 pere korsi: ja. Kunne kanskje nevne at en kan ha mer enn ett ord i synonymet. dvs. kveld kan ha 'ved solnedgang' som synonym.
feb 06 18:37:23 korsi Einig.
feb 06 18:37:44 korsi Har du sett om ord som st�r i SYNONYM blir lagt inn i databasen som eigne ord?
feb 06 18:37:50 pere scriptet som genererer listen sjekker at alle ordene er akseptert i ordlisten f�r synonymet tas med.
feb 06 18:38:17 korsi Viss ikkje kva skjer med det? Det kan jo vere det b�r vere med i databasen.
feb 06 18:38:22 pere jeg aner ikke om ord overf�res fra SYNONYM til ordboken automatisk. tror ikke det, s� jeg har lagt inn de som mangler manuelt.
feb 06 18:38:39 * pere har litt problemer med � lese UTF-8. :/
feb 06 18:38:51 korsi Sorry, skal fikse
feb 06 18:39:22 pere ja, jeg tror ord b�r dukke opp med status '?' hvis de dukker opp for f�rste gang i SYNONYM.
feb 06 18:40:26 pere det er vel noe du eller jacob fikser? ROOT ser ut til � fores automatisk inn i databasen.
feb 06 18:41:18 korsi Jepp, trur Jacob sa noko om at det skulle fungere slik for SYNONYM. Men daa berre for eitt ord.
feb 06 18:41:28 pere :(
feb 06 18:41:54 korsi Eg kan be han om aa ordne det slik at fleire ord blir godtatt
feb 06 18:42:12 pere nydelig.
feb 06 18:42:22 pere forresten, er siste avsnitt i CLASS-beskrivelsen korrekt?
feb 06 18:43:04 korsi Om aa foere opp ord som tilhoyrer fleire klassar fleire gongar?
feb 06 18:43:35 pere selve eksemplene, tenker jeg p�.
feb 06 18:44:24 korsi hoppe, det er ein ho-hest
feb 06 18:44:39 korsi ei hoppe og � hoppe
feb 06 18:44:47 * pere er for�vring skeptisk til � ha paranteser i b�yningsnavnene for verbene. tror det f�rer til at noen bruker "Presens" andre bruker "N�tid", de tredje bruker "Presens (n�tid)"
feb 06 18:45:18 pere og databasen b�r inneholde entydige navn p� samme ting, dvs. enten Presens eller N�tid, men ikke begge.
feb 06 18:45:47 pere burde eksemplene hatt med CONJUGATION-RULE?
feb 06 18:46:08 korsi Ja det boer presieserast.
feb 06 18:46:12 korsi Det er nok lurt.
feb 06 18:46:26 pere filformat-oversikten b�r kanskje inneholde flere eksempler? F.eks. helt p� slutten.
feb 06 18:46:51 korsi OK, generelt bedre og fleire eksempel
feb 06 18:47:19 korsi Det kan eg fikse naar eg jobbar med nynorskversjonen.
feb 06 18:47:29 pere hm, tiden g�r. noe mer om filformat og b�yningsm�nster f�r vi fortsetter p� synonymordliste?
feb 06 18:47:35 korsi Nei
feb 06 18:47:56 korsi Du bygger automatisk no, ikkje sant?
feb 06 18:48:12 korsi Er det spesiellt for OpenOffice?
feb 06 18:48:15 pere ikke helt. det er noe galt som gj�r at 'sv�r' ikke ble h�ndtert korrekt.
feb 06 18:48:47 pere hvis du vil teste, kj�r 'make thesaurus-nb.new' og deretter diff -u 'theseurus-nb.new theseurus-nb.txt'
feb 06 18:49:01 korsi ok
feb 06 18:49:11 pere databasen er forresten fortsatt ikke frisk. Fullt av =F8 etc.
feb 06 18:49:28 pere hvis du ser i Makefile, s� vasker jeg databasen f�r jeg bruker den. Kan du fikse de feilene?
feb 06 18:49:44 korsi Eg veit, men det er paa grunn av tyge, eg forstaar meg ikkje paa teiknkodinga der enno.
feb 06 18:50:04 pere mottak av MIME Q-P m� fikses. det er urealistisk � tro at vi unng�r at folk bruker det.
feb 06 18:50:13 * pere har jo klart � bruke det uten at jeg oppdaget det selv.
feb 06 18:50:38 korsi Jepp, det veit eg. Det er det foerste eg skal sjaa paa.
feb 06 18:51:03 pere korsi: hva er det � forst� med tegnkodingen? Det er jo bare en ren tekstfil? S� vidt jeg kan se er tegnsettet i filen ISO-8859-1, med noen Q-P tegn.
feb 06 18:51:09 pere (som jeg har sendt inn. :( ))
feb 06 18:51:18 korsi Har du nokre gode peikarar til perl-bibliotek som eg kan bruke?
feb 06 18:51:55 pere MIME-tools tror jeg er egnet.
feb 06 18:52:06 * korsi er litt uerfaren i bruk av ulike system med ulik teiknkoding, og synes det er litt frustrerende.
feb 06 18:52:27 pere databasen burde vel egentlig v�re UTF-8, og ikke ISO-8859-1?
feb 06 18:53:27 pere kanskje du kan bruke programmet mimeencode -u til � gj�re jobben?
feb 06 18:53:30 korsi Det er eg einig i, men eg maa faa orden paa mailmottaket foerst slik at vi slepp at databasen blir fylt opp med ulik teiknkoding.
feb 06 18:54:07 korsi Bra, takk for tipset.
feb 06 18:54:26 pere Det er i tillegg to SYNONYM-felter som har feil. Det ene har mark�r for ord-skille, og det andre bruker semikolon i stedet for komma. det siste er min feil.
feb 06 18:54:55 korsi Ok, siste punkt: Generering av stavekontroll
feb 06 18:54:56 * pere tror for�vrig at det er trygt � konvertere fra Q-P til 8-bits i databasefilen.
feb 06 18:55:27 pere jepp. jeg har ikke sett p� hva som gj�res for dansk og de andre som bruker speling-systemet.
feb 06 18:55:30 korsi Eg har sett gjennom Makefile og ser at du har gjort mykje der.
feb 06 18:55:58 pere har dog forst�tt ganske mye om hva som foreg�r n�r listen med ord konverteres til noe {i,a,my}spell liker.
feb 06 18:56:27 korsi Men du faar lagt nye ord til norsk.words med oppdatert frekvensinformasjon?
feb 06 18:56:43 pere en kan se p� det hele som komprimering. en tar en liste med ord og en regelfil, og komprimerer det ned til grunnord og regel-referanse som igjen kan brukes til � generere de originale ordene.
feb 06 18:57:31 pere det trenger ikke (og er gjerne ikke) samsvar mellom grunnord/regelref og norske grunnord med b�yningsm�ster, selv om det ofte er det.
feb 06 18:57:42 korsi Jepp, det har eg ogsaa faatt med meg, men eg har ikkje sett saa mykje paa korleis dette blir gjort.
feb 06 18:57:55 pere vi kan gjette ordklasse basert p� hvilke regler som er knyttet til et gitt grunnord.
feb 06 18:58:38 pere f.eks. vil ord med A-regel ofte v�re substantiv (det er endringen -en).
feb 06 18:58:53 korsi Saa vi kan faktisk sette inn ord med ordklasse og boyingsregel i databasen med status ?
feb 06 18:59:01 pere ja.
feb 06 18:59:12 pere det er ofte feil dog.
feb 06 18:59:46 korsi Nettopp, og saa maa vi gaa gjennom alle orda igjen foer statusen er oppe paa +1 igjen.
feb 06 19:00:12 pere f.eks. samles ordene Alexander Alexanders Alexandra Alexandras inn i samme regel.
feb 06 19:00:35 pere -er -> -ra er nemlig en regel. :)
feb 06 19:00:40 pere skulder, skuldra. :)
feb 06 19:00:58 korsi Ok, det blir problem ja.
feb 06 19:01:13 pere dog for mange ord gir det en god indikasjon.
feb 06 19:01:18 korsi Men no maa vi slutte av. Eg maa stikke snart.
feb 06 19:01:54 pere ja. skal vi planlegge et nytt m�te? hvor ofte b�r vi m�tes?
feb 06 19:02:20 korsi Er det greit med annakvar veke?
feb 06 19:02:25 pere og n�r kan du ha klart referatet?
feb 06 19:02:47 pere det kan bli litt for mye for meg. hvor ofte trenger vi � m�tes?
feb 06 19:02:48 korsi Kanskje i kveld. Kjem an paa kor seint eg kjem heim.
feb 06 19:03:16 korsi Ein gong i maanaden gaar sikkert greit.
feb 06 19:03:27 pere hvis vi f�r til daglig koordinering via IRC eller mail, s� trenger vi ikke � m�tes s� ofte. hvis ikke,s� m� vi antagelig m�tes oftere.
feb 06 19:03:38 pere en gang i m�neden tror jeg at jeg klarer.
feb 06 19:03:55 pere neste i starten av mars?
feb 06 19:04:12 korsi Foerste mandagen i maanen klokka 1800?
feb 06 19:04:29 pere ok, vi fors�ker det. husk tidssone +0100. :)
feb 06 19:04:38 pere neste 6. mars.
feb 06 19:04:44 korsi :) OK 1800 CET
feb 06 19:05:11 korsi Snakkes
feb 06 19:05:14 * pere har gitt opp tidssone-n�kkelordene og g�r kosekvent for +0100-notasjone. :)
feb 06 19:05:16 pere snakkes. :)
feb 06 19:05:30 * pere har nytt m�te p� #debian-edu om en time.
|