aboutsummaryrefslogtreecommitdiffstats
diff options
context:
space:
mode:
-rw-r--r--20060206-irc-meeting-summary.txt89
-rw-r--r--20060206-irc-meeting.log168
2 files changed, 257 insertions, 0 deletions
diff --git a/20060206-irc-meeting-summary.txt b/20060206-irc-meeting-summary.txt
new file mode 100644
index 0000000..488a68a
--- /dev/null
+++ b/20060206-irc-meeting-summary.txt
@@ -0,0 +1,89 @@
+Referat fra <URL:http://wiki.debian.org/SpellNorwegian/Meeting/20060206>
+
+Møtereferat frå møte i prosjektet Spell-Norwegian. Møtet tok stad på
+#spell-norwegian 2006-02-06 18:00 CET.
+
+Formalitetar
+
+ * Moderator: Petter Reinholdtsen
+ * Loggsamlar: Håvard Korsvoll
+ * Referent: Håvard Korsvoll
+ * Til stades: Petter Reinholdtsen og Håvard Korsvoll
+
+Referat
+
+ Denne agendaen blei diskutert:
+ 1. Sende ut ei pressemelding om prosjektet
+ 2. Informasjon om ordklassar
+ 3. Synonymordlista
+ 4. Bygging av stavekontrollen
+
+1. Pressemelding
+
+ Det finst ein kladd av pressemeldinga på web[1]. Vi diskuterte om
+ ho er god nok slik at journalistar vil skrive om oss. Håvard meinte vi
+ bør vinkle det meir mot OpenOffice.org[2] sidan det har meir
+ gjennomslagskraft enn fri programvare generelt.
+
+ 1. http://no.speling.org/pressemelding-2006-01-29.txt
+ 2. http://wiki.debian.org/OpenOffice
+
+ Håvard påpeika at det er mange som synes kvaliteten på stavekontrollen
+ i dag er for dårleg. Men vi veit ikkje om nokon undersøkingar som kan
+ underbyggje denne påstanden.
+
+ Vi kan iallefall skrive at vi no har høve til å betre stavekontrollen
+ i OpenOffice.org.
+
+ Petter vil gjerne at vi avsluttar pressemeldinga med eit sitat frå
+ nokon i prosjektet. Pressemeldinga slik ho er no avsluttar noko brått.
+
+2. Informasjon om ordklassar
+
+ * Vi samlar informasjonen om formatet både for nynorsk og bokmål på
+ ei side.
+ * Vi avklarer kva ord vi brukar for bøyingsformer. Vi brukar
+ bokmålsorda (entall, flertall, bestemt, ubestemt osb.)
+ * Den øvste tabellen må få inn ei tredje kolonne som inneheld
+ bøyingsregel (CONJUGATION-RULE). Her skal f1/m1/m2/m3/n1/n2/n3
+ setjast inn.
+ * Feltet CONJUGATION-RULE må dokumenterast betre og referere til
+ tabellane over. Feltet skal også innhalde referanse til ei
+ regelsamling. Men det kan godt vere den regelsamlinga som vi
+ bygger opp i dokumentet.
+
+3. Synonymordlista
+
+ Det som er morosamt med synonymordlista er at i motsetning til Alf
+ Hellevik si (m)ordliste så er dette faktisk ei mordliste over
+ synony:-).
+ * Petter har laga skript i Makefile som hentar ut synonym frå
+ orddatabasen. Det er ikkje alt som fungerer 100% enno.
+ * scriptet som genererer listen sjekker at alle ordene er akseptert
+ i ordlisten før synonymet tas med.
+ * Vi trur ikkje ord som står i SYNONYM-feltet blir lagt inn i
+ databasen igjen. Det bør dei. Då må dei få STATUS: ?
+
+4. Bygging av stavekontrollen
+
+ * Petter har fått ein oversikt over kva som skjer under bygging av
+ {i,a,my}spell-ordlister.
+ * Vi har ikkje sett på korleis danskane gjer bygginga si. Vår
+ bygging er basert på bygging frå fila norsk.words.
+
+Andre ting vi diskuterte
+
+ Vi må få orden på postmottaket. Håvard skal prøve å få posten gjennom
+ perl-blokker for handtering av e-post, slik at vi kan ta i mot Q-P
+ post og kan levere posten inn i databasen med det teiknsettet vi
+ ynskjer. Vi vil helst bruke UTF-8 på databasen.
+
+ MIME-tools er eigna verktøy til slike ting.
+
+Neste møte
+
+ Vi fann ut at det er nok med eitt møte i månaden. Vi har fast møtedag
+ den første mandagen i månaden klokka 18.00 CET (eller GMT+0100 som
+ Petter vil ha det). Neste møte blir då 6. mars.
+
+ Håvard Korsvoll
diff --git a/20060206-irc-meeting.log b/20060206-irc-meeting.log
new file mode 100644
index 0000000..876059b
--- /dev/null
+++ b/20060206-irc-meeting.log
@@ -0,0 +1,168 @@
+**** BEGIN LOGGING AT Mon Feb 6 17:55:11 2006
+
+feb 06 17:55:45 * korsi has changed the topic to: Koordineringsmøte for spell-norwegian
+feb 06 17:55:52 korsi Hei
+feb 06 18:00:13 pere hei. :)
+feb 06 18:00:31 pere da var det norske stavekontrollprosjektet samlet. :)
+feb 06 18:00:47 pere har du anledning til å skrive referat?
+feb 06 18:01:17 korsi Jepp, det kan eg gjere.
+feb 06 18:01:46 korsi Batteriet på musa mi konka nettopp. Men får klare meg utan.
+feb 06 18:02:07 pere da er vi igang. trist at Axel var opptatt.
+feb 06 18:02:17 korsi Jepp
+feb 06 18:02:49 korsi Eg har oppretta ei side på wikien http://wiki.debian.org/SpellNorwegian/Meeting/20060206
+feb 06 18:03:17 pere heh, den så litt kjent ut. :)
+feb 06 18:04:04 korsi Det kan du seie. Resultat av eit halvt minutts arbeid :)
+feb 06 18:04:29 pere vi bør diskutere pressemelding, ordklasseinfo, synonymordliste og generering av stavekontroll.
+feb 06 18:04:50 korsi Ok, skal vi ta det i den rekkefølga?
+feb 06 18:04:55 pere la oss starte med pressemeldingen. har du sett på utkastet? tror du den begynner å bli klar?
+feb 06 18:05:19 korsi Eg har ikkje lest det grundig. Berre ein rask kikk.
+feb 06 18:05:44 pere Ser at <URL:http://no.speling.org/pressrelease-200601.html > ikke er oppdatert. :(
+feb 06 18:06:18 korsi Ok, kan du gi meg eit minutt på å finne nye batteri til musa?
+feb 06 18:06:27 pere jada
+feb 06 18:09:33 pere ah, <URL: http://no.speling.org/pressemelding-2006-01-29.txt > er en bedre utgave.
+feb 06 18:09:56 korsi slik ja, fann ei ny mus
+feb 06 18:11:15 korsi Ok, det ser greit ut. Er det noko vi manglar?
+feb 06 18:11:45 pere vet ikke. er den god nok til at journalister vil skrive om det?
+feb 06 18:12:29 korsi Tja, vi bør kanskje vinkle det meir mot OpenOffice og poengtere at det har vore eit problem lenge med dårleg stavekontroll.
+feb 06 18:13:04 korsi OpenOffice har meir gjennomslagskraft enn fri programvare generellt.
+feb 06 18:13:31 pere hva har disse problemene med dårlig stavekontroll gått ut på? jeg fant ikke mye feil da jeg undersøkte OOo-pakken. to byggefeil var alt.
+feb 06 18:15:03 korsi «Problemet» er at brukarar, kanskje spesiellt lærarar, synes at stavekontrollen har for dårleg kvalitet.
+feb 06 18:15:31 pere hva betyr det? kan det etterprøves, eller er det bare en udefinerbar følelse?
+feb 06 18:16:11 korsi Det kan heilt sikkert visast. Men eg kan ikkje vise til nokre undersøkjingar som seier det.
+feb 06 18:16:43 pere ok, da går vi videre. hva mer bør inn i pressemeldingen?
+feb 06 18:17:24 korsi Vi treng ikkje skrive noko om at dagens stavekontroll er dårleg. Men vi kan skrive at vi no har mulighet til å forbedre stavekontrollen i OpenOffice.
+feb 06 18:18:02 * pere synes slutten på meldingen er litt brå. det bør også inn et sitat fra en eller annen, slik at journalistene kan gi inntrykk av å ha snakket med noen hvis de lager artikkel. :)
+feb 06 18:18:49 pere noe ala "bla bla stavekontroll er viktig bla bla", eller "bla bla bedrer kvaliteten på språket bla bla". :)
+feb 06 18:19:43 korsi Jepp, det kan vi prøve å få til. Skal vi prøve å få ein uttalelse frå nokon i skulen?
+feb 06 18:19:48 pere jeg tror axel tok jobben med å fullføre pressemeldingen, så disse innspillene bør til ham (f.eks. via referatet).
+feb 06 18:20:06 korsi Notert.
+feb 06 18:20:23 pere korsi: tror en uttalelse fra noen i prosjektet er bedre. f.eks. prosjektleder Håvard eller korrekturleser Axel. :)
+feb 06 18:20:53 korsi Kanskje det er like greit, og litt enklare.
+feb 06 18:21:01 pere noe mer om pressemeldingen? neste tema er ordklasser.
+feb 06 18:21:13 korsi Vi går over til ordklassar.
+feb 06 18:21:33 * pere har ikke peiling på ordklasser, og overlater innholdet til andre.
+feb 06 18:22:06 * korsi har lest over dokumentet i dag, og synes det byrjar å smake fisk.
+feb 06 18:22:18 pere dog tror jeg det er lurt å begrense seg til en infoside som beskriver formatet, og samle bokmål og nynorsk på samme side (reduserer sjansen for sprik i forklaring av formatet).
+feb 06 18:22:25 korsi Eller kva det var det smakte.
+feb 06 18:22:30 pere fugl?
+feb 06 18:22:41 korsi Einig med å samle begge måla på ei side.
+feb 06 18:22:54 korsi Det er eitt punkt eg meiner vi må klargjere
+feb 06 18:23:09 pere dog er det åpenbart av bøyningsmønstrene er forskjellige, så der må det skrives to ulike blokker for nb og nn.
+feb 06 18:23:10 korsi Det er CONJUGATION-RULE:
+feb 06 18:23:47 korsi Der bør vi ha inn referansane til bøyingsformane
+feb 06 18:24:17 pere ja. hva skal formatet være?
+feb 06 18:24:41 korsi Slik at entall/flertall og bestemt/ubestemt havnar i CONJUGATION, så hamnar f1/m1/m2 osb. i CONJUGATION-RULE:
+feb 06 18:25:23 pere nettopp. også bør vi være flink å bruke ROOT, som kan brukes til å samle alle bøyninger av samme ordet.
+feb 06 18:25:40 korsi Einig.
+feb 06 18:26:29 pere kan vi bruke samme navn i CLASS og CONJUGATION for nb og nn?
+feb 06 18:27:00 pere CONJUGATION-RULE må åpenbart være forskjellig, da nb og nn jo bøyes forskjellig.
+feb 06 18:27:21 korsi Ja det synes eg. Eg for min del trur det går greit å godtta fleire namn. Det er ikkje noko problem å lage skript som godttar det.
+feb 06 18:27:29 pere hvis f1 brukes for nb, så må vi ha et annet navn for nn-hunnkjønnsregel 1
+feb 06 18:27:52 korsi Nei, det er ikkje nødvendig. Det er to avskilte databasar
+feb 06 18:27:58 pere kanskje f1n og f2b?
+feb 06 18:28:27 korsi Vi har berre to tabellar, ein for bokmål og ein for nynorsk.
+feb 06 18:28:40 * pere er ikke så sikker på det. tror vi ønsker å prosessere dem i lag slik det gjøres med dagens byggsystem.
+feb 06 18:29:22 pere i og med at det er mange ord som er like for begge.
+feb 06 18:29:42 korsi Det er riktig, så lenge vi snakkar om ein enkel «dum» stavekontroll, men når vi skal lage gramatisk kontroll må vi noko dele.
+feb 06 18:29:50 pere axel har skrevet bokmål, hvem skriver nynorsk?
+feb 06 18:30:13 korsi Eg kan gjere det. Skal få nokon målfolk til å hjelpe meg.
+feb 06 18:30:22 pere korsi: din optimisme er beundringsverdig. :) Det er vel ingen som er i nærheten av å lage en fritt tilgjengelig gramatikk-kontroll.
+feb 06 18:30:47 korsi Nettopp, derfor er det lenge til vi har bruk for den informasjonen vi samlar inn.
+feb 06 18:31:05 pere hvis jeg har forstått formatet på CONJUGATION_RULE korrekt, så skal den inneholde referanse til regelsamling. hva skal vi skrive der?
+feb 06 18:32:15 korsi Vi kan bruke felta slik vi sjølv ynskjer. Eg ser det mest hensiktsmessig å setje inn kodane f1/m1/m2 i dette feltet.
+feb 06 18:32:55 korsi Men vi kan selfølgelig referere til ei offisiell regelsamling
+feb 06 18:33:53 pere formatet sier 'som <ord>' eller '<regelsamling>: <regel>'. 'f1' vil vel gå inn i '<regelsamling>: f1'?
+feb 06 18:34:08 korsi Akkurat
+feb 06 18:34:15 pere jeg lurer altså på hva vi skal skrive som <regelsamling>.
+feb 06 18:35:09 korsi Jepp, det finst nokre offisielle dokument på det trur eg. Trur Axel har brukt dei. Han har kanskje referansane.
+feb 06 18:36:01 korsi Når det gjeld orddeling, er det greit det som står i det feltet trur du?
+feb 06 18:36:06 pere jeg mistenker at vi er bedre rustet hvis vi refererer til vår egen regelsamling.
+feb 06 18:36:49 korsi Kanskje det.
+feb 06 18:37:01 pere korsi: ja. Kunne kanskje nevne at en kan ha mer enn ett ord i synonymet. dvs. kveld kan ha 'ved solnedgang' som synonym.
+feb 06 18:37:23 korsi Einig.
+feb 06 18:37:44 korsi Har du sett om ord som står i SYNONYM blir lagt inn i databasen som eigne ord?
+feb 06 18:37:50 pere scriptet som genererer listen sjekker at alle ordene er akseptert i ordlisten før synonymet tas med.
+feb 06 18:38:17 korsi Viss ikkje kva skjer med det? Det kan jo vere det bør vere med i databasen.
+feb 06 18:38:22 pere jeg aner ikke om ord overføres fra SYNONYM til ordboken automatisk. tror ikke det, så jeg har lagt inn de som mangler manuelt.
+feb 06 18:38:39 * pere har litt problemer med å lese UTF-8. :/
+feb 06 18:38:51 korsi Sorry, skal fikse
+feb 06 18:39:22 pere ja, jeg tror ord bør dukke opp med status '?' hvis de dukker opp for første gang i SYNONYM.
+feb 06 18:40:26 pere det er vel noe du eller jacob fikser? ROOT ser ut til å fores automatisk inn i databasen.
+feb 06 18:41:18 korsi Jepp, trur Jacob sa noko om at det skulle fungere slik for SYNONYM. Men daa berre for eitt ord.
+feb 06 18:41:28 pere :(
+feb 06 18:41:54 korsi Eg kan be han om aa ordne det slik at fleire ord blir godtatt
+feb 06 18:42:12 pere nydelig.
+feb 06 18:42:22 pere forresten, er siste avsnitt i CLASS-beskrivelsen korrekt?
+feb 06 18:43:04 korsi Om aa foere opp ord som tilhoyrer fleire klassar fleire gongar?
+feb 06 18:43:35 pere selve eksemplene, tenker jeg på.
+feb 06 18:44:24 korsi hoppe, det er ein ho-hest
+feb 06 18:44:39 korsi ei hoppe og å hoppe
+feb 06 18:44:47 * pere er forøvring skeptisk til å ha paranteser i bøyningsnavnene for verbene. tror det fører til at noen bruker "Presens" andre bruker "Nåtid", de tredje bruker "Presens (nåtid)"
+feb 06 18:45:18 pere og databasen bør inneholde entydige navn på samme ting, dvs. enten Presens eller Nåtid, men ikke begge.
+feb 06 18:45:47 pere burde eksemplene hatt med CONJUGATION-RULE?
+feb 06 18:46:08 korsi Ja det boer presieserast.
+feb 06 18:46:12 korsi Det er nok lurt.
+feb 06 18:46:26 pere filformat-oversikten bør kanskje inneholde flere eksempler? F.eks. helt på slutten.
+feb 06 18:46:51 korsi OK, generelt bedre og fleire eksempel
+feb 06 18:47:19 korsi Det kan eg fikse naar eg jobbar med nynorskversjonen.
+feb 06 18:47:29 pere hm, tiden går. noe mer om filformat og bøyningsmønster før vi fortsetter på synonymordliste?
+feb 06 18:47:35 korsi Nei
+feb 06 18:47:56 korsi Du bygger automatisk no, ikkje sant?
+feb 06 18:48:12 korsi Er det spesiellt for OpenOffice?
+feb 06 18:48:15 pere ikke helt. det er noe galt som gjør at 'svær' ikke ble håndtert korrekt.
+feb 06 18:48:47 pere hvis du vil teste, kjør 'make thesaurus-nb.new' og deretter diff -u 'theseurus-nb.new theseurus-nb.txt'
+feb 06 18:49:01 korsi ok
+feb 06 18:49:11 pere databasen er forresten fortsatt ikke frisk. Fullt av =F8 etc.
+feb 06 18:49:28 pere hvis du ser i Makefile, så vasker jeg databasen før jeg bruker den. Kan du fikse de feilene?
+feb 06 18:49:44 korsi Eg veit, men det er paa grunn av tyge, eg forstaar meg ikkje paa teiknkodinga der enno.
+feb 06 18:50:04 pere mottak av MIME Q-P må fikses. det er urealistisk å tro at vi unngår at folk bruker det.
+feb 06 18:50:13 * pere har jo klart å bruke det uten at jeg oppdaget det selv.
+feb 06 18:50:38 korsi Jepp, det veit eg. Det er det foerste eg skal sjaa paa.
+feb 06 18:51:03 pere korsi: hva er det å forstå med tegnkodingen? Det er jo bare en ren tekstfil? Så vidt jeg kan se er tegnsettet i filen ISO-8859-1, med noen Q-P tegn.
+feb 06 18:51:09 pere (som jeg har sendt inn. :( ))
+feb 06 18:51:18 korsi Har du nokre gode peikarar til perl-bibliotek som eg kan bruke?
+feb 06 18:51:55 pere MIME-tools tror jeg er egnet.
+feb 06 18:52:06 * korsi er litt uerfaren i bruk av ulike system med ulik teiknkoding, og synes det er litt frustrerende.
+feb 06 18:52:27 pere databasen burde vel egentlig være UTF-8, og ikke ISO-8859-1?
+feb 06 18:53:27 pere kanskje du kan bruke programmet mimeencode -u til å gjøre jobben?
+feb 06 18:53:30 korsi Det er eg einig i, men eg maa faa orden paa mailmottaket foerst slik at vi slepp at databasen blir fylt opp med ulik teiknkoding.
+feb 06 18:54:07 korsi Bra, takk for tipset.
+feb 06 18:54:26 pere Det er i tillegg to SYNONYM-felter som har feil. Det ene har markør for ord-skille, og det andre bruker semikolon i stedet for komma. det siste er min feil.
+feb 06 18:54:55 korsi Ok, siste punkt: Generering av stavekontroll
+feb 06 18:54:56 * pere tror forøvrig at det er trygt å konvertere fra Q-P til 8-bits i databasefilen.
+feb 06 18:55:27 pere jepp. jeg har ikke sett på hva som gjøres for dansk og de andre som bruker speling-systemet.
+feb 06 18:55:30 korsi Eg har sett gjennom Makefile og ser at du har gjort mykje der.
+feb 06 18:55:58 pere har dog forstått ganske mye om hva som foregår når listen med ord konverteres til noe {i,a,my}spell liker.
+feb 06 18:56:27 korsi Men du faar lagt nye ord til norsk.words med oppdatert frekvensinformasjon?
+feb 06 18:56:43 pere en kan se på det hele som komprimering. en tar en liste med ord og en regelfil, og komprimerer det ned til grunnord og regel-referanse som igjen kan brukes til å generere de originale ordene.
+feb 06 18:57:31 pere det trenger ikke (og er gjerne ikke) samsvar mellom grunnord/regelref og norske grunnord med bøyningsmøster, selv om det ofte er det.
+feb 06 18:57:42 korsi Jepp, det har eg ogsaa faatt med meg, men eg har ikkje sett saa mykje paa korleis dette blir gjort.
+feb 06 18:57:55 pere vi kan gjette ordklasse basert på hvilke regler som er knyttet til et gitt grunnord.
+feb 06 18:58:38 pere f.eks. vil ord med A-regel ofte være substantiv (det er endringen -en).
+feb 06 18:58:53 korsi Saa vi kan faktisk sette inn ord med ordklasse og boyingsregel i databasen med status ?
+feb 06 18:59:01 pere ja.
+feb 06 18:59:12 pere det er ofte feil dog.
+feb 06 18:59:46 korsi Nettopp, og saa maa vi gaa gjennom alle orda igjen foer statusen er oppe paa +1 igjen.
+feb 06 19:00:12 pere f.eks. samles ordene Alexander Alexanders Alexandra Alexandras inn i samme regel.
+feb 06 19:00:35 pere -er -> -ra er nemlig en regel. :)
+feb 06 19:00:40 pere skulder, skuldra. :)
+feb 06 19:00:58 korsi Ok, det blir problem ja.
+feb 06 19:01:13 pere dog for mange ord gir det en god indikasjon.
+feb 06 19:01:18 korsi Men no maa vi slutte av. Eg maa stikke snart.
+feb 06 19:01:54 pere ja. skal vi planlegge et nytt møte? hvor ofte bør vi møtes?
+feb 06 19:02:20 korsi Er det greit med annakvar veke?
+feb 06 19:02:25 pere og når kan du ha klart referatet?
+feb 06 19:02:47 pere det kan bli litt for mye for meg. hvor ofte trenger vi å møtes?
+feb 06 19:02:48 korsi Kanskje i kveld. Kjem an paa kor seint eg kjem heim.
+feb 06 19:03:16 korsi Ein gong i maanaden gaar sikkert greit.
+feb 06 19:03:27 pere hvis vi får til daglig koordinering via IRC eller mail, så trenger vi ikke å møtes så ofte. hvis ikke,så må vi antagelig møtes oftere.
+feb 06 19:03:38 pere en gang i måneden tror jeg at jeg klarer.
+feb 06 19:03:55 pere neste i starten av mars?
+feb 06 19:04:12 korsi Foerste mandagen i maanen klokka 1800?
+feb 06 19:04:29 pere ok, vi forsøker det. husk tidssone +0100. :)
+feb 06 19:04:38 pere neste 6. mars.
+feb 06 19:04:44 korsi :) OK 1800 CET
+feb 06 19:05:11 korsi Snakkes
+feb 06 19:05:14 * pere har gitt opp tidssone-nøkkelordene og går kosekvent for +0100-notasjone. :)
+feb 06 19:05:16 pere snakkes. :)
+feb 06 19:05:30 * pere har nytt møte på #debian-edu om en time.