**** BEGIN LOGGING AT Mon Feb 6 17:55:11 2006 feb 06 17:55:45 * korsi has changed the topic to: Koordineringsmøte for spell-norwegian feb 06 17:55:52 korsi Hei feb 06 18:00:13 pere hei. :) feb 06 18:00:31 pere da var det norske stavekontrollprosjektet samlet. :) feb 06 18:00:47 pere har du anledning til å skrive referat? feb 06 18:01:17 korsi Jepp, det kan eg gjere. feb 06 18:01:46 korsi Batteriet på musa mi konka nettopp. Men får klare meg utan. feb 06 18:02:07 pere da er vi igang. trist at Axel var opptatt. feb 06 18:02:17 korsi Jepp feb 06 18:02:49 korsi Eg har oppretta ei side på wikien http://wiki.debian.org/SpellNorwegian/Meeting/20060206 feb 06 18:03:17 pere heh, den så litt kjent ut. :) feb 06 18:04:04 korsi Det kan du seie. Resultat av eit halvt minutts arbeid :) feb 06 18:04:29 pere vi bør diskutere pressemelding, ordklasseinfo, synonymordliste og generering av stavekontroll. feb 06 18:04:50 korsi Ok, skal vi ta det i den rekkefølga? feb 06 18:04:55 pere la oss starte med pressemeldingen. har du sett på utkastet? tror du den begynner å bli klar? feb 06 18:05:19 korsi Eg har ikkje lest det grundig. Berre ein rask kikk. feb 06 18:05:44 pere Ser at ikke er oppdatert. :( feb 06 18:06:18 korsi Ok, kan du gi meg eit minutt på å finne nye batteri til musa? feb 06 18:06:27 pere jada feb 06 18:09:33 pere ah, er en bedre utgave. feb 06 18:09:56 korsi slik ja, fann ei ny mus feb 06 18:11:15 korsi Ok, det ser greit ut. Er det noko vi manglar? feb 06 18:11:45 pere vet ikke. er den god nok til at journalister vil skrive om det? feb 06 18:12:29 korsi Tja, vi bør kanskje vinkle det meir mot OpenOffice og poengtere at det har vore eit problem lenge med dårleg stavekontroll. feb 06 18:13:04 korsi OpenOffice har meir gjennomslagskraft enn fri programvare generellt. feb 06 18:13:31 pere hva har disse problemene med dårlig stavekontroll gått ut på? jeg fant ikke mye feil da jeg undersøkte OOo-pakken. to byggefeil var alt. feb 06 18:15:03 korsi «Problemet» er at brukarar, kanskje spesiellt lærarar, synes at stavekontrollen har for dårleg kvalitet. feb 06 18:15:31 pere hva betyr det? kan det etterprøves, eller er det bare en udefinerbar følelse? feb 06 18:16:11 korsi Det kan heilt sikkert visast. Men eg kan ikkje vise til nokre undersøkjingar som seier det. feb 06 18:16:43 pere ok, da går vi videre. hva mer bør inn i pressemeldingen? feb 06 18:17:24 korsi Vi treng ikkje skrive noko om at dagens stavekontroll er dårleg. Men vi kan skrive at vi no har mulighet til å forbedre stavekontrollen i OpenOffice. feb 06 18:18:02 * pere synes slutten på meldingen er litt brå. det bør også inn et sitat fra en eller annen, slik at journalistene kan gi inntrykk av å ha snakket med noen hvis de lager artikkel. :) feb 06 18:18:49 pere noe ala "bla bla stavekontroll er viktig bla bla", eller "bla bla bedrer kvaliteten på språket bla bla". :) feb 06 18:19:43 korsi Jepp, det kan vi prøve å få til. Skal vi prøve å få ein uttalelse frå nokon i skulen? feb 06 18:19:48 pere jeg tror axel tok jobben med å fullføre pressemeldingen, så disse innspillene bør til ham (f.eks. via referatet). feb 06 18:20:06 korsi Notert. feb 06 18:20:23 pere korsi: tror en uttalelse fra noen i prosjektet er bedre. f.eks. prosjektleder Håvard eller korrekturleser Axel. :) feb 06 18:20:53 korsi Kanskje det er like greit, og litt enklare. feb 06 18:21:01 pere noe mer om pressemeldingen? neste tema er ordklasser. feb 06 18:21:13 korsi Vi går over til ordklassar. feb 06 18:21:33 * pere har ikke peiling på ordklasser, og overlater innholdet til andre. feb 06 18:22:06 * korsi har lest over dokumentet i dag, og synes det byrjar å smake fisk. feb 06 18:22:18 pere dog tror jeg det er lurt å begrense seg til en infoside som beskriver formatet, og samle bokmål og nynorsk på samme side (reduserer sjansen for sprik i forklaring av formatet). feb 06 18:22:25 korsi Eller kva det var det smakte. feb 06 18:22:30 pere fugl? feb 06 18:22:41 korsi Einig med å samle begge måla på ei side. feb 06 18:22:54 korsi Det er eitt punkt eg meiner vi må klargjere feb 06 18:23:09 pere dog er det åpenbart av bøyningsmønstrene er forskjellige, så der må det skrives to ulike blokker for nb og nn. feb 06 18:23:10 korsi Det er CONJUGATION-RULE: feb 06 18:23:47 korsi Der bør vi ha inn referansane til bøyingsformane feb 06 18:24:17 pere ja. hva skal formatet være? feb 06 18:24:41 korsi Slik at entall/flertall og bestemt/ubestemt havnar i CONJUGATION, så hamnar f1/m1/m2 osb. i CONJUGATION-RULE: feb 06 18:25:23 pere nettopp. også bør vi være flink å bruke ROOT, som kan brukes til å samle alle bøyninger av samme ordet. feb 06 18:25:40 korsi Einig. feb 06 18:26:29 pere kan vi bruke samme navn i CLASS og CONJUGATION for nb og nn? feb 06 18:27:00 pere CONJUGATION-RULE må åpenbart være forskjellig, da nb og nn jo bøyes forskjellig. feb 06 18:27:21 korsi Ja det synes eg. Eg for min del trur det går greit å godtta fleire namn. Det er ikkje noko problem å lage skript som godttar det. feb 06 18:27:29 pere hvis f1 brukes for nb, så må vi ha et annet navn for nn-hunnkjønnsregel 1 feb 06 18:27:52 korsi Nei, det er ikkje nødvendig. Det er to avskilte databasar feb 06 18:27:58 pere kanskje f1n og f2b? feb 06 18:28:27 korsi Vi har berre to tabellar, ein for bokmål og ein for nynorsk. feb 06 18:28:40 * pere er ikke så sikker på det. tror vi ønsker å prosessere dem i lag slik det gjøres med dagens byggsystem. feb 06 18:29:22 pere i og med at det er mange ord som er like for begge. feb 06 18:29:42 korsi Det er riktig, så lenge vi snakkar om ein enkel «dum» stavekontroll, men når vi skal lage gramatisk kontroll må vi noko dele. feb 06 18:29:50 pere axel har skrevet bokmål, hvem skriver nynorsk? feb 06 18:30:13 korsi Eg kan gjere det. Skal få nokon målfolk til å hjelpe meg. feb 06 18:30:22 pere korsi: din optimisme er beundringsverdig. :) Det er vel ingen som er i nærheten av å lage en fritt tilgjengelig gramatikk-kontroll. feb 06 18:30:47 korsi Nettopp, derfor er det lenge til vi har bruk for den informasjonen vi samlar inn. feb 06 18:31:05 pere hvis jeg har forstått formatet på CONJUGATION_RULE korrekt, så skal den inneholde referanse til regelsamling. hva skal vi skrive der? feb 06 18:32:15 korsi Vi kan bruke felta slik vi sjølv ynskjer. Eg ser det mest hensiktsmessig å setje inn kodane f1/m1/m2 i dette feltet. feb 06 18:32:55 korsi Men vi kan selfølgelig referere til ei offisiell regelsamling feb 06 18:33:53 pere formatet sier 'som ' eller ': '. 'f1' vil vel gå inn i ': f1'? feb 06 18:34:08 korsi Akkurat feb 06 18:34:15 pere jeg lurer altså på hva vi skal skrive som . feb 06 18:35:09 korsi Jepp, det finst nokre offisielle dokument på det trur eg. Trur Axel har brukt dei. Han har kanskje referansane. feb 06 18:36:01 korsi Når det gjeld orddeling, er det greit det som står i det feltet trur du? feb 06 18:36:06 pere jeg mistenker at vi er bedre rustet hvis vi refererer til vår egen regelsamling. feb 06 18:36:49 korsi Kanskje det. feb 06 18:37:01 pere korsi: ja. Kunne kanskje nevne at en kan ha mer enn ett ord i synonymet. dvs. kveld kan ha 'ved solnedgang' som synonym. feb 06 18:37:23 korsi Einig. feb 06 18:37:44 korsi Har du sett om ord som står i SYNONYM blir lagt inn i databasen som eigne ord? feb 06 18:37:50 pere scriptet som genererer listen sjekker at alle ordene er akseptert i ordlisten før synonymet tas med. feb 06 18:38:17 korsi Viss ikkje kva skjer med det? Det kan jo vere det bør vere med i databasen. feb 06 18:38:22 pere jeg aner ikke om ord overføres fra SYNONYM til ordboken automatisk. tror ikke det, så jeg har lagt inn de som mangler manuelt. feb 06 18:38:39 * pere har litt problemer med å lese UTF-8. :/ feb 06 18:38:51 korsi Sorry, skal fikse feb 06 18:39:22 pere ja, jeg tror ord bør dukke opp med status '?' hvis de dukker opp for første gang i SYNONYM. feb 06 18:40:26 pere det er vel noe du eller jacob fikser? ROOT ser ut til å fores automatisk inn i databasen. feb 06 18:41:18 korsi Jepp, trur Jacob sa noko om at det skulle fungere slik for SYNONYM. Men daa berre for eitt ord. feb 06 18:41:28 pere :( feb 06 18:41:54 korsi Eg kan be han om aa ordne det slik at fleire ord blir godtatt feb 06 18:42:12 pere nydelig. feb 06 18:42:22 pere forresten, er siste avsnitt i CLASS-beskrivelsen korrekt? feb 06 18:43:04 korsi Om aa foere opp ord som tilhoyrer fleire klassar fleire gongar? feb 06 18:43:35 pere selve eksemplene, tenker jeg på. feb 06 18:44:24 korsi hoppe, det er ein ho-hest feb 06 18:44:39 korsi ei hoppe og å hoppe feb 06 18:44:47 * pere er forøvring skeptisk til å ha paranteser i bøyningsnavnene for verbene. tror det fører til at noen bruker "Presens" andre bruker "Nåtid", de tredje bruker "Presens (nåtid)" feb 06 18:45:18 pere og databasen bør inneholde entydige navn på samme ting, dvs. enten Presens eller Nåtid, men ikke begge. feb 06 18:45:47 pere burde eksemplene hatt med CONJUGATION-RULE? feb 06 18:46:08 korsi Ja det boer presieserast. feb 06 18:46:12 korsi Det er nok lurt. feb 06 18:46:26 pere filformat-oversikten bør kanskje inneholde flere eksempler? F.eks. helt på slutten. feb 06 18:46:51 korsi OK, generelt bedre og fleire eksempel feb 06 18:47:19 korsi Det kan eg fikse naar eg jobbar med nynorskversjonen. feb 06 18:47:29 pere hm, tiden går. noe mer om filformat og bøyningsmønster før vi fortsetter på synonymordliste? feb 06 18:47:35 korsi Nei feb 06 18:47:56 korsi Du bygger automatisk no, ikkje sant? feb 06 18:48:12 korsi Er det spesiellt for OpenOffice? feb 06 18:48:15 pere ikke helt. det er noe galt som gjør at 'svær' ikke ble håndtert korrekt. feb 06 18:48:47 pere hvis du vil teste, kjør 'make thesaurus-nb.new' og deretter diff -u 'theseurus-nb.new theseurus-nb.txt' feb 06 18:49:01 korsi ok feb 06 18:49:11 pere databasen er forresten fortsatt ikke frisk. Fullt av =F8 etc. feb 06 18:49:28 pere hvis du ser i Makefile, så vasker jeg databasen før jeg bruker den. Kan du fikse de feilene? feb 06 18:49:44 korsi Eg veit, men det er paa grunn av tyge, eg forstaar meg ikkje paa teiknkodinga der enno. feb 06 18:50:04 pere mottak av MIME Q-P må fikses. det er urealistisk å tro at vi unngår at folk bruker det. feb 06 18:50:13 * pere har jo klart å bruke det uten at jeg oppdaget det selv. feb 06 18:50:38 korsi Jepp, det veit eg. Det er det foerste eg skal sjaa paa. feb 06 18:51:03 pere korsi: hva er det å forstå med tegnkodingen? Det er jo bare en ren tekstfil? Så vidt jeg kan se er tegnsettet i filen ISO-8859-1, med noen Q-P tegn. feb 06 18:51:09 pere (som jeg har sendt inn. :( )) feb 06 18:51:18 korsi Har du nokre gode peikarar til perl-bibliotek som eg kan bruke? feb 06 18:51:55 pere MIME-tools tror jeg er egnet. feb 06 18:52:06 * korsi er litt uerfaren i bruk av ulike system med ulik teiknkoding, og synes det er litt frustrerende. feb 06 18:52:27 pere databasen burde vel egentlig være UTF-8, og ikke ISO-8859-1? feb 06 18:53:27 pere kanskje du kan bruke programmet mimeencode -u til å gjøre jobben? feb 06 18:53:30 korsi Det er eg einig i, men eg maa faa orden paa mailmottaket foerst slik at vi slepp at databasen blir fylt opp med ulik teiknkoding. feb 06 18:54:07 korsi Bra, takk for tipset. feb 06 18:54:26 pere Det er i tillegg to SYNONYM-felter som har feil. Det ene har markør for ord-skille, og det andre bruker semikolon i stedet for komma. det siste er min feil. feb 06 18:54:55 korsi Ok, siste punkt: Generering av stavekontroll feb 06 18:54:56 * pere tror forøvrig at det er trygt å konvertere fra Q-P til 8-bits i databasefilen. feb 06 18:55:27 pere jepp. jeg har ikke sett på hva som gjøres for dansk og de andre som bruker speling-systemet. feb 06 18:55:30 korsi Eg har sett gjennom Makefile og ser at du har gjort mykje der. feb 06 18:55:58 pere har dog forstått ganske mye om hva som foregår når listen med ord konverteres til noe {i,a,my}spell liker. feb 06 18:56:27 korsi Men du faar lagt nye ord til norsk.words med oppdatert frekvensinformasjon? feb 06 18:56:43 pere en kan se på det hele som komprimering. en tar en liste med ord og en regelfil, og komprimerer det ned til grunnord og regel-referanse som igjen kan brukes til å generere de originale ordene. feb 06 18:57:31 pere det trenger ikke (og er gjerne ikke) samsvar mellom grunnord/regelref og norske grunnord med bøyningsmøster, selv om det ofte er det. feb 06 18:57:42 korsi Jepp, det har eg ogsaa faatt med meg, men eg har ikkje sett saa mykje paa korleis dette blir gjort. feb 06 18:57:55 pere vi kan gjette ordklasse basert på hvilke regler som er knyttet til et gitt grunnord. feb 06 18:58:38 pere f.eks. vil ord med A-regel ofte være substantiv (det er endringen -en). feb 06 18:58:53 korsi Saa vi kan faktisk sette inn ord med ordklasse og boyingsregel i databasen med status ? feb 06 18:59:01 pere ja. feb 06 18:59:12 pere det er ofte feil dog. feb 06 18:59:46 korsi Nettopp, og saa maa vi gaa gjennom alle orda igjen foer statusen er oppe paa +1 igjen. feb 06 19:00:12 pere f.eks. samles ordene Alexander Alexanders Alexandra Alexandras inn i samme regel. feb 06 19:00:35 pere -er -> -ra er nemlig en regel. :) feb 06 19:00:40 pere skulder, skuldra. :) feb 06 19:00:58 korsi Ok, det blir problem ja. feb 06 19:01:13 pere dog for mange ord gir det en god indikasjon. feb 06 19:01:18 korsi Men no maa vi slutte av. Eg maa stikke snart. feb 06 19:01:54 pere ja. skal vi planlegge et nytt møte? hvor ofte bør vi møtes? feb 06 19:02:20 korsi Er det greit med annakvar veke? feb 06 19:02:25 pere og når kan du ha klart referatet? feb 06 19:02:47 pere det kan bli litt for mye for meg. hvor ofte trenger vi å møtes? feb 06 19:02:48 korsi Kanskje i kveld. Kjem an paa kor seint eg kjem heim. feb 06 19:03:16 korsi Ein gong i maanaden gaar sikkert greit. feb 06 19:03:27 pere hvis vi får til daglig koordinering via IRC eller mail, så trenger vi ikke å møtes så ofte. hvis ikke,så må vi antagelig møtes oftere. feb 06 19:03:38 pere en gang i måneden tror jeg at jeg klarer. feb 06 19:03:55 pere neste i starten av mars? feb 06 19:04:12 korsi Foerste mandagen i maanen klokka 1800? feb 06 19:04:29 pere ok, vi forsøker det. husk tidssone +0100. :) feb 06 19:04:38 pere neste 6. mars. feb 06 19:04:44 korsi :) OK 1800 CET feb 06 19:05:11 korsi Snakkes feb 06 19:05:14 * pere har gitt opp tidssone-nøkkelordene og går kosekvent for +0100-notasjone. :) feb 06 19:05:16 pere snakkes. :) feb 06 19:05:30 * pere har nytt møte på #debian-edu om en time.