Har fått et par spørsmål om hvordan man kan ha tilgang til Wikipedia uten å ha internett-tilgang. Nye regler i forbindelse med avvikling av eksamen i ungdomsskolen og videregående skole gir elevene mulighet til å bruke alle virkemidler, så lenge de ikke kan kommunisere med hverandre, og den metoden jeg beskriver er dermed fult lovlig å bruke, men jeg vil anbefale at IT-ansvarlig på skolen gjennomfører den, og ikke at hver enkelt elev gjør dette på egenhånd, fordi det kan være relativt store datamengder som tar mye plass.
Wikimedia Foundation som er stiftelsen som står bak Wikipedia gjør alt innhold fra Wikipedia tilgjengelig på download.wikimedia.org. Velg ut de databasene du er interessert i, og last ned filen “pages-articles.xml.bz2″ i den siste databasedumpen som er gjort tilgjengelig:
WikiTaxi er en offline reader som kan lese databasedumpene som du akkurat har lastet ned. Den kan finnes på www.wikitaxi.org.
XML er et veldig fleksibelt format, men det er tungvindt å gjøre søkbart. Derfor må databasedumpen konverteres til WikiTaxi-database. Dette gjøres med programmet wikitaxi_import.exe som følger med WikiTaxi. Fyll inn hvor du har lagret xml’en du vil konvertere i første feltet, hvor du vil at databasen skal lagres i det andre feltet, og trykk på Import. Programmet vil nå jobbe en stund med å konvertere dataen (for meg brukte den ca. 5 minutter på Wikipedia på bokmål)
Dersom du bare trykker på WikiTaxi.exe vil du få opp en bruksanvisning med beskrivelse av programmet og hvordan du bruker det, i begynnelsen av denne vil du også få en lenke for å åpne en ny fil, hvor du kan bla deg frem til hvor du har lagret den konverterte databasen i forrige steg. Åpne filen og du får opp teksten fra Wikipedia, med søkefelt for å finne artikler.
Du kan også spesifisere hvor databasen ligger direkte ved å skrive adressen til .taxi-fila som en parameter til wikitaxi.exe slik:
p:\Applikasjoner\Wikipedia\WikiTaxi.exe p:\Applikasjoner\Wikipedia\nowiki\nowiki.taxi
Jeg må si jeg gleder meg til neste uke. Mandag 19. april begynner konferansen GoOpen i Oslo, Norges største konferanse om åpen kildekode (jeg har selvfølgelig vært med der hvert år), og jeg får mulighet til å møte mange andre i miljøet i Norge (er ofte kjente navn fra et eller annet prosjekt jeg har vært borti). På kvelden skal det være årsmøte i Wikimedia Norge, hvor jeg har blitt innstilt som ny nestleder, en post jeg virkelig har lyst på, siden jeg har mange prosjekter jeg kunne tenke meg å få gjennomført, og som nestleder har jeg god mulighet til å få gjennomført disse på en god måte. Etter årsmøtet blir det wikitreff, noe som trolig betyr muligheten til å prate med masse nye folk jeg ikke har møtt annet enn på Wikipedia.
Dagen etter, tirsdag 20. april, skal jeg holde foredrag på GoOpen, noe som trolig blir det største foredraget jeg har holdt til nå (men forhåpentligvis ikke det siste
). Har endelig fått satt meg ned og skrevet litt på foredraget mitt i dag (gått med mye tid for å forberede årsmøtet i Wikimedia Norge de siste ukene), og tror nok det skal gå bra.
Ja, da har nyheten endelig kommet; Store Norske Leksikon legger ned fra 1. juli (merk at pressemeldingen er kvalitetssikret…), fordi Kulturdepartementet ikke vil finansiere produktet deres, som har feilet ganske kraftig.
At Store Norske kan greie å skrive en pressemelding som de har gjort syns jeg er ganske kvalmt. De har i lang tid sliti med å konkurrere med Wikipedia og internett forøvrig, og når de fortsatt ikke er villig til å innse at forretningsmodellen dems har feilet, og fortsetter med sleivspark mot konkurrentene, syns jeg ikke de fortjener bedre.
Wikimedia Norge har i lang tid forsøkt å samarbeide, og å finne samarbeidsprosjekter som Kunnskapsforlaget og Wikimedia/Wikipedia kan samarbeide om, men Kunnskapsforlaget har alltid vært rimelig ensporet i sine tanker om samarbeid (som f.eks. at Wikipedia skal linke til SNL som kilde, mens SNL ikke skal linke tilbake til Wikipedia). Hadde SNL vært villig til å samarbeide tidligere, i stedenfor å være stolte over sin døende forretningsmodell, så hadde vi aldri kommet til denne situasjonen; Vi kunne hatt en god konkurranse og et godt samarbeid i det norske leksikonmiljøet.
I stedenfor har vi nå en situasjon, hvor SNLs siste krampetrekninger, er å sende ut en pressemelding, som både skader dem selv, Wikipedia og leksikontradisjonen i Norge. Fortsatt har de ikke forstått hvorfor Wikipedia er mer populært, og hvorfor brukerne ikke kommer til SNL. Spesielt tenker jeg på tilleggene som følger med pressemeldingen:
Hvorfor trenger Norge et nasjonalt leksikon med synlige fagfolk også i fremtiden?
Wikipedia er en verdenssuksess med sitt prinsipp om at alle kan bidra fritt og usignert, og ingen enkelt står ansvarlig. De nasjonale fagfolk-leksikonene har dermed mistet sitt økonomiske grunnlag og går mot nedleggelse. Store norske leksikon står nå for tur. Norge trenger et Wikipedia i fremtiden, men også et Store norske med synlige fagfolk som går god for og kan stilles til ansvar for innholdet. Som nasjonal institusjon er fagfolk-leksikonet viktig:
Spesielt den siste biten her syns jeg er interessant. Det skal ikke mye til for å kalles fagfolk. Alt som i realiteten skal til for å bli “fagansvarlig” hos Store Norske er at du er identifisert; ikke at du har en formell utdannelse innen faget. F.eks. er de fagansvarlige for de forskjellige kommunene stort sett mennesker som bor i kommunen eller en nabokommune, og ikke en som har mye mer kunnskap enn de fleste lokale mennesker kan forventes å ha. Systemet med fagansvarlige har også feilet, da det i mange tilfeller er foreslått endringer på artikler for opptil et år tilbake i tid, men endringene blir ikke håndtert. Brukerne kommer med tilbakemelding om faktafeil, og fagfolkene lar feilene stå eller gidder ikke fikse dem? Hvorfor skal du holde noen ansvarlig for innholdet, når de ikke vil ta ansvaret?
For skoleverk, læresteder og forskning, for å oppfylle grunnleggende krav til sitering og kildehenvisning – at man vet hvem avsender er.
For skoleverket kan stort sett hvilken som helst kilde brukes til sitering, men innen forskning er ingen leksikon god kilde for noenting. Der bør man gå til orginalkilder. Det viktigste er ikke hvem kilden der, men hvordan man tolker den informasjonen som er oppgitt.
For fagforfatterne og fagmiljøene, som formidlingsplattform med honorering og synlig kreditering.
Fagforfatterne og fagmiljøene bør se på hva som gir mest effekt, og sprer faget til flest mulig mennesker. Per dags dato er ikke dette Store Norske, men Wikipedia, og Wikipedia ønsker dem velkomne. Dersom kreditering er viktig for enkeltpersoner, så ville jeg personlig ha lagt ut informasjonen på egen hjemmeside i tillegg, men den store effekten kommer av publisering på Wikipedia.
For biblioteksektoren, som trenger kvalitetssikrede autoritative kilder.
Nå er ikke et leksikon en autorativ kilde for noenting, siden all informasjon i et leksikon nødvendigvis må bli andrehåndsinformasjon, men poenget om kvalitetssikrede hjelper lite når SNL ikke har greid, og med dagens modell ikke kan bli i stand til, å gå god for at informasjonen er 100% korrekt.
For norsk fagspråk, og norsk som språk. Det er god språkpolitikk ikke å overlate valg og definisjon av norske fagtermer til en anonym brukermasse.
Personlig er jeg tilhenger av at språket skal være levende, og at skriftspråket skal gjenspeile hva som brukes i den store befolkningen (og sist jeg sjekket er den norske befolkningen en stor anonym brukermasse). Norsk språkråd gjør mye bra de, men jeg er riv ruskende uenig i endel av valgene de tar, som er stikk i strid med hva noen i den norske befolkningen bruker (sørver om server? Måltidet lønsj? hvor kommer de definisjonene fra?)
For nasjonens identitet, for å omtale det som er nasjonalt viktig, ikke minst for å fange opp et multikulturelt Norge i rask endring. Denne oppgaven bør ligge hos synlige ansvarlige og ikke det store kollektivet. Det kan også vise seg problematisk i lengden for kollektiv-leksikonets norske vinkling at det utgår fra en internasjonal plattform med hovedbase i USA.
Selvmotsigelse? Å fange opp det multikulturelle Norge bør ligge hos enkeltpersoner? Og til den siste biten, så kan hvem som helst forke Wikipedia, ved å laste ned hele databasen fra download.wikimedia.org. Å spekulere i hvilken retning Wikipedia kommer til å ta, er unødvendig i en slik pressemelding, da Wikipedia har mulighet til å ta begge veier (noe det også har gjort tidligere, i Spania når det begynte å bli snakk om å ha reklame på Wikipedia, startet en gruppe opp et konkurrerende prosjekt, som siden har funnet veien tilbake i Wikipedia.)
For synliggjøring av makt. Et leksikon er en maktfaktor. Fagfolk-leksikonet synliggjør menneskene bak, det kollektive dugnadsleksikonet tilslører dem, med risiko for skjult maktkamp. Norges eventuelle eneste storleksikon i fremtiden må ikke være styrt av usynlige krefter inngitt autoritet på ukjente premisser.
Når Store Norske Leksikon er villig til å innrømme hvem som skjuler seg bak “Redaksjonen” på SNL som har ansvaret for det store flertallet av artikler på SNL, så kan vi vurdere å diskutere denne…
For å oppfylle grunnleggende krav til en nasjonal institusjon. Hvis Internetts mekanismer alene får rå, vil vi om kort tid stå igjen – i Norge som i andre land – med ett leksikon, Wikipedia, som er en rik kilde til detaljert oppdatert informasjon, men som ikke oppfyller grunnleggende krav til en nasjonal kultur- og kunnskapsinstitusjon.
Hvis SNL er villig til å informere om hva som er “grunnleggende krav til en nasjonal kultur- og kunnskapsinstitusjon”, så er jeg villig til å fortelle dem hvorfor Wikipedia tilfredsstiller disse kravene (evt. hvorfor det er feil i kravene). Forøvrig ville en slik setning *ALDRI* fått lov til å stå på Wikipedia, for den er alt for grov til å stå uten en referanse..
Aftenposten har i dag en leder om Store Norske Leksikon/Wikipedia hvor det bl.a. hevdes:
Et brukerbasert nettleksikon som Wikipedia, der bidragsyterne er anonyme, er imidlertid bare et supplement til et kvalitetssikret leksikon der navngitte fagpersoner kan stilles til ansvar for innholdet.
Og da må jeg spørre: Hvem er “Redaksjonen” som dukker opp på de fleste artikler på Store Norske? Hvordan kan man stille fagpersoner i Store Norske til ansvar for det de har skrevet som er galt (og jeg kan garantere deg at det er mye galt der)? SNL-Redaksjonen er ikke noe mer enn det samme som Wikipedia-administratorene; personer som kan kildekritikk; ikke (nødvendigvis) faget de skriver om.
Jeg kan love deg at jeg kan fortelle deg mye mer om de såkalte “anonyme” bidragsyterne på Wikipedia enn de “navngitte fagpersonene” på Store Norske (som ofte ikke er fagpersoner heller, bare navngitte, hvis de ikke tilhører Redaksjonen).
Når skal norske redaktører og Wikipedia-kritikere lære seg at det ikke finnes noen absolutte sannheter; bare kilder med større eller mindre troverdighet…
Dette er en liten notatliste over grunner jeg kan finne på for at brukere ikke bør bli administratorer på Wikipedia… Med mindre de har lyst da selvfølgelig (jeg mener at alle som har lyst, og som har vist at de kan stoles på, bør få verktøyene, selv om det er noen negative sider som jeg har beskrevet under). Anser det ikke som en fullstendig liste, og oppdaterer den litt tilfeldig når jeg kommer på flere grunner. Kom gjerne med flere
Etter at en artikkel på NRK dukket opp på IRC-kanalen til norsk Wikipedia i dag, så har jeg brukt endel tid på å undersøke oversetting fra nynorsk Wikipedia til bokmål, og må si jeg er imponert. Har testet med å oversette to artikler fra nynorsk: den greske guden Asopos og tettstedet Askvoll. Begge ser ut til å ha blitt rimelig bra, selv om det var litt småproblemer med noen ord som ble oversatt feil (ord med to betydninger f.eks.).
I motsetning til f.eks. Google Translate, som benytter seg av store mengder tekst som eksisterer på flere språk og som så klaskes sammen ut i fra statistisk sannsynlighet, så benytter Apertium seg av språkregler som sier hvordan ordene skal oversettes, noe som ser ut til å fungere veldig bra.
Må si at jeg gleder meg til å se hvordan Apertium utvikler seg videre. Har hørt noe snakk om automatisk oversetting mellom alle de nordiske språkene (færøysk og islandsk er ikke akkurat noe som er lett å lese, selv om det stammer fra norsk) som en vidreutvikling av det nåværende prosjektet mellom bokmål og nynorsk.
Lyst til å teste? http://www.apertium.org/?id=surfandtranslate (og vi kan vel muligens skjønne at norsk-lærerne ikke kommer til å like denne…)
Har blitt en hektisk valgkamp, og deilig å komme tilbake å få jobbet litt på Wikipedia (jeg har jo fulgt med på alt som har skjedd siden juni, men har ikke skrevet eller gjort så mye).
Begynte i forrige uke å jobbe litt med å lage litt stubber om viktige personer innen data; mer konkret har jeg oversatt noen artikler fra en:category:Computer pioneers. Lagde meg først en SQL-spørring på Toolserver som søkte etter artikler som manglet, men har nå gjort det om til et verktøy jeg har lagt ut på http://toolserver.org/~laaknor/catiwsuggest.php, og den kan brukes til å søke igjennom alle kategorier som inneholder søkeordet, og som ikke har interwiki til no.wikipedia
Listen som genereres er sortert på antall interwiki-lenker som finnes på artikkelen, slik at de artiklene som ligger øverst burde være “viktigst” å få fikset.
Tar gjerne i mot tilbakemeldinger på hvordan verktøyet fungerer. Har også planer om å legge inn støtte for å ta fra hvilket som helst språk, mot et hvilket som helst annet språk, men det får heller komme senere. Nå vil jeg skrive litt artikler
Ble informert om en spennende artikkel hos VG Wikipedias vekst avtar. Det kommer ikke særlig godt frem i artikkelen, men såvidt jeg greier å se, så gjelder tallene der engelsk Wikipedia, mens intervjuet er med en av de norske pressekontaktene, Morten Haugen som prater om den norske versjonen.
Engelsk Wikipedia, og også den tyske har i lengre tid snakket om at det er artikler som er mer eller mindre “ferdige”, og som det kan lønne seg om er mer eller mindre “låst” som “kvalitetssikret”. Tysk Wikipedia har allerede implementert såkalt “Stabile versjoner”, som gjør at alle endringer som gjøres ikke blir synlige i selve artikkelen (hvis den er merket som stabil) før de har blitt godkjent av en administrator. Det innebærer at vandalisme-redigeringer ikke blir synlige på slike artikler, mens “spenningen” ved å skrive forsvinner siden man ikke ser ting med en gang. Engelsk Wikipedia har ikke greid å bli enige med seg selv (noe som forøvrig ikke er unormalt i slike spørsmål) om de ønsker å implementere dette eller ei, men de trenger det nok etterhvert de også, for å gi bedre inntrykk av de aktuelle artiklene.
I mine øyne er nok enwiki mer eller mindre “fylt opp” av informasjon, og det er lite nytt som kan legges inn. De har fått skrevet om de aller fleste kommuner og byer i de fleste land, og størrelsen på artiklene er for en stor del bra.
Vi merker også at Wikipedia på bokmål/riksmål er rimelig “mettet”, men nok ikke like mye som en.wikipedia. Det har flere ganger hvert sagt på administrator-mailinglista at vi bruker mer tid på vedlikehold og vandalismebekjemping enn nyskriving for tiden, og jeg tror nok det føles slik for de som sitter oppe i det “til daglig”, men vi har fortsatt en ganske stor vekst-rate, og vi vokser fortere enn svensk og dansk Wikipedia. I forhold til antall mennesker som bor i landet har vi også en helt utrolig evne til å produsere innhold, og jeg håper at flere og flere vil være med å skrive etterhvert.
Oppdateringer: Ser nå ut til at Digi også har oppdaget saken, og der har man i hvertfall fokusert på at dette gjelder forskning på engelsk Wikipedia…
Kom over en morsom post på Lifehacker. Den tar utgangspunkt i å bruke Linux, og alle kommentarene går ut på å installere Linux-verktøy på Windows. Tenkte bare å skrive om at det er mulig å bruke det samme på Windows:
Velg Start -> Kjør
skriv “cmd” og trykk OK
skriv “nslookup” og enter
skriv “set type=txt” og enter
skriv inn <emne>.wp.dg.cx
Gjør automatisk oppslag på engelsk Wikipedia, og gir de første setningene i artikkelen… Og siden de fleste moderne datasystemer er avhengig av DNS for å fungere, så vil denne løsningen mest sannsynlig fungere uansett hva slags oppsett IT-ansvarlig har for begrensinger på internett-tilgang under prøver.
Mest sannsynlig er start->kjør og cmd.exe begrenset slik at man ikke får brukt disse, men da kan man i stedenfor lage en snarvei f.eks. på skrivebordet til “nslookup”…
Som jeg tidliger har skrevet om er det problemer med et mulig søksmål. Dette har nå dukket opp som en artikkel på VG og ComputerWorld, men det er noen alvorlige faktafeil i artiklene som er rimelig like.
1) Wikimedia Foundation har svart på forespørsel fra NPG. Svaret var at i følge amerikansk lov er det ikke foregått noen lovbrudd. NPG har svart på dette ved å varsle om et mulig søksmål/anmeldelse i England.
2) Det er ikke snakk om at “bare man legger ut et bilde på internett”, så forsvinner opphavsretten, men hvorvidt et det er opphavsrett på et fotografi av et maleri, hvor maleriet i seg selv ikke er beskyttet av opphavsrett lenger. Engelsk lov sier at bildet er beskyttet av opphavsrett; amerikansk lov (og rettspraksis) er at det ikke er beskyttet.
Forøvrig kan det nevnes at Wikipedia er ekstremt nøye på opphavsrettslovene, og i hvertfall den norske versjonen har fått skryt fra norske rettighetshavere. Man kan nok på de engelske prosjektene glemme at det finnes flere land som prater engelsk enn USA, men å begynne å prate om seriøse lovbrudd er nok vanskelig.