Hvem var anonyme sa du?

Aftenposten har i dag en leder om Store Norske Leksikon/Wikipedia hvor det bl.a. hevdes:

Et brukerbasert nettleksikon som Wikipedia, der bidragsyterne er anonyme, er imidlertid bare et supplement til et kvalitetssikret leksikon der navngitte fagpersoner kan stilles til ansvar for innholdet.

Og da må jeg spørre: Hvem er “Redaksjonen” som dukker opp på de fleste artikler på Store Norske? Hvordan kan man stille fagpersoner i Store Norske til ansvar for det de har skrevet som er galt (og jeg kan garantere deg at det er mye galt der)? SNL-Redaksjonen er ikke noe mer enn det samme som Wikipedia-administratorene; personer som kan kildekritikk; ikke (nødvendigvis) faget de skriver om.

Jeg kan love deg at jeg kan fortelle deg mye mer om de såkalte “anonyme” bidragsyterne på Wikipedia enn de “navngitte fagpersonene” på Store Norske (som ofte ikke er fagpersoner heller, bare navngitte, hvis de ikke tilhører Redaksjonen).

Når skal norske redaktører og Wikipedia-kritikere  lære seg at det ikke finnes noen absolutte sannheter; bare kilder med større eller mindre troverdighet…

Grunner til ikke å bli administrator

Dette er en liten notatliste over grunner jeg kan finne på for at brukere ikke bør bli administratorer på Wikipedia… Med mindre de har lyst da selvfølgelig (jeg mener at alle som har lyst, og som har vist at de kan stoles på, bør få verktøyene, selv om det er noen negative sider som jeg har beskrevet under). Anser det ikke som en fullstendig liste, og oppdaterer den litt tilfeldig når jeg kommer på flere grunner. Kom gjerne med flere

  • Konstant kritisert av andre brukere
  • Bruker mer tid på å debattere ting enn på å faktisk gjøre noe produktivt
  • Telefoner og e-post fra tilfeldige brukere som er uenig i noe du har gjort
  • Vanskelig å ta en pause fra Wikipedia-arbeidet og gjøre noe annet en periode for ikke å gå lei, uten å bli kritisert for å ikke gjøre administrator-jobben
  • Folk legger mye i statusen når det gjelder debatter av negativ art, mens det i positiv art “bare er noen ekstra knapper og ingenting viktig”
  • Ikke kunne ta igjen hvis noen er slemme/prater stygt mot deg
  • Dødstrusler (Hvorfor gjør så mange ting på internett de aldri ville funnet på å gjøre IRL?)

Automatisk oversetting mellom nynorsk og bokmål

Etter at en artikkel på NRK dukket opp på IRC-kanalen til norsk Wikipedia i dag, så har jeg brukt endel tid på å undersøke oversetting fra nynorsk Wikipedia til bokmål, og må si jeg er imponert. Har testet med å oversette to artikler fra nynorsk: den greske guden Asopos og tettstedet Askvoll. Begge ser ut til å ha blitt rimelig bra, selv om det var litt småproblemer med noen ord som ble oversatt feil (ord med to betydninger f.eks.).

I motsetning til f.eks. Google Translate, som benytter seg av store mengder tekst som eksisterer på flere språk og som så klaskes sammen ut i fra statistisk sannsynlighet, så benytter Apertium seg av språkregler som sier hvordan ordene skal oversettes, noe som ser ut til å fungere veldig bra.

Må si at jeg gleder meg til å se hvordan Apertium utvikler seg videre. Har hørt noe snakk om automatisk oversetting mellom alle de nordiske språkene (færøysk og islandsk er ikke akkurat noe som er lett å lese, selv om det stammer fra norsk) som en vidreutvikling av det nåværende prosjektet mellom bokmål og nynorsk.

Lyst til å teste? http://www.apertium.org/?id=surfandtranslate (og vi kan vel muligens skjønne at norsk-lærerne ikke kommer til å like denne…)

Da var man tilbake på Wikipedia-arbeidet

Har blitt en hektisk valgkamp, og deilig å komme tilbake å få jobbet litt på Wikipedia (jeg har jo fulgt med på alt som har skjedd siden juni, men har ikke skrevet eller gjort så mye).

Begynte i forrige uke å jobbe litt med å lage litt stubber om viktige personer innen data; mer konkret har jeg oversatt noen artikler fra en:category:Computer pioneers. Lagde meg først en SQL-spørring på Toolserver som søkte etter artikler som manglet, men har nå gjort det om til et verktøy jeg har lagt ut på http://toolserver.org/~laaknor/catiwsuggest.php, og den kan brukes til å søke igjennom alle kategorier som inneholder søkeordet, og som ikke har interwiki til no.wikipedia

Listen som genereres er sortert på antall interwiki-lenker som finnes på artikkelen, slik at de artiklene som ligger øverst burde være “viktigst” å få fikset.

Tar gjerne i mot tilbakemeldinger på hvordan verktøyet fungerer. Har også planer om å legge inn støtte for å ta fra hvilket som helst språk, mot et hvilket som helst annet språk, men det får heller komme senere. Nå vil jeg skrive litt artikler ;)

(Engelsk) Wikipedias vekst avtar – noen tanker

Ble informert om en spennende artikkel hos VG Wikipedias vekst avtar. Det kommer ikke særlig godt frem i artikkelen, men såvidt jeg greier å se, så gjelder tallene der engelsk Wikipedia, mens intervjuet er med en av de norske pressekontaktene, Morten Haugen som prater om den norske versjonen.

Engelsk Wikipedia, og også den tyske har i lengre tid snakket om at det er artikler som er mer eller mindre “ferdige”, og som det kan lønne seg om er mer eller mindre “låst” som “kvalitetssikret”. Tysk Wikipedia har allerede implementert såkalt “Stabile versjoner”, som gjør at alle endringer som gjøres ikke blir synlige i selve artikkelen (hvis den er merket som stabil) før de har blitt godkjent av en administrator. Det innebærer at vandalisme-redigeringer ikke blir synlige på slike artikler, mens “spenningen” ved å skrive forsvinner siden man ikke ser ting med en gang. Engelsk Wikipedia har ikke greid å bli enige med seg selv (noe som forøvrig ikke er unormalt i slike spørsmål) om de ønsker å implementere dette eller ei, men de trenger det nok etterhvert de også, for å gi bedre inntrykk av de aktuelle artiklene.

I mine øyne er nok enwiki mer eller mindre “fylt opp” av informasjon, og det er lite nytt som kan legges inn. De har fått skrevet om de aller fleste kommuner og byer i de fleste land, og størrelsen på artiklene er for en stor del bra.

Vi merker også at Wikipedia på bokmål/riksmål er rimelig “mettet”, men nok ikke like mye som en.wikipedia. Det har flere ganger hvert sagt på administrator-mailinglista at vi bruker mer tid på vedlikehold og vandalismebekjemping enn nyskriving for tiden, og jeg tror nok det føles slik for de som sitter oppe i det “til daglig”, men vi har fortsatt en ganske stor vekst-rate, og vi vokser fortere enn svensk og dansk Wikipedia. I forhold til antall mennesker som bor i landet har vi også en helt utrolig evne til å produsere innhold, og jeg håper at flere og flere vil være med å skrive etterhvert.

Oppdateringer: Ser nå ut til at Digi også har oppdaget saken, og der har man i hvertfall fokusert på at dette gjelder forskning på engelsk Wikipedia…

Juksing på prøver; Wikipedia over DNS

Kom over en morsom post på Lifehacker. Den tar utgangspunkt i å bruke Linux, og alle kommentarene går ut på å installere Linux-verktøy på Windows. Tenkte bare å skrive om at det er mulig å bruke det samme på Windows:

Velg Start -> Kjør

skriv “cmd” og trykk OK

skriv “nslookup” og enter

skriv “set type=txt” og enter

skriv inn <emne>.wp.dg.cx

Gjør automatisk oppslag på engelsk Wikipedia, og gir de første setningene i artikkelen… Og siden de fleste moderne datasystemer er avhengig av DNS for å fungere, så vil denne løsningen mest sannsynlig fungere uansett hva slags oppsett IT-ansvarlig har for begrensinger på internett-tilgang under prøver.

Mest sannsynlig er start->kjør og cmd.exe begrenset slik at man ikke får brukt disse, men da kan man i stedenfor lage en snarvei f.eks. på skrivebordet til “nslookup”…

Hvor er redigeringsknappen på “kvalitetssikrede” artikler!

Som jeg tidliger har skrevet om er det problemer med et mulig søksmål. Dette har nå dukket opp som en artikkel på VG og ComputerWorld, men det er noen alvorlige faktafeil i artiklene som er rimelig like.

1) Wikimedia Foundation har svart på forespørsel fra NPG. Svaret var at i følge amerikansk lov er det ikke foregått noen lovbrudd. NPG har svart på dette ved å varsle om et mulig søksmål/anmeldelse i England.

2) Det er ikke snakk om at “bare man legger ut et bilde på internett”, så forsvinner opphavsretten, men hvorvidt et det er opphavsrett på et fotografi av et maleri, hvor maleriet i seg selv ikke er beskyttet av opphavsrett lenger. Engelsk lov sier at bildet er beskyttet av opphavsrett; amerikansk lov (og rettspraksis) er at det ikke er beskyttet.

Forøvrig kan det nevnes at Wikipedia er ekstremt nøye på opphavsrettslovene, og i hvertfall den norske versjonen har fått skryt fra norske rettighetshavere. Man kan nok på de engelske prosjektene glemme at det finnes flere land som prater engelsk enn USA, men å begynne å prate om seriøse lovbrudd er nok vanskelig.

Problemer med opphavsrettslov på tvers av land (som om ikke vi viste det)

En amerikansk bruker på Wikimedia Commons er nå i søkelyset fra det engelske National Portrait Gallery for å ha lastet opp bilder de hadde på sin hjemmeside av kunstverk som ikke lenger er beskyttet av opphavsrett til Wikimedia Commons. NPG forsøkte først å få Wikimedia Foundation til å slette bildene som de mener å ha opphavsrett på i henhold til engelsk lov, men Wikimedia Foundation har ikke gjort som NPG ønsket.

Problemene i denne saken er mange. Engelsk lov har ikke noe krav til “verkshøyde” (som det heter i norsk lov) for å kunne beskyttes av opphavsrett. Verkshøyde vil si at det skal være noe kreativt og orginalt med det som skapes (i dette tilfelle bildene de har tatt av kunst). Derimot har amerikansk lov (og forøvrig også norsk lov) denne klausulen. Det som det dermed krangles om, er om en amerikansk borger har brutt engelsk lov; uten å oppholde seg i England og kan personen forventes å måtte forholde seg til den engelske loven på ett nettsted han besøker.

Dette kan bli en veldig spennende sak. På hvilken måte skal enkeltpersoner underlegges alle verdens lover utenom det landet personen fysisk oppholder seg i, og hvordan skal de forskjellige statene forholde seg til internasjonal lov (som ikke eksisterer) når det ikke er snakk om brudd på straffelover, men sivile søksmål på bakgrunn av opphavsrettslovene (og sivile søksmål skjer primært fordi politiet ikke har ressurser til å etterforske en “uprioritert” åndsverkslov).

Det har tidligere vært forsøkt å gå til rettslige skritt mot Wikipedia, bl.a. når en tysk politiker fikk sperret wikipedia.de (men ikke de.wikipedia.org siden den ligger under amerikansk jurisdiksjon, og det er der innholdet faktisk ligger), og når engelske ISPer blokkerte Wikipedia for visning av barnepornografi. Begge disse sakene medførte enorme debatter, masse pengestøtte til Wikimedia Foundation og de nasjonale interesseorganisasjonene, og at de som gikk til skritt for å hindre ytringsfriheten på Wikipedia måtte beklage i løpet av få dager. Hvis NPG dermed går til juridiske skritt i denne saken, kan en forvente at Wikimedia Foundation (og helt sikkert Electronic Frontier Foundation som kommer til å støtte Wikimedia i denne saken) har ubegrensede med økonomiske midler til rådighet. I tillegg kan man snakke om en juridisk sak som kommer til å følges av hele verden, og har potensiale til å forme opphavsrettslovene i alle de vestlige landene. I såfall er spørsmålet om NPG har gjennomføringskraften til å kjøre denne prosessen like langt som Wikimedia har; og i hvilken grad Wikimedia Foundation og de nasjonale organisasjonene greier å forme sitt budskap i riktig retning for å påvirke opphavsrettslovene internasjonalt.

Internett takler ikke nyheter

Noen dager har gått siden Michael Jackson døde, og det var mye rart som skjedde i løpet av veldig kort tid. Alle nettavisene begynte i full fart å publisere “noen andre sier at Michael Jackson er død”, og det var vanskelig å få noe bekreftet før det hadde gått flere timer. På Wikipedia ble artikkelen om Michael Jackson låst på alle de store språkene rimelig med en gang, fordi det ikke var kommet en offisiell uttalelse ennå. Minutter etter at de første rapporterene om popstjernens død kom, begynte alarmene også å gå på #wikimedia-tech; serverne for Wikipedia begynte å få belastningsproblemer.

Det tok litt tid å finne ut hva problemet var, men til slutt viste det seg at artikkelen om Michael Jackson ble besøkt så mange ganger på kort tid, at serverene slet med å bygge opp cachen på nytt. Fiksen der ble da å kjøre et quick hack:

Index: ParserCache.php
===================================================================
--- ParserCache.php	(revision 52088)
+++ ParserCache.php	(working copy)
@@ -63,6 +63,7 @@
  if ( is_object( $value ) ) {
    wfDebug( "Found.\n" );
    # Delete if article has changed since the cache was made
    // temp hack!
+   if( $article->mTitle->getPrefixedText() != 'Michael Jackson' ) {
    $canCache = $article->checkTouched();
    $cacheTime = $value->getCacheTime();
    $touched = $article->mTouched;

Heldigvis var det ikke bare Wikipedia som ikke taklet nyhetene, men med en million sidevisninger på en time på engelsk Wikipedia alene, så har man vel egentlig ikke testet MediaWiki for belastningen som kom…

Litt stubbkonkurranse-statistikk

Har dessverre ikke hatt tid til å leke så mye på Wikipedia de siste ukene, men tenkte jeg skulle lage litt statistikk for konkurransen foreløpig.

Antall artikler som er løftet til nå er 877 artikler. Av disse fordeler tidspunktene på døgnet seg slik:

tid antall
00 45
01 21
02 5
04 1
06 7
07 28
08 23
09 35
10 31
11 44
12 54
13 42
14 45
15 40
16 60
17 45
18 45
19 60
20 65
21 67
22 65
23 49

Som en kan se av dette, så har vi aktive personer mesteparten av dagen/arbeidstiden, og på kvelden, men veldig få som jobber på kvelden, noe som egentlig er å forvente. Litt morsomt er det jo også at det er en liten økning mellom klokken 1200 og 1259, noe som burde tilsi at det er endel som jobber i lunsjen.

Hvis vi også ser på statistikken på datoer folk har kommet med bidragene sine, får vi:
(rosa er søndager)

Dato Antall
01 66
02 78
03 78
04 65
05 85
06 71
07 37
08 33
09 44
10 77
11 56
12 51
13 22
14 23
15 26
16 40
17 20

Litt spennende å se ukedager kontra helger her. Igjen viser det seg at ganske mye skjer i forbindelse med arbeidstid/ukedager. Første uka har høyest produksjon, og så dabber det av, men med en større produksjon i ukedagene enn helgene hele veien. Hvordan dette ender opp til slutt blir spennende å se, men det tyder på at jo lenger en konkurranse varer, dess vanskeligere blir det å holde fokusen på en ting.