tirsdag 17. mars 2009

Litt stubbkonkurranse-statistikk

Har dessverre ikke hatt tid til å leke så mye på Wikipedia de siste ukene, men tenkte jeg skulle lage litt statistikk for konkurransen foreløpig.

Antall artikler som er løftet til nå er 877 artikler. Av disse fordeler tidspunktene på døgnet seg slik:

tidantall
00 45
01 21
02 5
04 1
06 7
07 28
08 23
09 35
10 31
11 44
12 54
13 42
14 45
15 40
16 60
17 45
18 45
19 60
20 65
21 67
22 65
23 49

Som en kan se av dette, så har vi aktive personer mesteparten av dagen/arbeidstiden, og på kvelden, men veldig få som jobber på kvelden, noe som egentlig er å forvente. Litt morsomt er det jo også at det er en liten økning mellom klokken 1200 og 1259, noe som burde tilsi at det er endel som jobber i lunsjen.

Hvis vi også ser på statistikken på datoer folk har kommet med bidragene sine, får vi:
(rosa er søndager)

DatoAntall
0166
0278
0378
0465
0585
0671
0737
0833
0944
1077
1156
1251
1322
1423
1526
1640
1720

Litt spennende å se ukedager kontra helger her. Igjen viser det seg at ganske mye skjer i forbindelse med arbeidstid/ukedager. Første uka har høyest produksjon, og så dabber det av, men med en større produksjon i ukedagene enn helgene hele veien. Hvordan dette ender opp til slutt blir spennende å se, men det tyder på at jo lenger en konkurranse varer, dess vanskeligere blir det å holde fokusen på en ting.

torsdag 26. februar 2009

Wikipedia er ikke akkurat imponert over SNL

Da har SNL vært ute et par dager, og inntrykkene har vært blandet. SNL selv skryter av å være et "kvalitetssikret alternativ", og på lanseringen på onsdag var det flere som mobbet Wikipedia for å ikke være kvalitetssikret.

På Wikipedias admin-mailingliste, IRC-kanal og på Tinget har faktafeil i SNL rast inn. Store og mindre feil er funnet, men det er absolutt mulig å finne på Wikipedia også. Kvalitetssikringen betyr i mine øyne ikke ting er 100% riktig, og evne til kildekritikk og sjekking av referanser bør brukes også mot de såkalte kvalitetssikrede artiklene til SNL. Det jeg syns er dårligere er at SNLs system ikke er er i stand til å håndtere tekstmengden. Hvert døgn kommer det gjerne inn en 5-10 artikler på Wikipedia om "xxx, 15 år gammel, går på skole og liker å drive med hest på fritiden". Disse artiklene overlever stort sett ikke mer enn noen minutter før de blir slettet som ikke relevante. På IRC-kanalen til Wikipedia sitter vi nå omtrent med stoppeklokke og ser på en spesifikk brukerartikkel på SNL som er av dette slaget, og den har nå stått i over et døgn. Dette har fått debatten til å gå på om hvorvidt SNL har i det hele tatt har vandalisme-bekjemping utenfor arbeidstiden, og om de virkelig har tenkt til å slippe inn absolutt alt... Ennå viktigere er om de har planer om å slette ting som ikke er verifiserbart, eller om de bare skal la det stå som brukerartikler; noe som gjør tekstmengden i SNL så stor at det blir vanskelig å finne det man faktisk lurer på.

Wikipedias styrke er ikke det at alle kan skrive artikler om alt, men heller det også alt annet ved Wikipedia er åpent. Hvem som helst kan bytte kategorier, flytte artikler, skrive om store deler av artikler og se det på trykk i det de trykker lagre. Det blir rett og slett ikke det samme å legge inn en kommentar, og så vente i noen uker før fagansvarlig har fått lest igjennom og evt. lagt inn den informasjonen man kommenterer.

Wikipedia har også den styrken at det styres som et meritokrati (en artikkel som forresten er bedre på SNL), og hvem som helst har muligheten til å få bedre rettigheter på Wikipedia, eller av wikisamfunnet bli ansett som ekspert på et område. Hva man skriver blir faktisk lagt merke til, men uten at vi klistrer navnet ved siden av artikkelen. De som er aktive og som man kommuniserer med legger merke til hvem du er, i motsetning til tilfeldige lesere.

Markedsføring av navnet på forfatteren er muligens bra egenreklame for forfatteren, men det betyr ikke at navnet blir lagt merke til. En bruker som googler på et emne og kommer inn på en SNL-artikkel vil trolig lese artikkelinnholdet og ikke metainformasjon som hvem som har skrevet artikkelen (jeg har i hvertfall ikke for vane å legge merke til hvem som har skrevet en nyhetsartikkel i en avis; med mindre jeg er helt uenig med journalisten og vil ta kontakt med denne...).

Mengden med bugs og lite fleksible portalløsning tyder på at prosjektet fra Kunnskapsforlagets side har vært basert på "slik har vi hatt det, følgende endringer vil vi gjøre", mens Wikimedia Foundation i stor grad baserer seg på å ha full åpenhet om hvordan MediaWiki skal utvikles, og å tillate at vanlige brukere har mulighet til skrive egne patcher og etterhvert få dem inn i produksjon, også på Wikipedia (men av åpenbare grunner tillater man ikke skrivetilgang rett inn i MediaWiki-kildekoden før man faktisk har bevist at man kan noe).

Skal SNL virkelig konkurrere med Wikipedia, så har de fortsatt langt å gå, for dette skuffer. Det å være gratis og kvalitetssikret er ikke nok, og vitner om en manglende forståelse av hva de faktisk konkurrer mot. Spesielt burde de sett på hvordan nettsamfunnet og maktstrukturen fungerer, og for ikke å snakke om vandalismebekjempelse og kvalitetssjekkingen.

tirsdag 24. februar 2009

Førsteinntrykket av Store Norske Leksikon er ikke akkurat bra...

Store Norske Leksikon er nå gratis tilgjengelig for alle. Tenkte bare i full fart at jeg skulle registrere meg og titte litt rundt, og ser at man oppfordres til å skrive om seg selv (og ordlyden oppfordrer mye mer til å skrive hva som helst enn det gjøres på Wikipedias brukersider), så jeg tenkte jeg skulle gjøre det.

Grensesnittet er mye mer brukervennlig for nye brukere med en ordentlig HTML-editor, men når det første jeg møter på når jeg trykker lagre er en laaang advarsel om at "er du sikkert på at du vil navigere vekk fra dette vinduet?", noe som for meg sier at teksten ikke lagres men at man prøver å avbryte alt. Jeg trykker OK etter å ha forsikret meg om at jeg faktisk trykker på publiser-knappen, og får opp feilmelding om at:

Artikkelen kunne ikke lagres på grunn av følgende manglel/mangler
Det var et probler med følgende felter:
Artikkelteksten kunne ikke lagres.

En feilmelding som overhodet ikke sier noenting om hva som faktisk er galt. Jaja, får satse på at det kommer litt forbedringer i løpet av et par dager.

Planlegger å gjøre litt testing av SNL mot Wikipedia og lage litt statistikk fremover, men foreløpig syns jeg det mangler noe fornuftig måte å hente ut data fra SNL som f.eks. tilfeldig side. Får lete litt mer de neste dagene.

søndag 22. februar 2009

Takk for alle stemmer

Da er valget for nye stewards ferdig for i år, og jeg fikk 119 for-stemmer, 7 mot og 6 nøytrale. Takk for alle stemmer og hyggelige kommentarer. Med 94,4% støtte, så antar jeg at Wikimedias styre kommer til å gi meg rettighetene. Satser på at det kommer til å bli spennende jobbing på meg fremover :)

torsdag 19. februar 2009

It's a new world order, og Wikipedia er del av den

Denne uka pågår rettssaken mot hovedmennene bak fildelingsnettverket ThePirateBay i Sverige. Det har tatt svenske myndigheter nesten 3 år fra arrestasjonene ble gjort i mai 2006 til rettssaken kom opp.

Denne saken syns jeg er ganske spennende. Greit nok at det de gjør er uetisk (men det hindrer ikke at jeg bruker piratebay og andre fildelingstjenester selv), men den sier også noe om at opphavsrett ikke lenger er det samme som det var for 10-15 år siden. Større frihet til forbrukeren er nødvendig i dagens samfunn, for hvis ikke vil ikke forbrukeren bry seg om at noen har "opphavsrett" på noe.

Wikipedia er her et godt eksempel på at store friheter til forbrukeren faktisk fungerer. Jeg vil ikke kalle det en forretningsmodell, siden Wikimedia Foundation er non-profit, men det er mulig å tjene penger på å gi forbrukeren tilgang til ting gratis. Har også stor tro på bl.a. Spotify, hvor du får tilgang til all musikken du trenger live over internett (okey, de er i oppstartsfase fortsatt og har ikke alt av musikk inne, men konseptet er bra). Fast pris i måneden, eller reklame innimellom sangene. Helt greit i mine øyne.

Alt det handler om er å bryte med tradisjonell tenkning, noe Christer Falck tydeligvis ikke har tenkt til å gjøre, han uttaler seg til VG. Jimmy Wales måtte gjøre det når han ga opp Nupedia, og startet Wikipedia i stedenfor, nå er det på tide for plate og filmbransjen å gjøre det også. Å saksøke store aktører som ThePirateBay gjør ikke noe annet enn å sørge for massiv reklame og masse donasjoner. Dette så vi også når en tysk politiker gikk inn for å sperre wikipedia.de, fordi han ikke likte noe som sto der.

Informasjon og opphavsrett kan rett og slett ikke sperres inne i regelverk, for man mister respekten for regelverket. Sørg heller for å spille med åpne armer, noe til og med Microsoft har forstått nå (men vi som skjønte det for lenge siden må vist fortsatt lære dem litt mer om hva åpenhet betyr :P )

Nei, får vel titte litt mer i DVD-hylla og se om jeg finner en uåpnet DVD-film som tidligere har vært lastet ned fra piratebay og som var bra nok til å kjøpe...

torsdag 12. februar 2009

Litt artikkelstørrelsestatistikk

Gjennomsnittlig er artiklene våre 2458 byte lange, og meridianen er på 1404 byte.
Mindre enn antall byte Antall artikler
<10097
<200>2131
<300>6978
<400>15088
<500>23017
<600>32159
<700>42605
<800>52499
<900>62091
<1000>71246



De 40 største artiklene vi har i antall byte:




Antall byteArtikkelens navn
553748Kinesisk kirkehistorie
444121Listeovertitler i adelskalendrene på de britiske øyer
188067Liste over norske videregående skoler
159390Liste over dopingsaker
158274Nepals kommunistiske parti (maoistisk)
156851Israel–Gaza-konflikten 2008–2009
156784Liste over Formel 1-førere
152298Statistikk om Liverpool_FC
144777Israel
143499Liste over norske_mannsnavn
139285Liste over kommuner i Brasil per delstat
128243Kinesisk kirkehistorie fra 1500 til 1644
126858Liste over passasjerene ombord på RMS «Titanic»
120229Sovjetunionen
117682Kulturrevolusjonen
114877Oversikt over olympiske gullvinnere
114703Oversikt over folk og stammer i Europa og nære omgivelser
114165Kinesisk kirkehistorie fra 1799 til 1911
113420Liste over norske malere/data
111197Jan Smuts
110646Yasir Arafat
109152Norges kommuner
107305Henrik Wergeland
106017Vinnere av medalje i de olympiske sommerlekene 2008
101815Parker i Oslo
98658Kinesisk kirkehistorie fra 1644 til 1799
98247Alex Ferguson
98095Kappkolonien
97976Vinterkrigen
97542Liste over GameCube-spill
96991Administrative inndelinger av kommunene i Norge
96766Norges høyeste fjell
95699ICD-10 kapittel I: A00-B99 - Visse infeksjonssykdommer og parasittsykdommer
91765Adolf Hitler
91520Kinesisk kirkehistorie fra 1949 til 1976
91151Statsbudsjettet
90114ICD-10 kapittel II: C00-D48 - Svulster
89950VM i svømming 2008 (kortbane)
87827Indoariske språk
86952Liste over tettsteder i Sverige

søndag 8. februar 2009

Det ekte wikispillet

I går hadde vi et lite wikitreff i Oslo. Atluxity, Flums og jeg begynte med bowling, noe vi fant ut at var det eneste ekte wikispillet, siden det er redigeringsknapp på resultatene (uten at jeg kan si at resultatene ble noe forbedret allikevel...). Det endte med to serier og totalt 258 poeng til Atluxity, 176 poeng til Flums og 110 poeng til meg.

Etter bowlingen dro vi på Egon ved Karl Johan, og etterhvert kom også Kjetil_r. Ble en gooood del timer med prating.

Takk for en hyggelig kveld dere. Eneste som gjenstår nå, er å få til en måte å redigere wikisider og bowlingresultater etter at man har konvertert til PDF eller skrevet ut ;)

fredag 6. februar 2009

Farene ved nominasjoner til verv

Vi har hatt et par nominasjoner til administratorverv på Wikipedia som har gått ad undas på grunn av at mange anser personen som flink og iherdig, det kommer til en administrator-nominasjon, og så kommer mot-stemmene på rekke og rad på grunn av småting som har skjedd for lenge siden, eller steder som ikke de fleste følger med på (f.eks. på enkeltartikler eller diskusjonssider til artikler).

Det har vært snakket om at administratorer burde sende en mail til admin-mailinglisten før de nominerer, bare for å "lufte muligheten", noe enkelte er fullstendig i mot, fordi det kan virke som om man planlegger hvem som skal være administratorer.

Når man er aktiv, så vil man alltid tråkke noen på tærne og tabbe seg ut, og det er ikke noe negativt i det. Spørsmålet er hvor ofte, hvor alvorlig og hvor mange.

I den pågående stewardavstemningen hadde vi en særdeles aktiv bruker som kalte seg Cometstyles. Han var en av de første brukerne på meta jeg la merke til, og var administrator på enkel engelsk wikipedia, mediawiki.org og testwiki, hadde global rollback-rettigheter, OTRS-tilgang og var generelt sett veldig aktiv, på tvers av alle Wikimedia-prosjektene. Han fikk endel negative kommentarer i avstemningen, og reagerte med å bli sinna, og forlot Wikimedia etter to dager i steward-valget som varer i 3 uker.

Nå er ikke stewardavstemninger lik administratoravstemningene på norsk wikipedia (man må aktivt melde seg som steward en gang i året, mens på norsk wikipedia blir man i hovedsak nominert av noen andre, som oftest administratorer), men prinsippene er de samme. Det er enklere å si "jeg syns ikke du bør stille til valg, fordi du en gang i tiden har gjort en dum ting, og noen vil nok stemme mot deg på grunn av dette" på privat, enn å oppleve å få mange mot seg og virkelig føle seg satt lite pris på.

Det har det siste halvåret vært ekstremt mange administrator-nominasjoner som har skapt store debatter (i forhold til tidligere perioder), og det er tydelig at man nå er nødt til å forhøre seg om hvordan en RfA kommer til å ende før man faktisk gjennomfører RfAen...

torsdag 29. januar 2009

Det blir blank stemme på meg!

Språkstrid hjelper ikke mye, hverken ute i det virkelig liv eller på Wikipedia. Det er en skyttergravskrig uten like, som dessverre bare medfører krangling.

I mine øyne er det to argumenter som er gjeldende:

Å bruke forkortelsen "nb" blir teknisk riktig, for to likestilte språk, i stedenfor "no", som ikke er et språk i det hele tatt.

Som tekniker er det for meg viktig at ting skal være teknisk riktig. Vi har endel problemer med f.eks. no.wikinews.org, som tillater begge målformer og som andre språk lenker til "norsk (bokmål)" (hmmm, dette minner meg om at jeg lovet Jon Harald å skrive et script for å endre på dette... kanskje vurdere å titte litt på det snart).

Det faktum at ting fra begynnelsen er feil gjør at ting blir dårligere over tid, og skaper stadig flere problemer. En feil som burde vært rettet for mange år siden skaper stadig flere problemer, noe vi nå merker (det hadde vært betydelig enklere å flytte i 2005, selv om det ikke var lett da heller).

Personlig er jeg veldig glad i nynorsk, og ser gjerne at det kommer tydeligere frem som endel av vår kultur, selv om jeg mot tvungen sidemålsundervisning i skolen.

Å flytte nå vil være skadelig for Wikipedia på bokmål/riksmål

Ja, definitivt skadelig. Google-dokumentasjon på "ikke noe problem" eller ei; jeg tror nok noen av SQL-spørringene i databasene til Google ikke bare sjekker HTTP Redirect-meldinger, men også URL-feltet, og da vil vi miste rank hos Google. Wikipedia former hvordan andre leksikon skal fungere, og når de tar etter oss, og vi faktisk får konkurranse på våre premisser, så er det ikke riktig at vi skal ødelegge for oss selv ved å ødelegge pagerank hos søkemotorer.

Det er også et spørsmål som vi diskuterer noen ganger på jobb: fordi ting blir teknisk riktig, så betyr ikke det at det er verdt å bruke ressurser på.


Jeg skulle ønske det var noen fasitsvar på dette, men det er det ikke. Jeg har derfor kommet til den konklusjonen at det jeg ønsker i realiteten er:
  • MediaWiki og andre interne ting i Wikimedia går over til å bruke nb i stedenfor no der det er bokmål som brukes (f.eks. oversettelser av MediaWiki)
  • no.wikipedia.org flyttes til nb.wikipedia.org når redesign av Wikipedia gjør det aktuelt, altså hvis man uansett får andre tap i forbindelse med omlegginger av MediaWiki-plattformen, eller internett endrer seg på en slik måte at man må legge om strukturen.

Kom nå også på at det kunne vært en mulighet at både nb og no kan gi resultater for bokmåls-databasen, og flytte over til nb over tid, men det krever også litt mer prosjektering og planlegging enn det skyttergravskrigen vår har kunnet gjøre.



Som et resultat av dette, har jeg bestemt meg for å stemme blankt i den pågående avstemningen, da prosessen som har ført frem til denne avstemningen rett og slett har vært for preget av følelser og krangling til at jeg greier å finne en fornuftig løsning som jeg mener "dette er riktig!"

tirsdag 27. januar 2009

Noen stoler ikke på administratorer

Brion Vibber har i dag lagt inn AbuseFilter-utvidelsen til MediaWiki på testwiki. Denne utvidelsen kan trigge på flere forskjellige måter når brukere skriver på uønskede måter. Det jeg reagerer på er det som Brion trekker frem at den kan reagere med automatisk utmelding av grupper.

Jeg ser for meg morsomme funksjoner som "automatisk desysop hvis andelen Wikipedia:-navnerom-redigeringer blir høyere enn andelen hovednavnerom-redigeringer", og "automatisk blokkering, du har skrevet for mye innen et emne/kategori; ta en pause" :P

Regner ikke med at denne funksjonaliteten blir aktivert på Wikipedia dog...

lørdag 24. januar 2009

Da gjør man seg klar for valgkamp!

I morgen er siste frist for å melde kandidaturet sitt for årets Steward-valg i Wikimedia. Jeg leverte mitt kandidatur forrige helg, og valget foregår fra 1. februar.

Stewards er en liten samling personer fra hele verden som har tilgang til det aller meste i Wikimedia-sammenheng; mulighet til å kjøre CheckUser (se IP-adresser for registrerte brukere), Oversight (permanent sletting av informasjon, i motsetning til administratorenes mulighet til å slette/se slettet/gjenopprette alle artikle), og å ta og gi alle rettigheter på alle wikier.

Min motivasjon for å stille til valg er den såkalte Global Bot policy, som (i mine øyne) overlater ansvaret for interwiki-lenking mellom språkvarianter til meta og stewards. Jeg har jobbet med å få denne implementert på flere wikier (bl.a. den delen av den som har med global bot-rettigheten, som jeg har fått inn på norsk, dansk og svensk wikipedia), og jeg kunne tenke meg å jobbe mer med globale boter fremover.

Håper å få alle stemmeberettigedes stemmer på meta (både positive og negative stemmer!) i tiden mellom 1. og 22. februar.

mandag 19. januar 2009

Språkdebatt i Wikipedia-Norge

Akkurat nå raser det en språkdebatt på Tinget om hvorvidt Wikipedia på Bokmål/Riksmål bør bytte fra språkkoden no (som gjelder begge de norske språkene), til den korrekte koden nb (bokmål).

Begge sider har i mine øyne fornuftige argumenter:
  • no-koden skaper endel problemer for wikimedia-prosjekter som faktisk er delt mellom begge språk (wikinytt og wikibooks har interwiki-lenker til Norsk (bokmål), selv om artikkelen er på nynorsk)
  • Det vil synliggjøre at vi har to språk, og to (eller faktisk tre, om vi tar med nord-samisk Wikipedia) Wikipediaer
  • no-koden kan i fremtiden brukes til en felles webside/portal for å markedsføre alle norske (evt. alle skandinaviske) Wikipediaer. Det er dog noen år før vi kan gjøre noe med dette, så vi kan ikke planlegge bruken i dag.
  • Debatten om at nynorsk-folket føler seg undertrykt vil forhåpentligvis gi seg... (I hvertfall i Wikipedia-sammenheng...)
men...
  • Wikipedia på bokmål/riksmål vil trolig miste Google-rank, i hvertfall for en midlertidig periode
  • De færreste bruker URLen http://no.wikipedia.org og vil ikke merke at man bytter til nb.wikipedia.org. De aller fleste (utenom de som er aktive på Wikipedia) kommer sannsynligvis inn via Google eller andre søkemotorer, eller via lenker, og endringen vil dermed være uten hensikt.
  • At ting blir teknisk riktig, betyr ikke at man skal gjøre kjempestore endringer, bare fordi det blir riktig.
  • Wikipedia møter i disse dager stor konkurranse, i dag ble det annonsert at KNOL er oppe i 100 000 artikler, samtidig som Store Norske Leksikon lanserer sitt frie alternativ i løpet av kort tid. Har vi råd til å gjøre så store endringer akkurat nå?

Det er en skyttergravskrig uten like i debattene på Wikipedia. I mine øyne er det ingen av sidene som kan ha rett i dette. Ja, jeg mener at vi bør bytte til nb, men jeg tror ikke akkurat nå er riktig tidspunkt. Det burde ha skjedd i 2004/2005 når skillet mellom bokmål og nynorsk skjedde, men da som nå var det ikke mulig å bli enige om noe. Men om vi ikke gjør det nå, når skal vi da gjøre det?

Vær så snill; bli ferdig å krangle, så vi kan få tatt en avstemming, og bli ferdig. Så kanskje jeg kan få Tinget inn på overvåkingslista mi igjen... Og kanskje jeg få bestemt meg for hva jeg selv mener er riktig også

Ny funksjonalitet på Wikimedia-wiki: Utkast

Har i løpet av helga fått oversatt den nye utvidelsen til MediaWiki som er utviklet av Trevor Parscal, nylig ansatt utvikler hos Wikimedia Foundation.

Utvidelsen gjør at alt du skriver lagres i et "utkast" hvert 2. minutt, og om det skulle skje noe med PCen din (eller det ytterst skjeldne "brukerfeil"), så vil du få opp utkastet fra forrige gang du var inne å redigerte på artikkelen når du prøver å redigere artikkelen igjen.


Et veldig bra initativ fra Foundation, som forhåpentligvis vil hjelpe litt for frustrerte skribenter. Kan jo samtidig nevne at Wikimedia Foundation har fått nesten $900 000, for å gjøre MediaWiki mer brukervennlig. Mye morsomt som kan komme ut av dette i løpet av året ;)

onsdag 7. januar 2009

Kjenner du noen homofile? Hold deg unna Wikipedia!!!!!!!111oneoneoneleven

Nyere forskning innen vandaliseringsmønster på Wikipedia har konkludert med at Venner av homofile ikke bør redigere på Wikipedia. Så kjenner du noen homofile, så hold deg unna! (snakker om sola, så tror jeg at jeg må kvitte meg med noen venner selv :P)

Takk til V85 for å ha oversatt denne ferdig. Fikk vist ikke tid til å fortsette på den når jeg gikk hjem fra jobb den dagen, og har glemt den i ettertid.