Værdata i Wikinews (utkast)

Fra Wikimedia Norge
Hopp til navigering Hopp til søk

Værdata i Wikinews kan la seg gjøre ved å bruke data fra tenesten yr.no som er fritt tilgjengelig. Tjenesten er et samarbeid mellom Meteorologisk institutt og NRK. Nettstedet leverer værvarsel for over syv millioner steder i verden; 700 000 av disse er i Norge. De har varsel for alle steder som finnes i Geonames-databasen med unntak av Norge hvor Kartverkets database blir brukt. [1] Tettheten til navnene utfra databasen varierer fra flere for hver kvadratkilometer til ned mot en for hver kvadratmil. [2] I tillegg finnes det observasjoner fra 2000 målestasjoner (i Norge?). Varslene for Nord-Europa blir oppdatert fire ganger i døgnet, resten av verden to ganger i døgnet. Tjenesten er tilgjengelig på bokmål, nynorsk og engelsk.

Valideringer utført av ECWMF (Det europeiske værsenteret i England) gjør en etterkontroll av værdataene sine (som danner grunnlag for dataene på yr.no), og valideringer på europeisk nivå viser at prognosene ligger på 90-95% de første dagene for deretter å falle til rundt 60% for dag 10 i prognosen.

Nettstedet yr.no hevder at de trolig er de eneste som gir ut værprognoser for et så stort antall steder i alle land i verden, på et enkelt og tilgjengelig XML-format, og som tilbyr dette gratis og med svært enkle vilkår for gjenbruk. Tjenesten er statsfinansiert og ønsker å dele innholdet med flest mulige partnere. [3] [4]

Skal tjenesten gjøres tilgjengelig i Wikinews på en skikkelig måte så må det gjøres en utviklingsjobb. Denne må gjøre det mulig å få til mest mulig internasjonalisering/lokalisering slik at tjenesten også blir tilgjengelig for språk som ikke kan bruke noen av de tre som allerede blir levert.

Alternative løsninger er basert på METAR og har en langt dårligere oppløsning. De kan likevel være et alternativ i enkelte områder.

Implementasjon

Data hentes enten fra tjenesten som griddata eller som stedsdata. Griddata gjenkjennes på formatet som følger etablert notasjon for geografiske posisjoner. Hvis en ber om griddata så interpoleres data til oppgitt punkt/det hentes data for nærmeste gridpunkt, hvis det bes om stedsdata så må navnet finnes i GeoNames-databasen.

Selve tilgangen til tjenesten skjer gjennom en tag-funksjon eller parserfunksjon. Parametre til disse vil overstyre systemsettinger. Hvis disse definerer en presentasjon så henter disse ut spesifikke verdier fra parser treet, mens andre deler av treet forkastes.

Det kan synes som om den enkleste tilnærmingen til internasjonalisering/lokalisering i Mediawiki er å oversette deler av XML-dataene til maler i Mediawiki, og la disse aksesseres via rommet for systemmeldinger. Det vil da for eksempel finnes systemmeldinger «Mediawiki:Weatherdata forecast tabular time» og «Mediawiki:Weatherdata*windDirection» den første formaterer en tabellrad, og den siste gjør presentasjon av vindretning. I tillegg er den første oppføringen absolutt og kan brukes ett sted mens den siste kan brukes flere steder. (Muligens trengs bare den første.) Ved at malverket defineres lokalt i de enkelte språkene så forsvinner en stor del av behovet for lokalisering.

Deler av tjenesten bruker fritekst i XML-feeden og dette skaper problemer ved en lokalisering til andre språk. Kanskje er det mulig å lage en løsning for å oversette et begrenset sett av uttrykk til lokale språk, eventuelt få Yr.no til å levere et format som er enklere å lokalisere til andre språk.

Data mellomlagres i Memcached på serverene og blir levert integrert med annen tekst. Mellomlagring er nødvendig for å sikre brukernes anonymitet. Det må finnes en løsning på cacheproblemet, nå legges det opp til at sider skal regenereres etter 10-20 minutter. Istedenfor å sette sider til å regenerere svært hyppig så må sider regenereres ved behov. En mulig løsning er en separat prosess som gjør cache invalidation når det påvises nye underlagsdata. Hver gang en side med værdata regenereres så lages det en oppføring i en temporærtabell med datagrunnlagets MD5-hash, sammen med tidspunktet for når oppføringen foreldes («nextupdate») og med en øvre grense for levetid. Denne tabellen gjennomløpes og oppdateres ved utløpet av hver nextupdate opp til øvre levetid, hvis datagrunnlaget endres så gjøres en cache invalidation og prosessen resettes. Dette pågår opp til øvre levetid for prosessen hvoretter det skjer en cache invalidation og fortsatt prosessering termineres. Typisk vil iterasjonen gå med en periode på 20 minutter og termineres etter 4 timer. Denne løsningen gjør at hyppig oppdaterte sider oppdateres når det faktisk finnes nytt datagrunnlag tilgjengelig, samtidig som prosessen terminerer for sjeldent brukte sider.

Lisensiering

Innholdet på de deler av tjenesten som er fritt tilgjengelig kan etter det som sies på sidene videreformidles, videreutvikles og utnyttes så lenge retningslinjene følges. Det er et krav om kildehenvisning og tilbakelenking til tjenesten. Det er også et krav om at det meteorologifaglige innholdet ikke skal endres. Det betyr i praksis at rent faglig tilsvarer dette en «nd»-lisens, det vil si at temperaturen for et område kan ikke endres, men at det ikke tilsvarer en slik lisens når det kommer til presentasjon av varselet. Dette er også dekt gjennom Åndsverksloven ved at en ikke kan gi kildetilvisning for et verk hvor det er gjort endringer som opphavsmannen motsetter seg. Tilsvarende gjelder også på nettsider med pornografisk eller rasistisk innhold, eller på nettsider som bryter norsk lov. De sier at innhold kan videreformidles og brukes der det blandes med kommersielt innhold (reklame), men uten å si noe om det er mulig å ta betalt for selve formidlingen av innholdet. [5]

I forhold til Åndsverksloven havner selve tjenesten under databasevernet i §43 [6]

Referanser

  1. GeoNames
  2. GeoNames Country Statistic
  3. Yr.no: Vilkår for bruk av innhald frå yr.no
  4. Yr.no: Slik lagar vi varsla på yr.no
  5. Yr.no: Lag dine eigne tenester med innhald frå yr.no
  6. LOV 1961-05-12 nr 02: Lov om opphavsrett til åndsverk m.v. (åndsverkloven).5. kapitel. Andre rettigheter.

Eksterne lenker