Ordsky for lokale fakta


Author:

Author ImageLars Nyre

Ordskyer kan fortelja oss kva som er viktig i tekstar. Kan dei fortelje oss kva som er viktig på stader óg?

Kollega og samarbeidspartner Bjørnar Tessem er hovudforfattar denne gongen. Tessem er professor i informasjonsvitskap ved UiB. På biletet prøver han ut PediaCloud-appen i Vaskerelven. Foto: Lars Nyre.

Ordskyer er ein visuell presentasjon av ord som førekjem i ein tekst eller i ei samling av tekstar. Dei er laga slik at dei orda som førekjem oftast eller på andre måtar vert sett på som viktige får større skriftstorleik.

Ein person som ser på ei ordsky får slik eit raskt inntrykk av kva ord som er viktige i forhold  til eit tema. Ved å klikke på ordet kan ein få tilgang til meir informasjon om temaet.

Lokasjonsorienterte ordskyer

Ordskyer kan brukast til så mangt. Ein måte å utforske dei på er å knyte dei til tekstar som er lokaliserte, dvs. at det finst ei tilknyting til ein eller fleire geografiske lokasjonar. Det å lokasjonsfeste ein tekst vert ofte kalla geotagging av tekstar.

Saman med kollegaer ved Universitetet i Bergen har professor Tessem utvikla ein app-prototyp med ordskyer for stader. Den heiter PediaCloud, og som namnet hintar til er data frå WikiPedia, der det fins mellom 1 og 2 millionar artiklar som er geotagga.

PediaCloud, skjermbilde

Figur 1: Tre skjermdumpar frå PediaCloud brukt i Vaskerelven i Bergen sentrum.

Når du står ein stad og opnar appen lastar den ned data om geotagga WikiPedia-artiklar i nærleiken (t.d. innanfor ein radius på 250m) og har såleis eit sett med artiklar som det kan lagast ei ordsky av. Skjermbildet viser ei ordsky som vert funnen i Vaskerelven og syner at ordet «STUDENT» er ganske viktig på denne staden.

Sidevegs søk

PediaCloud nyttar ikkje berre geotagga artiklar. Den finn óg WikiPedia-artiklar som på ein eller annan måte er knytt til den geotagga artiklen. Dette er mogleg sidan ein i eit sideprosjekt til WikiPedia som heiter DBpedia, lagrar ulike typar koplingar som fins mellom artiklar i WikiPedia.

Ved å følgje desse lenkene kan ein finne anna informasjon enn til dømes geografiske stader og bygningar. For eksempel kan ein finne artiklar kopla til den geotagga artikkelen om «Studentersamfunnet i Bergen» gjennom DBpedia. Ein slik artikkel omhandlar «Hans Majestet Pinnsvinet».

Når PediaCloud har funne fram alle desse artiklane (geotagga og ikkje geotagga), får orda i dei ulik vekt alt etter kor «nær» dei er deg, og så legg ein saman vektene for kvart ord og har data for ei fiks ferdig ordsky. Til kvart av orda er det og ei liste av artiklar som har brukt dette ordet, slik det viser i skjermbileta over, der brukaren altså har trykt på «STUDENT».

Om ein av artiklane er interessant for ein brukar kan den klikkast på og lesast i nettlesaren på smarttelefonen.

Brukartesting i London

Ein slik app kan vere interessant i seg sjølv, men når ein lagar ein slik app, så er ein viktig del av arbeidet å finne ut korleis ei slik teneste kan fungere for reelle brukarar. For forskaren er ikkje fokuset på sjølve appen, men på kunnskap om samspelet mellom teknologi og menneske.  Korleis responderer dei på ei lokalisert ordsky, og korleis verkar det at ein i tillegg til geotagga informasjon, presenterer assosiert informasjon?

For å finne ut meir om dette drog vi til London, der vi inviterte åtte informantar til å vandre rundt i heimbyen med denne appen i ei veke. Så intervjua vi dei grundig om kva erfaringar dei hadde gjort seg. Vårt hovudfunn er at brukarane ser på denne appen som noko heilt anna enn karttenester som GoogleMaps. Slike tenester tilrettelegg for søk etter nyttige stader som restaurantar.

Bruken av ordsky som visualiseringsteknikk vart såleis mindre nytteorientert enn kartet og meir leikande og utforskande. Dei valgte å klikke oftare på dei «rare» orda, og ved å følgje dei assosiative lenkene oppdaga dei spennande saker som dei ikkje visste om heimbyen sin.

Den engelske termen «Serendipitous Search» (søk ved lukketreff) er noko som blir brukt i informasjonsvitskapen om slike slumpaktige søkjeteknologiar, og gjev brukaren tilgang til nyttig informasjon når ein ikkje heilt veit heilt kva ein leiter etter.

Vidareutvikling for lokaljournalistikken

Går det an å bruke denne til anna enn WikiPedia-artiklar? Ja, det trur vi, og for tida prøver vi å overføre dette prinsippet til lokaljournalistikk i Bergensområdet. Det kan vere avisartiklar frå Bergens Tidende og andre medier med ganske tett lokal dekning. Då vil brukaren få tilgang til nyheiter om ein stad, og eventuelle assosierte artiklar, og kanskje bli kjent med omgjevnadane på ein anna måte enn før.

Ein del gjenstår før vi kan få dette til. Blant anna er det veldig få avisartiklar som er geotagga på det presisjonsnivået vi ønskjer, og difor må vi finne løysingar sjølve. Då vert det eit forskingsprosjekt i seg sjølv å bruke avistekstane til å finne ut kva stad dei handlar om, og kva andre assosiasjonar som er viktige i artikkelen.

Bjørnar Tessem ved Universitetet i Bergen er leiar av PediaCloud-prosjektet. Solveig Bjørnestad, Weiqin Chen og Lars Nyre bidrog i Londonstudien, medan Bjarte Johansen og Csaba Veres har deltatt i progamutviklinga.

Leave a Reply

Your email address will not be published. Required fields are marked *