Forside » Klean weblog - om bedre websites » Semantic web - vil vi kende det, når vi ser det?

Semantic web - vil vi kende det, når vi ser det?

Semantic Web startede sit liv som ide til en løsning på et problem, som ikke var der endnu. Det er så ankommet i mellemtiden, og nu arbejder mange gode kræfter på at gøre ide til virkelighed.

Semantic web er en del af den oprindelige vision bag nettet. Det går ud på, at når mængden af indhold på det bliver omfattenede (og uoverskueligt) nok, så skal der udvikles en ramme, hvor informationerne så at sig "selv kan finde frem" til dér, hvor de kan bruges.

Det skal selvfølgelige ikke forstås på den måde, at informationerne pludselig skal have deres eget liv. Det handler mere om, at de skal udformes på en måde, som gør det muligt at slippe stumper af software løs på dem, som så automatisk kæder relevante informationer sammen på kryds og på tværs i forhold til de sammenhænge, de skal bruges i.

Alle er enige om, at tiden ér ved at være moden til semantic web. Mængden af informationer på nettet er nu både uhyre omfattende og aldeles uoverskuelige. Så nu må løsningen altså godt indfinde sig. Og der er mange bud på, hvordan det skal gå for sig. Så mange, faktisk, at der endnu ikke har vist sig nogen klare svar.

Det korte af det lang omkring semantic web er, at det handler om faceteret informationsfremsøgning. Det stiller helt nye krav til alle dele:

  • Den data, der skal søges i. "Siden" og "Dokumentet" er ved at miste mening, fordi de simpelthen er for sammensatte. Informationerne skal granuleres meget finere for at kunne netværke på en måde, der giver mening. Der snakkes meget om RDF i denne sammenhæng.
  • Selve fremsøgningen. De teknologier, der skal håndtere processeringen af al den her data, er stadig under udvikling. Både hardware- og softwaremæssigt. Det er stadig ingen smal sag at håndtere Terabytes af informationer i realtime.
  • Visningen. Vi vil vide, at denne komplicerede omstilling er på vej, den dag hvor søgeresultatet indeholder dét, der får os til at udbrydde "nå ja, det var jo dét jeg skulle finde!", selv om det ikke var det, vi lavede en søgning på. Designet er lykkes, når det sker på en overskuelig måde. F.eks. er det ikke sikkert, at vi overhovedet opdager, at vi faktisk har foretaget en søgning.

 

Online Information 2009 sagde Wendy Hall i går, at www ser ud til at have udviklet sig i 5-års-"sektioner":

  • Indtil 1999 var man glad for hvad end man kunne finde på det.
  • Indtil 2004 håbede man at kunne finde det, man ledte efter
  • Nu, i 2009, forventer vi at kunne finde det, vi leder efter i en grad, så vi mener, det ikke findes, hvis vi ikke kan.

 

Hvad siger vi i 2014, når vi står og ser tilbage på de kommende fem år? På den anden side af løsningen på de udfordringen, som semantic web-tankegangen er løsningen på, ligger… hvad? Web of linked data? Web of facts? Web… 3.0? Og er det nu?

 
 
 

Kommentarer: 5

Det semantiske web åbner også op for meget mere relevans og effektivitet i reklame og markedsføring. Se fx David Crystals forskning i linguistiske analyser fra New Media Days sidste år

Semantikken er jo bare ikke løsningen i sig selv. En tildeling af “google juice” og andre relevansprincipper er vel også nødvendig for ikke at drukne i sætninger som semantisk omhandler det efterspurgte.

Det bliver i hvert fald super spændende at følge.

Skrevet af Kasper Kristensen 2. december, 2009 kl. 12:06

God pointe.

Et af de “gennembrud” jeg fornemmer her er faktisk præcist dét, at man efterhånden har erkendt, at semantikken ikke kan stå alene. Eller i hvert fald ikke har nogen værdi (faktisk; er kontraproduktiv), hvis ikke der tænkes dynamik med ind i billedet.

Jeg har en post i ærmet om forskellige “lejre” i diskussionen.

Skrevet af Jens Winther Kristensen 2. december, 2009 kl. 13:18

Så vil jeg da også lige være en lejt ;-P Har talt en del om det sematiske web med kollegerne for nylig, og er er på ingen måde blevet enige om noget som helst… Jeg er selv af den opfattelse, af semantisk web i alt fald ikke længere er lig med web 3.0, da vi som beskrevet allerede er en del af vejen.

Spørgsmålet er om ikke vi er forbi at kunne kategorisere nettet i bølger af nogen art, web 2.0, 5-års perioder eller andet? Web Squared er naturligvis også et bud, men det er igen med fokus på nogle andre parametre.

Hvis sematisk web bare skal forstås som et net, som er “sig selv bevidst”, så synes jeg på sin vis mange af Googles søgetjenester viser eksempler nu. Maps på iPhone er et simpelt eksempel, og “location aware” apps er måske en vej ind i det semantiske?

Skrevet af Daniel 2. december, 2009 kl. 21:50

Jeg ser også, at vi egentlig ér der på flere områder i dag. Meget af det, der snakkes om her er “bare” Mashup XXL.

Det mange er oppe at ringe over er, at ti-øre også begynder at falde for nogle af de helt store dataleverandører, som f.eks. det offentlige.

Her i England er der en massiv indsats i gang for at få alle mulige offentlige oplysninger gjort tilgængelige online med det formål, at folk skal finde nye måder at bruge dem på.

Og det kan de slet ikke få armene ned over :-)

Skrevet af Jens Winther Kristensen 3. december, 2009 kl. 10:39

Daniel, den gængse forståelse af begrebet ‘semantisk web’ er vist ret klar – det drejer sig om 1) at beskrive betydning (semantik) i et maskinlæsbart format (f.eks. RDF), fremfor blot i et menneskelæsbart format (f.eks. teksten på en webside), og 2) at gøre det ved brug af entydige/kontekst-uafhængige ontologier/begrebs-systemer.

For at give et eksempel på 2) først vil det sige at jeg ikke bare kan bruge løse begreber som “bil” og “cykel”, men må udtrykke mig helt utvetydigt ved f.eks. at tale om “http://anders.feder.dk/bil” og “http://anders.feder.dk/cykel”, hvor disse to adresser ikke henviser til websider, men til klart afgrænsede begreber. Det gør at modtageren kan være sikker på hvad jeg taler om, i modsætning til hvis jeg bare talte om tvetydige ting som “biler” (lastbiler? lejetøjsbiler?) og “cykler” (ethjulede cykler? motorcykler?).

Den anden del, benævnt 1) ovenfor, er så at udtrykke informationer vha. disse begreber i et maskinlæsbart format – hvadenten det er RDF/XML, Microformats eller sågar gammeldags XML.

Det afgørende er blot at begge kriterier (maskinlæsbarhed og entydighed) er opfyldt samtidig.

Derfor kan jeg ikke se noget iboende semantisk i “location aware” apps. Jeg kan søge på “cafe” i Google Maps på min Android-telefon, og få en liste over steder i nærheden der er “relevante” tilbage fra serveren. Men begrebet “relevans” er uhyre tvetydigt. Jeg har absolut ingen anelse om hvad det vil sige, andet end at det er noget Google’s famøse PageRank-algoritme definerer, hvilket i sig selv er tvetydigt, da jeg ikke ved hvordan PageRank-algoritmen fungerer. Konklusionen må derfor være at Google Maps ikke er semantisk, selvom den er “location aware”.

Havde applikationen i stedet returneret en liste over steder i nærheden der “serverer kaffe”, og “serverer kaffe” var entydigt defineret, så havde sagen været en anden. Så ville jeg nemlig have kunnet sammenkøre listen med viden omkring begrebet “serverer kaffe” fra andre kilder – og det er deri styrken i det semantiske web ligger.

Fuldstændig entydighed er nok en utopi, men man kan stræbe efter det, og det er det man gør i det semantiske web – til forskel fra det gamle, “usemantiske” web.

Lur mig om det ikke også er derfor at Google ikke har været hurtigere på aftrækkeren mht. til det semantiske web. Hele deres forretning er jo bygget op omkring deres super-tvetydige proprietære PageRank-relevans-begreb. Hvis de gjorde det praktisk for folk at finde entydige informationer på det semantiske web, så ville PageRank-relevans-begrebet – og derved hele deres forretning – blive overflødig.

Men det skal nok komme. Det semantiske web oser alt for meget af “den rigtige måde at gøre tingene på” til at forblive vaporware – uanset hvor meget den gamle garde stritter imod.

Skrevet af Anders Feder 13. december, 2009 kl. 2:47

Skriv din kommentar...

Kommentar:

Navn:

E-mail:

Hjemmeside:

1. Tryk Preview for at gennemse din kommentar.
2. Tryk herefter Gem for at publicere den.