Sökmotorer
Man hittar inte allt på Internet med hjälp av sökmotorer och frågan är om det ens är önskvärt. Framtidens sökmotorer kanske snarare hjälper oss att göra bra urval än att söka fram så mycket som möjligt. Här finns också ett viktigt problem att fundera över – vem bestämmer över vad sökmotorerna ska hitta??
Sökmotorer består av:
- Spindel
- Index
- Sökgränssnitt
Spindeln
söker upp och samlar in webbsidor. Spindeln kontrollerar också om sidan besökts tidigare och om innehållet är uppdaterat (ibland också hur ofta sidan uppdateras – ju fler uppdateringar ju fler spindelbesök).
Spindeln gör också kölistor på de länkar som den träffar på. De sidorna söks upp och samlas in senare.
Sökmotorernas spindelprogram har vissa begränsningar i sitt insamlande. Ibland lämnas sidor som är för djupt ner i filstrukturen och ibland begränsas spindelns insamlande när sidorna är för stora (filstorleken).
Man kan själv anmäla en ny webbsida till sökmotorerna för insamling om man inte vill vänta på att spindeln kommer. Och om man av olika skäl inte vill synas i sökmotorn kan man tala om det i en textfil (robots.txt) på webbplatsen.
Indexeringen
analyserar webbsidorna för att se vilka uppgifter från sidan som ska indexeras i databasen. Det är tex ord och fraser, metadata, filtyp, -storlek, datum för hämtning och språk. Uppgifter om på vilka webbsidor orden förekommer måste också indexeras och för avancerad sökning även var på sidan orden placerats tex i titel, brödtext, webbadress eller i länktext.
Problemet med att söka information på Internet är att den inte är strukturerad. Om man redan från början hade indexerat beskrivningar av webbsidorna på ett mer strukturerat sätt med hjälp av metadata hade det underlättat informationssökningen på Internet betydligt.
Webbplatsens titel, författare, datum, ämnesord, beskrivning, filtyp och språk är några exempel på metadata som skulle effektiviserat och förenklat sökningarna rejält.
Sökgränssnittet
är det man oftast tänker på när man pratar om sökmotorer. Det är här man ställer sin fråga genom att skriva in ett antal ord i ett sökformulär. Frågan skickas in i sökmotorns index över alla webbsidor som spindeln hämtat in till sökmotorns enorma databas. (Google har ett index på över 10 miljarder webbsidor, medan Yahoo hävdar den dubbla siffran.)
Den avancerade sökfunktionen bjuder på ett formulär som kan förenkla mer komplexa sökningar. Gå igenom den sidan lite extra för den avslöjar vilka möjligheter som finns i sökmotorn. Var uppmärksam på det som kan dölja sig bakom flikar, rullgardinsmenyer eller länkar. Det kan ofta vara specialinriktade sökfunktioner som tex sökning av bilder, grupper, kategorier, nyheter osv.
Resultatlistan
Resultatet av din sökfråga visas i en lista med träffar där du bl a kan se hur många träffar du fått, webbsidans titel och ett utdrag från sidan där du ser dina sökord i sitt sammanhang. Presentationen av sökresultatet är viktigt. Om man får tusentals svar på sin sökfråga i vilken ordning ska då träffarna sorteras? Ska de sorteras alfabetiskt eller i datumordning eller finns det andra sätt? Att sortera svaren efter någon slags rangordning är lättare sagt än gjort, för vilka faktorer ska vägas in och hur viktiga ska de anses vara?
För tillfället är sökordens förekomst och placering och hur många andra (högt rankade) webbplatser som länkar till sidan vitala faktorer för rankingalgoritmerna.
Många söktjänster försöker hitta andra sätt att presentera resultatlistan. Numer kan man få sitt sökresultat visualiserat eller klustrat och samtidigt få tips på hur man kan förbättra sina sökningar.
Hemliga algoritmer
Den algoritm som avgör hur sökmotorerna rankar webbsidorna i resultatlistan är en väl bevarad affärshemlighet. Att bli högt (högst) rankad i resultatlistan är viktigt eftersom man vet att många som söker väljer någon av de översta länkarna. Tyvärr medför inte rankingkriget att webbplatserna får bättre beskrivningar och därmed blir lättare att söka utan snarare tvärtom. Missbruk och sabotage försvårar möjligheterna att hitta rätt information.
Kritiken
mot sökmotorerna och deras maktställning ökar. Vem bestämmer över informationen och hur den ska sökas/hittas/visas? Ska algoritmen vara hemlig? Kan man köpa sig en bättre placering i resultatlistan genom annonsering? Ska man censurera sökning på vissa ord? Är de ”globala sökmotorerna” verkligen globala? Kan en sökmotor straffa ut vissa sidor? Ska regeringar få bestämma vilka ord deras medborgare inte får söka på?
– problematisera sökmotorerna och den hemliga algoritmen; vem bestämmer?
Tips och tricks
En lista på olika typer av sökmotorer finns på bibliotekets hemsida.
- Lär dig en sökmotor riktigt ordentligt.
- Använd och analysera avancerad sökning och undersök vilka specialtjänster som döljer sig bakom flikar och länkar.
- Välj ut några andra sökmotorer med bra specialfunktioner och jämför resultaten. Det är förvånansvärt liten överlappning mellan sökmotorernas täckning.
- Håll dig uppdaterad genom att regelbundet läsa en nyhetstjänst som bevakar söktjänster på Internet.
Testa själv genom att söka med samma sökord i nedanstående sökmotorer och jämför resultatlistorna:
———————————–




Så här fungerar Googles sökmotor Googlebot
Eva Norling
2005-06-21








