Otsingumootori optimeerimine - edetabel

Autor: Margo Munner | Kuupäev: 21.09.2009

Artikkel järjestab otsingutulemusi mõjutavad faktorid ning lisab lühikommentaarid.

Otsingurobot

Baasteadmised selged, nüüd veidi spetsiifilisem info Google, Yahoo! ja NETI kohta. SEOmoz publitseerib edetabelei selle kohta, mis on oluline saavutamaks head kohta otsingutulemustes. Järgnev artikkel põhineb 2007. aasta uuringul, tänaseks on SEOmoz avaldanud juba 2009. aasta andmed.

Tegemist ei ole otseselt tõlke-artikliga. Pigem lihtsalt refereeritud artikliga, millele lisatud autoripoolsed kommentaarid.

Järgneb edetabel, kus kodulehe osad on jaotatud kategooriatesse ning kus kõige olulisemad faktorid on esimesel kohal

Otsisõna (ka võtmesõna, keyword) kasutamine

1. Otsisõna tiitlis (element: title)

Otsisõna olemasolu title elemendis. Siia tuleks kirjutada dokumenti kirjeldav, kuid samas võimalikult lühike tekst, mis peaks sisaldama ka märksõnu, mille abil loodad otsingutulemustes välja tulla.

Hea tiitel on iga kodulehe dokumendi (alamlehe) jaoks unikaalne. Kui soovid kasutada dokumendi nimes ka kaubamärki või firmanime, tee seda nii, et nimi asuks unikaalse tiitli järel. Näiteks nii: „Ehitustööd: uksed ja aknad, fassaadid, katused - FirmaNimi”. Pane tähele, et eespool kirjapandud märksõna on olulisem kui teksti lõpuosa märksõna. Ei ole mingit vajadust raisata kõige olulisemat sõna ainult firmanime või kaubamärgi jaoks, kuna need on niigi tavaliselt kajastatud esilehel ja domeeninimes. Samuti on firmanimed tavaliselt unikaalsed, seega ei kipu sellega ka kliente kaotama.

Hoia title kirjeldav, sest selle elemendi abil kirja pandud tekst on ühtlasi ka see, mida näeb kasutaja otsingutulemuste lehel. Samal põhjusel ei tohiks tiitli pikkus olla rohkem kui 40 tähemärki, kuna näiteks Google „lõikab” seejärel otsingutulemuste lehel title ülejäänud osa maha.

2. Otsisõna sisuosas (element: body)

Ühe ja sama sõna korrutamine ei ole otseselt lahendus, kuid sellegipoolest peaks otsisõna olema esindatud ka sisuosas. See aitab robotil hinnata lehe konteksti ning seeläbi määrata mitte seda, kui kõrgel tuleb leht/dokument otsingutulemustes, vaid selleks, et hinnata lehe üldist usaldatavust.

NETI.ee jaoks tundub olevat ka otsisõna sagedus tekstis faktor, mis tõstab kohta otsingutulemustes, kuid kasuta siiski ettevaatlikult ning kontekstipõhiselt!

Hoidu peidetud tekstist ehk siis tekstist, mida ei näe tavakasutaja: taustavärviga ühte sulandatud tekst, CSS ja/või JavaScript abil peidetud tekst.

3. Sisuosa sõnade ja otsisõnade vaheline seos

Peamiselt Google ja sealgi tulevikumuusika. Google nimelt tegeleb teksti semantilise analüüsiga. Teisiti ümber seletatuna - Google otsib Sinu lehe üles ka siis, kui Sinu lehel on mõni termin mitmuses, aga otsija esitas päringu ainsuses jne. Soovitus siin on: ära liialda märksõnadega tekstis, ka mitte siis, kui kasutad erinevaid sõnavorme: käänded, pöörded jne.

4. Otsisõna kasutus pealkirjas (element: h1)

Arvamused lähevad suuresti lahku, kuid h1 ja teisi järgnevaid elemente on otstarbekas kasutada dokumendi korrektseks ülesehituseks. Siinne tekst võib olla identne title tekstiga, kuid võib olla ka erinev. Kindlasti tuleb jälgida, et täidetud oleksid samad nõuded, mis title puhul: unikaalne, märksõnadega ja kirjeldav tekst.

5. Otsisõna domeeninimes

Kuigi domeeninime osatähtsus on väga suur, ei ole mõistlik registreerida ühe-kahe märksõna pärast eraldi domeeninime. Domeen võiks olla kaubamärgi/ettevõtte nime kandev, niiviisi jõuaksid kõik just Sinu lehest huvitatud isikud ka alati Sinu lehele. Siiski, kui on soov kasutada domeenis ka muid märksõnu, ei tohiks neid olla rohkem kui kolm ning need peavad olema eraldatud miinus-sümboliga.

6. Otsisõna URLis tervikuna

Ehk siis URLid kujul http://www.firmanimi.ee/otsisona.html. Eksperdid soovitavad kasutada miinus-sümbolit, kuid ilmselt pole ka alakriips _ paha lahendus. Igatahes tuleb märksõnad selgelt eraldada.

Aga ka siin tuleb meeles pidada: mitmekümnest sõnast koosnevad dokumendinimed ei sobi kindlasti mitte: parim tulemus, kui märksõnade arv URLis jääb 2-4 piiresse. URL ei tohiks lohiseda ka eriti pikaks: 50 tähemärki võiks olla maksimum. Need numbrid pole absoluutsed piirarvud, kõigest suurusjärgus orienteerumiseks.

7. Otsisõna kasutus alampealkirjades (elemendid: h2, h3, h4, h5, h6)

Soovitatakse kasutada, kuid meeles tuleb pidada seda, et ainult nende elementide abil kirjapandud dokument ei aita. Otsingumootor analüüsib seda, kui suur suhteline osa tekstis on kirja pandud h2, h3, h4, h5, h6 elementide abil ning juhul, kui pealkirju on liiga palju, väheneb nende tähtsus.

8. Otsisõna kasutus piltide juures (atribuudid: title, alt)

Selge siis, et need on olulised pildiotsingute jaoks, kuid väidetavalt on võimalik seeläbi saavutada teatud juhtudel tulemus ka tekstiotsingus.

9. Rõhutatud tekst (elemendid: strong, b)

Kui rõhutatud on üksikud sõnad ning eriti kui need üksikud sõnad on sarnased tiitlis ja pealkirjas esitatutega, võib tähendus olla suur. Ei tohiks rõhutada terveid lõike ega ammuski siis kogu teksti. Seega kehtivad sarnased reeglid, mis 7. punkti juures.

10. META kirjeldus ja märksõnad (Meta Description, Meta Keywords)

Soovitatakse kasutada kui META-kirjeldused ja märksõnad vastavad konkreetse dokumendi sõnadele. St - kogu lehe jaoks ühtede ja samade märksõnade kasutamisel ei ole kindlasti mingit tulemust. Tulemus võib olla (näiteks Yahoo! otsingus), kui konkreetselt dokumendilt leitakse ka sisuosas samad märksõnad.

Lehe atribuudid

1. Viite populaarsus võrgulehe enda piires

Väga oluline otsingutulemusi mõjutav faktor on see, millisel määral on Sinu enda kodulehe erinevad dokumendid omavahel seotud - st. millisele dokumendile on rohkem viiteid ning mis on nende viidete atribuudid (tekst, tiitel jms).

Tegemist on seda parema uudisega, kuna seda saab kontrollida võrgulehe omanik ise. Just viimasel ajal on võrgulehe endasisene linkimine olnud tähtsal kohal. Pea siinkohal meeles, et viitaksid tekstis oma kodulehe teistele dokumentidele ning kindlasti vaata, mis kirjutad <a href="viide_dokumendile.html">Siia tekstiks</a>. Ära ei tasuks unustada ka title võimalust: <a href="viide_dokumendile.html" title="Viidatava dokumendi tiitel">See tekst oluline</a>. Head näited on ingliskeelse Wikipedia artiklid.

Aga vaata ette! Nii nagu Wikipedia ei viita iga kord, kui sõna kasutatakse koheselt vastavale artiklile, peaksid ka Sina kasutama antud võimalust ratsionaalselt. On arvamusi, mille järgi peaks ühe dokumendi piires kasutatav linkide arv jääma 100 piiresse. Tegelikult on veelgi olulisem see, et teksti oleks tublisti rohkem, kui linke: mitmekümne sõna kohta võiks olla viiteks tehtud vaid 1-2 sõna. Samuti ei tohiks iga dokument viidata kõigile teistele Sinu kodulehe dokumentidele (see on sisukaardi ülesanne).

2. Kodulehelt väljapoole viivate linkide kvaliteet ja sisu

Niisamuti kui on oluline see, kes viitab Sinu kodulehele, on oluline ka see, kellele viitad Sina ise. Viited dokumendi piires peaksid olema kõrgkvaliteetsetele lehtedele, mille sisu vastab Sinu poolt koostatud www-dokumendi sisule.

Seega ei tasu kirjutada oma www-dokumentidesse viiteid dokumendi teemaga mitteseonduvatele kodulehtedele. Seda tuleb jälgida nii kodulehe kui dokumendi piires. Ära viita oma kodulehelt spämm-lehtedele! Ära viita kalapüügi-teemaliselt artiklilt autoremondi foorumisse!

Google üritab sellisel viisil isegi määrata seda, millisesse „gruppi” või ringkonda koduleht kuulub. Nii üritab Google koostada näiteks Eesti poliitika teemal kirjutavate kodulehtede „ringi”. Ei hakka kommenteerima, kuidas tal see välja tuleb...

3. Dokumendi, kodulehe ja domeeni vanus

Pikk ja keeruline teema. Vanad kodulehed tervikuna (st. domeeni ja kodulehe avalikustamise vanus) saavad paremaid tulemusi, eriti kui neil on pidevalt uut sisu (st uusi dokumente). Seega: uus domeen ja uued dokumendid ei saa kõrgeid kohti. Kõrgeid kohti võivad saada vanad dokumendid üksinda (teatud juhtudel) või vanal domeenil (kodulehel) olevad uued dokumendid.

Põhimõte seisneb siis selles, et näiteks Postimees.ee on üsna kaua internetis eksisteerinud koduleht, kuid selle sisu täiendatakse (luuakse uusi dokumente) väga sageli. Seega saab Postimees.ee kindlasti üsna kõrged tulemused ka nendele artiklitele, mis on sisestatud suhteliselt hiljaaegu.

Samal ajal võivad häid tulemusi saada ka sellised dokumendid, mis paiknevad vanal domeenil ning mida pole kaua aega muudetud, täiendatud. Näiteks arhiveeritud uudised, teated jms.

Üks on aga kindel - täiesti uuel kodulehel läheb raskeks kõrgete positsioonide saavutamisega. On arvamusi, mille järgi peaks domeen ja koduleht olema vähemalt 1 aasta vanad enne, kui vastava kodulehe dokumendid otsingutulemustes kõrgemale liiguvad.

4. Indekseeritava teksti hulk

Järjekordne koht, kus SEOmoz artiklis arvamust avaldanud isikud väga erineval arvamusel on. Põhiidee on siiski selles, et midagi peab olema indekseeritavat: st. vähemalt veidi teksti peab HTML-dokumenti kirja panema isegi siis, kui dokument koosneb suuresti pildist/fotost või kui tegemist on FLASH-animatsiooni või videoga.

Eksisteerib ka arvamus, et eelistada võiks pikemaid dokumente - ära lammuta sama sisu mitmete dokumentide vahel laiali.

5. Dokumendi sisu kvaliteet

Sisu kvaliteedi hindamine on otsingurobotitele raske ülesanne, kuid seda üritatakse kindlasti teha. Google üritab isegi tuvastada seda, mis tüüpi dokumendiga on tegemist: uudis, pildi kirjeldus, kasutustingimused jne.

6. Dokumendi hierarhia ja ülesehitus

Teksti järjekord ja paiknemine lehel on siin teemaks. Lihtsaim näide seesama artikkel: algab sissejuhatusega, edasi alampealkirjad, mille vahel lõigud. Kõik see peab olema kirjas korrektsete XHTML elementide abil.

7. Dokumendi sisu värskendamine

Sarnasel teemal on juba juttu olnud. Põhiidee: domeeni ja kodulehe enda vanus on oluline, kuid häid kohti otsingutulemustes võivad saada nii regulaarselt muutuvad/täienevad üksikdokumendid, aga ka kaua aega „arhiveerituna” seisnud lehed.

8. Kaustade/kataloogide arv URLis

Ehk - kui palju kaldkriipse / on URLis. Iga kaldkriips moodustab justkui ühe kataloogi. Tegelikult on suur osa lehti üles ehitatud nii, et need kausta-tunnused on virtuaalsed (mod_rewrite).

Siinkohal tuleks meeles pidada pigem kogu kodulehe üldist struktuuri. Niisama „naljapärast” URLi sügavust juurde lisada ei tasuks, aga kui vaja, siis pigem hea ülesehitusega leht. Teoorias soovitatakse 2-4 kataloogi võrra sügavale minekut.

9. Korrektne grammatika

Õigekiri on oluline selleks, et kõik kasutajad oskaksid otsida just sellist sõna, mis Sinu lehel leidub. Kui kasutad „oma väljamõeldud” ja vähelevinud väljendeid, siis pole ju lootust, et keegi neid üldse otsib. Otsingutulemustes tulevad välja ka valesti kirjutatud sõnad, aga - kes nendeni jõuab?

Muidugi - näiteks NETI.ee otsingus on sõna „anektoodid” sagedamini otsitud termin kui õigekirja-versioon „anekdoodid”. Sellegipoolest tasuks kasutada õigekirja - aitab hoida keele normis ning ka otsijatel vähem tööd.

10. HTML/XHTML korrektsus

HTMLi korrektsus pole otsingusüsteemide jaoks oluline! Seda sellepärast, et otsingumootorite huvides on, et leitaks üles soovitud sisu, tehniline korrektsus jäetakse kõrvale.

Sellegipoolest on mitmeid põhjuseid, miks kasutada korrektset, st. valideeruvat XHTML-koodi. Otsingumootoritega seoses tooks välja asjaolu, et lehe juures ei tohiks elemente „raisata” - st. kasutada tuleb minimaalset hulka märgendeid (et mitte ajada otsingumootorit segadusse). Teine asjaolu seisneb kasutajate poolelt: kui kasutaja leiab Sinu mittekorrektse ja kehvasti kuvatava kodulehe üles, kuid lehe vead ei võimalda tal oma lemmikvõrgulehitsejaga sisule ligipääsu, oled kaotanud kasutaja.

Domeeni atribuudid

1. Domeenile suunatud viidete kogum

Varem sai selgitatud, et oluline on dokumendile tehtavad viited, siis siinkohal on tegemist kogu kodulehe (domeeni) populaarsusega. See populaarsus kujuneb kõigist Sinu kodulehele tehtud viidetest. Ehk - kui Sinu kodulehel on mõned väga populaarsed dokumendid, siis need üksikud populaarsed dokumendid tõstavad ka vähempopulaarsemate dokumentide positsiooni otsingutulemustes.

Oluline on meeles pidada, et domeenid ja alamdomeenid on eraldiseisvad ning luues palju alamdomeene, jaotad oma kodulehe-populaarsuse kõigi alamdomeenide vahel. Seega - hoia alamdomeenide arv miinimumi lähedal.

2. Kodulehe vanus

Silmas peetakse seda, kunasest on olnud võimalik pääseda ligi kodulehe sisule. See ei ole aeg alates domeeni registreerimist, vaid alates sellest, kuna otsingurobot lehe üles leidis. Oluline on ka meeles pidada, et see vanus nullitakse ära, kui võrgulehe sisu mõnda aega pole kättesaadav või kui sisu muutub väga suurel määral (st. kodulehe temaatika muutub).

Üks teooria väidab, et vanuse osatähtsus otsingutulemuste seas järgib kõverat, kus väga uued lehed (vähem kui aasta vanad) ei saavuta kõrgeid kohti. Samas on kuskil „murdumispunkt”, millest alates pole kodulehe vanusel enam tähtsust. Näiteks ei pruugi 15 aastat vana leht saavutada olulist eelist 10-aastase kodulehe ees. Pole aga teada, mis see „murdumispunkt” on.

3. Domeenile viitavate dokumentide sisu

Varem mainitud, kuid siis veelkord rõhutada: oluline on ka see, millist sisu edastavad need võrgulehed, mis Sinu kodulehele viitavad.

4. Teemaringi võrgulehtede tähtsus

Põhiliselt spämmivastane teema. Kui Sinu kodulehele viitajad on sarnase või seotud teemaga võrgulehed, mis Sinu oma, oled võitja. Kui vastupidi - Sinule viitavad täiesti kontekstivälised võrgulehed, oled kaotaja.

5. Populaarsus samateemaliste võrgulehtede seas

Eelmise jätkuks - parim olukord on siis, kui samateemaliste võrgulehtede seas on Sinu leht kõige populaarsem. Seda positsiooni on raske saavutada, võtab kaua aega ning nõuab palju tööd loomaks kvaliteetset sisu.

6. Sinu lehele viitamise kiirus/sagedus

Uus võrguleht võib tõusta kiirelt kõrgele positsioonile, kui väga lühikese aja jooksul viitavad võrgulehele suur hulk lehti. Näiteks tahavad ka otsingud oma kasutajatele võimaldada osavõttu mitmetest kampaaniatest enne, kui kampaania läbi saab. Vanemate võrgulehtede puhul pole nii oluline.

7. Võrgulehe põhiteema ja selle kokkulangevus otsingupäringuga

Taaskord teema, mida üritab rakendada eelkõige Google. Erandiks on kõiksugu uudistelehed või laia teemaderingi käsitlevad võrgukeskkonnad nagu Wikipedia.

8. Võrgulehe vastu ülesnäidatud huvi

Vähemalt teatud tasemeni teeb Google ka sellist statistikat, mis näitab, kuipalju klõpsatakse otsitulemustes mingile konkreetsele viitele, kaua viibitakse kodulehel jne. Pole teada, kas seda tehakse ainult läbi otsikeskkonna või kasutab Google ka oma mitmeid lisateenuseid luuramaks kasutajate järel. Näiteks Toolbar, Analytics jms.

9. Inimtööjõu poolt tehtud korrektuurid

Välis-otsingute puhul ei ole kindel see, kas näiteks Google või Yahoo! töötajad aeg-ajalt sekkuvad mõne võrgulehe PageRank määramisse. Ilmselt aeg-ajalt seda tehakse, kindlasti on olemas nn. blacklist'id, kust maha saab võrgulehti võtta ainult inimese otsusel.

NETI.ee puhul on olukord juba teine. Kuna NETI.ee on korraga nii kataloog kui otsingumootor, kasutab NETI otsing kindlasti ka inimestepoolt toimetatud kataloogi andmeid. Otsi NETI kataloogist mõni viide ja vaata selle viite kirjeldust. Pane kirjeldus otsingusse ning kindlasti tuleb kataloogis olev viide välja kõrgemal kohal, kui sama märksõna omav, kuid kataloogis mitteeksisteeriv võrguleht. Kui kataloogis on sama kirjeldusega viiteid rohkem kui üks, tulevad kõik, mis on kataloogis olemas, välja omaette „kategooriana”: st. enne jagatakse järjekorda kataloogis olevad viited, alles siis kõik ülejäänud.

10. Tipp-taseme domeen ja selle populaarsus

Väidetavalt on oluline ka tipp-taseme domeen. Nii saavat .org lõpulised võrgulehed paremaid positsioone kui näiteks .com võrgulehed, millest omakorda veel madalamal tulevad välja samasisulised .info domeenid.

Ilmselt on oodata selle faktori osakaalu vähenemist või täielikku kadumist. Esimene põhjus seisneb selles, et tegelikult ei tähenda domeenilõpp mitte midagi: ka eraisik võib registreerida .org domeeni, kuigi see oleks justkui ette nähtud mittetulunduslikele organisatsioonidele. Samuti peaks .com domeeni all olema kõik kommerts-lehed, kui tihti leiab sealt ka mittetulundusühinguid ja eraisikute kodulehti.

Alates 2009. aasta kevadest on võimalik tipp-taseme domeene osta kõigil, kellel on piisavalt raha. Seetõttu ei ole enam võimalik sedagi eristamist sooritada, mis seniajani olemas oli.

11. Uute dokumentide lisamissagedus

Uute dokumentide (sisulehed, uudised, teated jne) lisamise sagedust ei peeta väga oluliseks. Siiski tuleks mainida asjaolu, et mida rohkem on erinevaid dokumente, seda suurem on tõenäosus tulla otsingus välja ka mõningate väga spetsiifiliste otsifraasidega. Seega - palju heakvaliteedilist, mittedubleerivat sisu on alati positiivne nähtus.

12. Otsepäringute koguarv

Kui palju tehakse päringuid otse Sinu kodulehele, kasutades kas domeeninime, kaubamärki või firmanime. Ilmselt on siikohal siis oluline see, et otsepäringud saaksid vastatud. Teiste märksõnade puhul otsingutulemuste seast väljapaistmisele see mõju ei avalda.

13. Google Webmaster Tools kasutamine

Otsingutulemuste reastamisel ei ole mingit tähtsust sellel, kas võrgulehe omanik kasutab Google Webmaster Tools keskkonda. Selle rakenduse kasutamine võib aidata oma lehte optimeerida jms, kuid ei mõjuta otsingutulemusi.

Võrgulehele viitamine

1. Viite-tekst

Viite (ehk ankru, anchor) teksti peetakse jätkuvalt kõige olulisemaks faktoriks, võibolla isegi veel olulisemaks, kui kõik varemnimetatu.

Ehk siis - on oluline, et Sinule viitavatel võrgulehtedel oleks <a href="http://www.domeen.ee/dokument.html">see tekst siin</a> dokumendi sisu kirjeldav, isegi dokumendi tiitliga sarnane/identne.

2. Kodulehele viitava võrgulehe enda populaarsus

Lihtne kirjutada, raske saavutada: vaja on viiteid Sinu kodulehele väga usaldusväärsetelt, teemaga seotud kodulehtedelt.

3. Kodulehele viitava võrgulehe sisu

Eelmise punkti juures sai juba mainitud - oluline on saada viiteid teemaga seotud kodulehtedelt ja/või dokumentidelt.

4. Viite vanus

Eeldatavasti on kaua-eksisteerinud viite mõju otsingutulemustele suurem, kui äasjatehtud viidetel. Raske siiski hinnata.

5. Viite ümber olev tekst

Sellega tuuakse välja mitmeid kurioosseid seiku. Põhiline asi meeles pidada on see, et linki ümbritseval tekstil on suurem tähtsus juhul kui viite enda tekst on stiilis klõpsa siin. Siiski soovitan - ära tee kunagi selliseid viiteid/linke!

Negatiivsed asjaolud!

Järgneb lihtne loetelu sellest, mis mõjutavad otsingutulemusi negatiivselt ning mida ei tohiks teha, kui on soov tulla välja kõrgel otsingutulemuste seas.

Negatiivsed faktorid on:

  1. server pole tihtipeale kättesaadav;
  2. sisu väga sarnane või lausa identne juba indeksis olemasolevaga;
  3. viitamine spämm-lehtedele;
  4. sama tiitel ja META-märksõnad mitmetel või kõikidel dokumentidel;
  5. märksõnade sagedusega liialdamine;
  6. osalemine lingivahetuskampaaniates või viidete ostmine;
  7. väga aeglane serveri vastamine ja lehelaadimine;
  8. viited spämm-lehtedelt.

Kommentaarid, arvamused, küsimused

Postitaja nimi:

Kommentaari pealkiri:

Kommentaari sisu:

Kontrollküsimus (loe selgitust kõrvalt)!

Vasta küsimusele: Mis värvi on taevas siis, kui seal ühtegi pilve ei ole?

Teadmiseks kommenteerijale!

Edukaks postitamiseks tuleb täita kõik väljad. Maksimaalne sisuosa pikkus on 10'000 tähemärki, teistel väljadel 200 tähemärki!

Kommentaari sisuosas saab kasutada HTML koodi, kuid seda mitte tekstitöötluseks, vaid näitliku materjali sisestamiseks. Kõik, mis asub <nende märkide vahel> kuvatakse kommentaarilehel nähtava tekstina ning märgid ise tõlgitakse erimärkideks!

Kontrollküsimus on mõeldud kuritahtlike robotite takistamiseks. Palun vasta esitatud küsimusele eesti keeles läbivalt väikeste tähtedega, nimetavas käändes ning võimalikult konkreetselt!

NB! RSS-lugemistarkvara abil kommentaare postitada ei saa!

© Margo Munner | Sisukaart