Léarscáil an láithreáin XML: an cód rúnda chun innéacsú rathúil
Beannachtaí do gach gairmí AGUS díograiseoir SINSEARACH! Labhróimid inniu faoi uirlis thábhachtach, an léarscáil láithreáin XML, ar féidir leis, nuair a úsáidtear i gceart é, do rangú innill chuardaigh a fheabhsú go mór. Ciallaíonn sé seo nach féidir linn neamhaird a dhéanamh air. Mar sin, tosaímid!
Is uirlis shimplí iad léarscáileanna suímh do stiúrthóirí gréasáin a chuidíonn le hinnill chuardaigh struchtúr agus tábhacht leathanaigh ar shuíomh gréasáin a thuiscint níos fearr. Is é bunús léarscáil an láithreáin comhad XML a liostaíonn Urlanna, mar aon le sonraí breise amhail dáta an nuashonraithe dheireanaigh, minicíocht na n-athruithe, agus leibhéal tosaíochta i gcoibhneas le leathanaigh eile ar an láithreán. Cuidíonn an fhaisnéis seo le hinnill chuardaigh gach leathanach ar an láithreán a chraobháil go héifeachtach agus innéacsú cliste a sholáthar. NÍL léarscáileanna suímh XML beartaithe do dhaoine, ach do robots innill chuardaigh amháin.
Stair an chruthaithe
I laethanta tosaigh an Idirlín, rinne innill chuardaigh láithreáin ghréasáin a innéacsú trí robots a thrasnaigh gach leathanach trí naisc. Mar gheall ar an líon suíomhanna gréasáin atá ag fás i gcónaí ar an Idirlíon ba thasc an-dian ar acmhainní é leathanaigh nua a aimsiú d ‘ innill chuardaigh, agus an fhéidearthacht ann nach bhfaighfeadh an bot roinnt leathanaigh thábhachtacha amach. Ag an bpointe seo, tháinig an smaoineamh chun cinn go bhféadfadh stiúrthóirí gréasáin innill chuardaigh a chur ar an eolas i bhformáid atá inléite ag meaisín faoi liosta na leathanach ar a suíomh. Mar sin, rugadh an tionscadal Sitemaps.
Ar 2 meitheamh, 2005, D ‘ fhógair Stiúrthóir Teicniúil Google, Shiva Shivakumar, i blog post:
“Táimid ag déanamh turgnamh ar a dtugtar Google Sitemaps, a theipfidh nó a sháróidh ár n-aislingí is fiáine agus a dhéanfaidh An Tidirlíon níos fearr do stiúrthóirí gréasáin agus d’ úsáideoirí araon. Is leagan béite é de “éiceachóras” a chabhróidh le stiúrthóirí gréasáin aghaidh a thabhairt ar dhá thasc reatha: google a chur ar an eolas faoi do leathanaigh ghréasáin nó nuashonruithe nua go léir, agus clúdach do leathanaigh ghréasáin in innéacs Google a mhéadú.”
Ar 16 Samhain, 2006, Google, Yahoo!, Agus D ‘ fhógair Microsoft a dtacaíocht chomhpháirteach Do Léarscáileanna Suímh 0.90. Mar a leag Tim Mayer béim Air, Stiúrthóir Sinsearach Bainistíochta Táirgí Do Yahoo Search:
“Tá seoladh Léarscáileanna Suímh tábhachtach mar tugann sé deis do láithreáin ghréasáin bealach aontaithe simplí a úsáid chun ábhar agus meiteashonraí a sholáthar d’ innill chuardaigh.”
“Cuidíonn léarscáileanna suímh le stiúrthóirí gréasáin ábhar a thaispeáint a bhíonn deacair de ghnáth do scanóirí a fháil amach, ag soláthar eispéireas cuardaigh níos cuimsithí d’ úsáideoirí.”
Tá an leagan Seo De Léarscáileanna Suímh fós ábhartha inniu.
An 11 aibreán, 2007, Ask.com Google, Microsoft Live Search, Agus Yahoo! d ‘ fhógair siad a dtacaíocht chun comhaid Léarscáil An Láithreáin a fhionnadh go huathoibríoch ag baint úsáide as na robots.txt file.
An 13 Bealtaine, 2023, D ‘ fhógair Bing go gcuirfí deireadh leis an gcumas léarscáil láithreáin a chur isteach gan ainm trí iarratas HTTP. Ar 26 meitheamh, 2023, chuir Google An ghné seo ar ceal freisin. Sa dá chás, dúradh go raibh spammers ag mí-úsáid na gné seo.
Cad iad na cásanna ina bhfuil comhad Léarscáil An Láithreáin riachtanach?
De réir dhoiciméadú oifigiúil Google, tá Léarscáil An Láithreáin riachtanach i dtrí chás:
● Má tá suíomh gréasáin mór agat (níos mó ná 500 leathanach);
● Má tá an suíomh gréasáin nua agus / nó má tá fadhbanna aige le nasc inmheánach agus/nó mais nasc;
● Má tá An suíomh gréasáin le Feiceáil I Google News nó má tá a lán ábhar ilmheán ann.
Taispeánann cleachtas, áfach, nach bhfuil aon ráthaíochtaí ann go bhfaighidh robot gach leathanach de shuíomh gréasáin gan comhad Léarscáil An Láithreáin. Ina theannta sin, má tá comhad Léarscáil An Láithreáin agat is fusa don róbat faisnéis a fháil faoi athruithe a dhéantar ar an suíomh gréasáin. Dá bhrí sin, molaimid léarscáil XML a chur le haon suíomh gréasáin: ní ghortóidh sé ar aon chuma.
Struchtúr Léarscáil An Láithreáin
Ba cheart an comhad Léarscáil An Láithreáin a chruthú in ionchódú UTF-8. In ionad carachtair &, ‘, “, >, <, ba chóir a gcuid maisc a úsáid. Ní hionann ord Na Urlanna sa chomhad Léarscáil An Láithreáin d ‘ innill chuardaigh.
Féadfaidh clibeanna XML a bheith ar an léarscáil láithreáin:
● urlset;
● url;
● loc;
● lastmod;
● changefreq;
● tosaíocht.
Breathnaímid orthu níos mionsonraithe.
Clibeanna riachtanacha:
● sainmhíníonn urlset an t-ainmspás (caighdeán prótacail).
● is é url an chlib tuismitheora do gach iontráil.
● is clib linbh é loc don url agus tá URL iomlán an leathanaigh ann (lena n-áirítear réimír an phrótacail). Sonraíonn sé an leathanach reatha a ndéanfaidh clibeanna roghnacha cur síos air. Níor chóir go mbeadh ábhar an chlib seo níos mó ná 2048 carachtar.
Clibeanna roghnacha:
● is clib linbh é lastmod le haghaidh url agus tá dáta an mhodhnaithe dheireanaigh ar an leathanach reatha i bhformáid W3c Datetime. Is minic a úsáidtear an dáta san fhormáid ghiorraithe BBBB-MM-DD.
● is clib linbh é changefreq le haghaidh url agus déanann sé cur síos ar mhinicíocht ionchasach na n-athruithe ar an leathanach reatha. Féadfaidh sé na luachanna seo a leanas a ghlacadh:
– i gcónaí;
– in aghaidh na huaire;
– laethúil;
– seachtainiúil;
– míosúil;
– bliantúil;
– riamh.
Is clib linbh é an chlib tosaíochta don chlib url agus déantar cur síos ann ar thosaíocht choibhneasta an leathanaigh reatha ar an suíomh gréasáin, idir 0 agus 1. Socraítear an tosaíocht maidir le leathanaigh eile ar an suíomh céanna. Is é 0.5 tosaíocht réamhshocraithe leathanaigh.
Sampla de léarscáil an láithreáin:
<<br />
<?leagan xml= ” 1.0 “ionchódú=” UTF-8″?><br />
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ > <br />
<url><br />
<loc>https://www.example.com / < / loc><br />
<lastmod>2023-10-04</lastmod><br />
<changefreq>seachtainiúil</changefreq>
<tosaíocht>1< / tosaíocht>
< / url><br />
<url><br />
<loc>https://www.example.com/page.html< / loc><br />
<lastmod>2023-10-04</lastmod><br />
<changefreq>seachtainiúil</changefreq>
<tosaíocht>0.8< / tosaíocht>
< / url><br />
< / urlset><br />
Comhad Innéacs Léarscáil An Láithreáin
Tá dhá theorainn ann maidir le comhaid léarscáil an láithreáin. Caithfidh gach comhad:
1. Níl Níos mó ná 50,000 Url ann.
2. Bíodh méid nach mó ná 52,428,800 beart agat.
Má sháraíonn an léarscáil láithreáin na teorainneacha seo, is gá comhaid iolracha léarscáil an láithreáin a chruthú. Caithfear gach comhad a lua sa chomhad innéacs. Innéacs comhaid léarscáil an láithreáin freisin
ní féidir naisc a bheith ann le níos mó ná 50,000 comhad léarscáil an láithreáin, agus níor chóir go mbeadh a méid níos mó ná 52,428,800 beart.
I Google Search Console, tá teorannú ann: ní féidir leat níos mó ná 500 comhad innéacs Léarscáil An Láithreáin a sholáthar do gach ceann de do láithreáin ghréasáin.
Is féidir na clibeanna XML seo a leanas a bheith sa chomhad innéacs Léarscáil An Láithreáin:
● sitemapindex;
● léarscáil an láithreáin;
● loc;
● lastmod.
*Is é an clib sitemapindex an tuismitheoir don chrann XML ar fad.
*Is é an chlib léarscáil an láithreáin an tuismitheoir do gach iontráil.
* Is clib linbh é an chlib loc le haghaidh léarscáil an láithreáin agus tá URL iomlán an leathanaigh ann (lena n-áirítear réimír an phrótacail). Ní féidir níos mó ná 50,000 clib loc a bheith sa chomhad innéacs Léarscáil An Láithreáin.
*Tá an chlib lastmod roghnach agus is clib linbh é le haghaidh léarscáil an láithreáin. Tá an dáta modhnaithe deireanach den chomhad Comhfhreagrach Léarscáil An Láithreáin ann I bhformáid W3c Datetime. Is minic a úsáidtear an dáta san fhormáid ghiorraithe BBBB-MM-DD.
Sampla De Chomhad Innéacs
<<br />
<?leagan xml= ” 1.0 “ionchódú=” UTF-8″?><br />
<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ > <br />
<léarscáil an tsuímh><br />
<loc>https://www.example.com/sitemap1.xml< / loc><br />
<lastmod>2023-10-04</lastmod><br />
< / léarscáil an tsuímh><br />
<léarscáil an tsuímh><br />
<loc>https://www.example.com/sitemap2.xml< / loc><br />
<lastmod>2023-10-04</lastmod><br />
< / léarscáil an tsuímh><br />
< / sitemapindex><br />
Síneadh Prótacal Sitemaps
Tá an deis ann an prótacal Léarscáileanna Suímh a leathnú le hainmspás saincheaptha trína shonrú san eilimint fhréamh.
Conas innill chuardaigh a chur ar an eolas faoi shuíomh léarscáil an láithreáin
Tá trí bhealach ann chun innill chuardaigh a chur ar an eolas faoi shuíomh do chomhad léarscáil an láithreáin:
1. Tríd an bpainéal uirlisí stiúrthóir gréasáin,
2. Trí robotscomhad txt,
3. Trí iarratas HTTP a úsáid (ní mholtar an modh seo).
Ní féidir an comhad Léarscáil An Láithreáin a sheoladh trí phainéal uirlisí stiúrthóir gréasáin Google ach amháin
tá cearta úinéireachta agat ar an acmhainn. Chun an comhad a chur leis, ní mór duit an
Leathanach tuairisce léarscáil an láithreáin, roghnaigh an acmhainn, agus CUIR URL an chomhaid Léarscáil An Láithreáin leis. Moltar a sheiceáil an bhfuil rochtain Ag Google ar an gcomhad Léarscáil An Láithreáin roimh ré.
Seo físeán athbhreithnithe Ó Google:
“Léarscáileanna suímh i Gconsól Cuardaigh-Oiliúint Google Search Console”
Seol an comhad Léarscáil An Láithreáin trí phainéal uirlisí stiúrthóir gréasáin Bing.
Tabhair faoi deara nach féidir leat ach léarscáil láithreáin a chur isteach do shuíomh roghnaithe ó liosta na suíomhanna fíoraithe.
Chun an comhad Léarscáil An Láithreáin a sheoladh Chuig Baidu, bain úsáid as Uirlisí Stiúrthóir Gréasáin Baidu Ziyuan. Ní féidir ach suíomhanna gréasáin ardchaighdeáin a chomhlíonann reachtaíocht na Síne, a bhfuil leathanach amháin ar a laghad acu I Sínis simplithe, agus a bhfuil fíorú rite acu léarscáil an láithreáin a chur faoi Bhráid Baidu.
Úsáideann Yahoo agus Duckduckgo córas inmheánach Bing chun léarscáileanna suímh a aisghabháil agus Urlanna a fháil amach.
Chun innill chuardaigh a chur ar an eolas faoi shuíomh an léarscáil láithreáin, ní mór duit an treoir seo a leanas a chur leis na robots.comhad txt:
Sitemap: https://www.example.com/sitemap.xml
Anseo, in ionad www.example.com, cuireann tú fearann do shuíomh leis, agus in ionad léarscáil an láithreáin.xml, suíomh léarscáil an láithreáin.
Tá an modh chun léarscáil láithreáin a chur leis trí iarratas HTTP as dáta. Scoir sé de bheith éifeachtach I Bing amhail An 13 Bealtaine, 2023, agus In Google amhail an 26 meitheamh, 2023. Is é an chúis is mó leis an modh seo chun faisnéis léarscáil an láithreáin a chur ar ceal ná turscar. Ba chosúil gur smaoineamh maith é script a chur ar bun a sheolfadh do léarscáil láithreáin go huathoibríoch ag baint úsáide as an bprótacal http go laethúil (nó tar éis gach athraithe). Maidir Le Google, d ‘ fhéach an teaghrán seolta mar seo:
http://www.google.com/ping?sitemap=https://www.example.com/sitemap.xml
De réir mar a tháinig méadú ar líon na suíomhanna gréasáin, d ‘ fhás an t-ualach ar fhreastalaithe innill chuardaigh go suntasach, agus rinneadh cinneadh an cineál seo faisnéise a thréigean faoi shuíomh an léarscáil láithreáin.
Léarscáil an láithreáin Agus Google
In Google, ní chuirtear na heilimintí changefreq agus tosaíochta a shonraítear sa chomhad Léarscáil An Láithreáin san áireamh agus an láithreán á innéacsú. Níl an eilimint changefreq, a thaispeánann cé chomh minic a athraíonn ábhar leathanaigh, ábhartha nuair a bhíonn eilimint lastmod ann a léiríonn dáta an mhodhnú leathanaigh dheireanaigh. Agus tá an ghné tosaíochta, a ghlacann le tosaíocht an leathanaigh a chinneadh, suibiachtúil agus ní léiríonn sí go cruinn fíor-thábhacht an leathanaigh i gcomparáid le leathanaigh eile ar an láithreán.
Tá sé tábhachtach a mheabhrú go gcuireann Googlebot an tréith lastmod san áireamh agus leathanaigh á scanadh, ach má shocraíonn tú luach mícheart dó, ní chuirfear san áireamh é sa todhchaí. Níl aon ról ag líon na gcomhad Léarscáil An Láithreáin san innéacsú: ar Thaobh Google, déantar gach comhad Léarscáil An Láithreáin a chumasc, Agus déantar Urlanna uathu a phróiseáil le chéile, beag beann ar líon na gcomhad a chuir tú ar fáil.
Tacaíonn Google le ceithre bhealach chun faisnéis bhreise a sholáthar sa chomhad Léarscáil An Láithreáin:
1. Leathnaigh Urlanna chun comhaid ghrafacha a áireamh,
2. Leathnaigh Urlanna chun comhaid físe a áireamh,
3. Cuir faisnéis faoi theangacha éagsúla nó leaganacha áitiúla de leathanaigh san áireamh agus an tréith hreflang á úsáid agat
4. Maidir le suíomhanna nuachta, is féidir Cineál speisialta Léarscáil Láithreáin a úsáid chun faisnéis a sholáthar faoi na nuashonruithe is déanaí.
Léarscáil an láithreáin agus Bing
Deir Príomhbhainisteoir chlár giniúna innéacs Bing, Fabrice Canel:
“Ceann de na príomhstraitéisí maidir le barrfheabhsú inneall cuardaigh (SEO) suíomhanna gréasáin is ea léarscáileanna suímh ar ardchaighdeán a chuidíonn le hinnill chuardaigh gach ábhar ábhartha a óstáiltear ar an suíomh gréasáin seo a fháil amach agus rochtain a fháil air. Tugann léarscáileanna suímh bealach fíor-shimplí d ‘ úinéirí láithreán gréasáin faisnéis faoin ábhar atá acu ar a suíomh a roinnt le gach inneall cuardaigh, seachas a bheith ag brath go hiomlán ar halgartaim scanadh (i.e. scanóirí, robots) chun í a fháil.“
Molann sé an iomarca comhad léarscáil láithreáin XML a sheachaint ar an láithreán. Go hidéalach, molann sé gan ach comhad léarscáil láithreáin innéacs amháin a úsáid a liostaíonn gach comhad léarscáil láithreáin ábhartha agus comhaid léarscáil láithreáin innéacs.
Chun líon na nasc dúblach agus neamh-oibre i léarscáileanna láithreáin a íoslaghdú, molann Bing léarscáileanna suímh a chruthú uair amháin sa lá ar a laghad.
Maidir le suíomhanna an-mhór ina bhfuil Na milliúin Agus na billiúin Urlanna, is féidir le méid iomlán na gcomhad xml léarscáil an láithreáin níos mó ná 100 ghigibheart a bhaint amach. Sna cásanna seo, molann Bing dhá shraith léarscáileanna suímh a chruthú agus iad a mhalartú go laethúil.
Léarscáil an láithreáin agus Baidu
Éilíonn Baidu an méid seo a leanas le haghaidh léarscáileanna suímh:
● Níor chóir go mbeadh sé níos mó ná 10 MB; 
● Níor cheart go mbeadh carachtair Síneacha ann; 
● Ba chóir go mbeadh sé suite i bhfillteán fréimhe do shuíomh gréasáin.
Conas léarscáil láithreáin XML a chruthú?
Tairgeann Google liosta atá as dáta de ghineadóirí comhaid Léarscáil Láithreáin tríú páirtí ar féidir le stiúrthóirí gréasáin a n-uirlis féin a úsáid nó a chruthú bunaithe orthu. Faoi láthair, níl gach nasc gníomhach, ach tá go leor acu fós ag obair.
Seo roinnt seirbhísí móréilimh chun léarscáileanna suímh XML A chruthú:
Is clár É Sitemap Writer Pro A thairgeann seacht gcineál léarscáileanna suímh (léarscáil an láithreáin chaighdeánaigh, google images, google news, Google video, google code search, Google Geo, Google Mobile). Cuimsíonn sé crawler ionsuite chun léarscáileanna suímh a ghiniúint agus bainisteoir FTP chun an léarscáil láithreáin a uaslódáil ar an suíomh gréasáin.
Cuimsíonn gineadóir léarscáil an láithreáin XML gineadóir saor in aisce (suas le 500 leathanach), gineadóir gairmiúil, agus script freastalaí atá scríofa I PHP.
Is gineadóir léarscáil láithreáin saor in aisce é My Sitemap Generator a dhéanann scanadh ar an suíomh gréasáin agus a chruthaíonn léarscáil láithreáin XML.
BREISEÁIN CMS a chruthaíonn léarscáileanna suímh:
Drupal
Modúl Léarscáil An Láithreáin XML-cruthaíonn sé léarscáil an láithreáin. San áireamh tá roinnt fo-mhodúil ar féidir leo naisc léarscáil an láithreáin a chur le haghaidh ábhar, míreanna roghchláir, agus próifílí úsáideora.
WordPress
Gineadóir Léarscáileanna Suímh Google (XML) – cruthaíonn sé léarscáil láithreáin XML go huathoibríoch. Ina theannta sin gineann sé léarscáil suímh HTML.
Gineadóir Léarscáil An Láithreáin XML
Gineadóir Léarscáil Láithreáin IKSWEB XML-breiseán éadrom agus dlúth a chruthaíonn léarscáil láithreáin XML.
Breiseán Léarscáil Láithreáin Google XML News
Is bogearraí foinse oscailte é an breiseán Google News a ligeann d ‘ fhoilsitheoirí comhaid Léarscáil An Láithreáin A nuashonrú Do Google News. Chomh maith leis an ngnáthfheidhmiúlacht, tugann sé deis d ‘fhoilsitheoirí cur síos a dhéanamh ar na cineálacha ábhair atá á bhfoilsiú, chomh maith le leibhéil rochtana d’ ailt aonair a shonrú.
Joomla
Tá liosta reatha na mbreiseán a chruthaíonn léarscáil láithreáin i bhformáid XML Do Joomla liostaithe ar shuíomh GRÉASÁIN CMS.
Formáidí Eile Léarscáil An Láithreáin:
Chomh maith le léarscáil láithreáin XML, tá formáidí eile nach bhfuil chomh coitianta de léarscáileanna láithreáin atá beartaithe d ‘ innill chuardaigh.
RSS, mRSS agus Atom 1.0
Maidir le blag le fotha RSS nó Atom, is féidir LEAT URL na beatha seo a úsáid mar fhoinse chun comhad Léarscáil An Láithreáin a chruthú. Soláthraíonn beagnach gach ardán blagála an cumas beatha a chruthú. Tacaíonn Google LE fothaí RSS 2.0 Agus Atom 1.0, chomh maith le fothaí mrss (media RSS).
Comhad Léarscáil An Láithreáin Téacs
I gcomhad Léarscáil An Láithreáin téacs, ní féidir Leat Ach Urlanna a chur leis, gach Ceann acu ar líne ar leithligh. Ba chóir go mbeadh síneadh an chomhaid seo .txt (mar shampla, léarscáil an láithreáin.txt).
Conclúid
Mar fhocal scoir, is uirlis riachtanach é léarscáil láithreáin XML in arsenal stiúrthóir gréasáin nó úinéir láithreán gréasáin. Is comhad struchtúrtha é a chuidíonn le hinnill chuardaigh ábhar do shuíomh a scanadh agus a innéacsú ar bhealach níos éifeachtaí. San airteagal seo, phléamar príomhghnéithe de léarscáileanna suímh XML agus a ról tábhachtach maidir le hinfheictheacht cuardaigh a bharrfheabhsú.
Ligeann léarscáil láithreáin XML duit rialú a dhéanamh ar na leathanaigh de do shuíomh atá ar fáil le hinnéacsú agus soláthraíonn sé faisnéis bhreise faoi gach leathanach, amhail dáta an nuashonraithe dheireanaigh agus na tosaíochta. Cuidíonn sé seo le hinnill chuardaigh a chinneadh níos cruinne cé na leathanaigh atá le hinnéacsú agus cé chomh minic chun filleadh orthu.
Is príomhghné de straitéis RATHÚIL SINSEARACH é mapaí suímh XML a úsáid. Cuireann siad le hinnéacsú do shuíomh a fheabhsú, agus ar an gcaoi sin a infheictheacht i dtorthaí an chuardaigh a mhéadú.
Tá sé tábhachtach a mheabhrú gur uirlis É léarscáil láithreáin XML a éilíonn nuashonrú agus cothabháil leanúnach chun fanacht reatha agus éifeachtach. Trí do léarscáil láithreáin a nuashonrú go rialta is féidir le róbónna athruithe ar do shuíomh a rianú agus innill chuardaigh a chur ar an eolas faoi na hathruithe seo.
Cairde a chara! Go raibh maith agat as do chuid ama a léamh agus a thógáil!
Tá súil againn go raibh an t-alt suimiúil agus, níos tábhachtaí fós, úsáideach!