搜索引擎工作原理與南通SEO之間的那點(diǎn)事
網(wǎng)頁是基于互聯(lián)網(wǎng)的一個(gè)最基本的單位,搜索引擎圍繞一個(gè)網(wǎng)頁展開的工作大致需要經(jīng)歷如下四個(gè)環(huán)節(jié)(包括但不限):
(1)下載系統(tǒng):搜索引擎下載頁面
(2)分析系統(tǒng):搜索引擎對(duì)頁面進(jìn)行分析
(3)索引系統(tǒng):搜索引擎根據(jù)分析結(jié)果決定是否予以收錄、索引
(4)查詢系統(tǒng):搜索引擎將頁面加入緩存,進(jìn)行查詢
為何搜索引擎要按照這種方式展開工作?搜索引擎的使命是什么?
(1)搜索引擎為何要將頁面下載回去?
難以想象,搜索引擎不把頁面下載回去,加入搜索引擎的頁面庫,搜索引擎將如何對(duì)頁面進(jìn)行分析。難道讓搜索引擎根據(jù)需求才對(duì)頁面進(jìn)行實(shí)時(shí)下載、分析,然后直接進(jìn)行展現(xiàn)?哦不……那樣效率會(huì)非常之低,在用戶搜索一個(gè)關(guān)鍵詞進(jìn)行檢索時(shí),搜索引擎需要花費(fèi)大量的時(shí)間才能分析完畢,給用戶返回結(jié)果,不怕用戶等得不耐煩跑掉?
實(shí)際上,搜索引擎需要在非常短暫的時(shí)間內(nèi),對(duì)用戶的搜索請(qǐng)求返回結(jié)果,因此就需要事先在搜索引擎中建立一個(gè)數(shù)據(jù)庫,然后把常用的信息放入高速緩存之中,這樣就可以保證在極短的時(shí)間內(nèi),對(duì)用戶的請(qǐng)求進(jìn)行響應(yīng)了。
關(guān)于緩存,大家可以自行百度一下,我舉個(gè)不是太好的例子,就像電腦的機(jī)械硬盤和固態(tài)硬盤相對(duì)于內(nèi)存的速度(有明顯質(zhì)的或者幾何級(jí)別的區(qū)別)
不僅如此,搜索引擎所擔(dān)負(fù)的使命主要還有兩點(diǎn),一是抓取更多頁面,而是根據(jù)分析系統(tǒng)和查詢系統(tǒng)的情況,根據(jù)重要程度去跟蹤觀察一些頁面。
搜索引擎需要盡可能地遍歷并下載互聯(lián)網(wǎng)上存在的所有頁面,只有這樣才能為用戶提供更多的參考信息。我來舉個(gè)例子:許多人都在談?wù)?,谷歌在學(xué)術(shù)界的搜索體驗(yàn)要明顯高于其他搜索引擎,其實(shí)也可以說是谷歌在世界范圍中抓取的學(xué)術(shù)界的頁面的數(shù)量和質(zhì)量都要比其他搜索引擎要多要好。
對(duì)于越重要的頁面,更新越頻繁的頁面,展現(xiàn)多的頁面,需要分配更多資源對(duì)其進(jìn)行跟蹤,以確保目標(biāo)頁面處于一種正常狀態(tài)(當(dāng)目標(biāo)頁面處于非正常狀態(tài)時(shí),可以及時(shí)反應(yīng)過來,進(jìn)行相應(yīng)處理)。
(2)為什么頁面被下載回去還要進(jìn)行分析?
因?yàn)榛ヂ?lián)網(wǎng)上的頁面,絕大部分都并不會(huì)是優(yōu)質(zhì)的頁面(一方面是沒有搜索價(jià)值或者用戶搜索需求的頁面,比如我的流水賬一樣的日記,比如一些隱私信息等;另一方面是針對(duì)搜索引擎制造的粗制濫造、抄襲的垃圾頁面,就是我們熟知的黑帽作弊頁面;還有一些是已經(jīng)不存在的頁面,比如一些頁面曾經(jīng)可訪,現(xiàn)在由于一些原因不可訪問,比如一些國外倒閉公司的網(wǎng)站,或者因?yàn)椴煌騽h除的頁面……
搜索引擎為了對(duì)魚龍混雜的互聯(lián)網(wǎng)上存在的大量頁面進(jìn)行甄選,所以必然需要對(duì)這些頁面進(jìn)行選拔,對(duì)優(yōu)質(zhì)頁面進(jìn)行優(yōu)先展現(xiàn),將劣質(zhì)頁面過濾掉不予展現(xiàn)。
(3)為何需要索引機(jī)制?
用戶從搜索引擎中進(jìn)行搜索時(shí),一般只會(huì)對(duì)很少的一部分頁面進(jìn)行訪問即可解決需求,因此并不需要對(duì)大量的網(wǎng)頁進(jìn)行展現(xiàn)。因此,為了加快查詢響應(yīng)速度,只對(duì)根據(jù)分析系統(tǒng)得到的一批優(yōu)質(zhì)頁面進(jìn)行展現(xiàn),是一個(gè)不錯(cuò)的主意。
而且,這個(gè)階段有一個(gè)特性,會(huì)把頁面和關(guān)鍵詞進(jìn)行聯(lián)系。這為搜索引擎在遇到用戶的不同搜索詞對(duì)不同頁面進(jìn)行展現(xiàn)提供了解決方案。
就如同一個(gè)頁面不會(huì)霸占所有的關(guān)鍵詞,一個(gè)關(guān)鍵詞的結(jié)果展現(xiàn)中對(duì)于不同的頁面也有不同的排序。
(4)查詢系統(tǒng)是什么好吃嗎?
查詢系統(tǒng)是搜索引擎與用戶最接近的一個(gè)環(huán)節(jié),用戶想從搜索引擎得到的信息都是直接通過查詢系統(tǒng)進(jìn)行展現(xiàn)的。
普通的用戶不會(huì)在意他得到的信息來自于哪里,而是對(duì)他是否有幫助。所以搜索引擎必須致力于解決這個(gè)環(huán)節(jié)上可能出現(xiàn)的問題與矛盾。搜索引擎會(huì)根據(jù)這個(gè)環(huán)節(jié)中用戶的各種行為,來對(duì)搜索結(jié)果排序進(jìn)行調(diào)整、干預(yù)。我舉個(gè)例子,比如大部分用戶通過某個(gè)關(guān)鍵詞進(jìn)入排序在前面的某個(gè)頁面,但是在該站點(diǎn)的另外一個(gè)頁面上進(jìn)行了跳出或者轉(zhuǎn)化,那么搜索引擎可能就會(huì)認(rèn)為,最終的頁面才更適合展現(xiàn)給用戶,如果用戶瀏覽的具有價(jià)值的頁面沒有被抓取、收錄、索引的話,搜索引擎可能會(huì)對(duì)目標(biāo)頁面進(jìn)行這樣的工作,對(duì)最終的展現(xiàn)進(jìn)行跳轉(zhuǎn)。另一個(gè)例子,如果有大量用戶對(duì)排在前面的頁面的跳出率過高,搜索引擎可能會(huì)認(rèn)為這個(gè)頁面展示的效果不好,從而把本來排在前面的頁面移到后面去。
簡單來說,這個(gè)環(huán)節(jié)上,搜索引擎需要有非常多的方式來觀察、分析、模擬、預(yù)測用戶的行為,對(duì)搜索結(jié)果展現(xiàn)、排序進(jìn)行調(diào)控。
三位一體的搜索互聯(lián)網(wǎng):SEO、搜索引擎、用戶
站長通過SEO行為對(duì)網(wǎng)站進(jìn)行調(diào)整,搜索引擎根據(jù)網(wǎng)站的表現(xiàn)給與相應(yīng)的評(píng)級(jí)與展現(xiàn);搜索引擎給用戶展現(xiàn)信息,用戶對(duì)搜索引擎的反饋使得搜索引擎進(jìn)一步作出調(diào)整;用戶訪問網(wǎng)站對(duì)站長產(chǎn)生利益,站長根據(jù)用戶的站內(nèi)行為,作出更好的站內(nèi)頁面展現(xiàn)。
每一個(gè)環(huán)節(jié)都有著大量的工作可以進(jìn)行操作。這里我就不繼續(xù)展開了,信息量會(huì)非常龐大。
簡單來說,站長和搜索引擎都需要對(duì)用戶的行為盡量大量的分析,根據(jù)用戶的反饋進(jìn)行更多的調(diào)整,以提高用戶體驗(yàn)。而站長和搜索引擎之間,一方面需要站長通過SEO手段使得網(wǎng)站對(duì)搜索引擎友好,另一方面需要搜索引擎自身通過完善技術(shù)來完成使命。用戶需要做什么呢?需要得到什么呢?很簡單,用戶想從搜索引擎中得到優(yōu)質(zhì)網(wǎng)站資源,想從網(wǎng)站中得到優(yōu)質(zhì)體驗(yàn)與服務(wù),而用戶需要做的就是買買買。
- 上一篇:總體概括為技術(shù)型SEO和需求型SEO 2017/1/10
- 下一篇:君恒科技公司元旦節(jié)祝福暨放假通知 2016/12/29