想必做SEO的人,多多少少都會(huì)懂點(diǎn)搜索引擎原理,雖說(shuō)對(duì)于專業(yè)的算法不必進(jìn)行深入研究,但還是需要簡(jiǎn)單了解一下搜索引擎的工作原理,對(duì)其策略及算法原理有個(gè)簡(jiǎn)單的認(rèn)知,這樣才能更好地做好SEO工作。正所謂,知其然,更要知其所以然嘛。
那么,搜索引擎到底是怎么工作的呢?
想必如果大家特意了解過(guò)的話,無(wú)論是網(wǎng)絡(luò)上還是SEO相關(guān)的書(shū)籍,對(duì)于搜索引擎的工作原理講解得都相對(duì)清楚,在此小編不會(huì)太深入講解其中復(fù)雜高深的搜索引擎架構(gòu)和檢索技術(shù),而是以科普的方式,將搜索引擎工作原理簡(jiǎn)單梳理一下,以幫助大家更好地理解認(rèn)知。
接下來(lái)以痞子瑞《SEO深度解釋》一書(shū)中關(guān)于搜索引擎的大概架構(gòu)跟大家進(jìn)行講解:
如上圖所示,搜索引擎的大致架構(gòu)分為虛線左右兩個(gè)部分:
抓取建庫(kù),即主動(dòng)抓取網(wǎng)頁(yè)進(jìn)行一系列處理后建立索引,等待用戶搜索;
匹配結(jié)果,即分析用戶搜索意圖,進(jìn)而展現(xiàn)用戶所需要的搜索結(jié)果。
1、抓取建庫(kù)
關(guān)于抓取建庫(kù),即搜索引擎主動(dòng)抓取網(wǎng)頁(yè),并進(jìn)行內(nèi)容處理、索引部分的流程和機(jī)制一般如下:
第一步:派出爬蟲(chóng)Spider,按照一定的策略把網(wǎng)頁(yè)抓取回到搜索引擎服務(wù)器;
第二步:對(duì)抓取回來(lái)的網(wǎng)頁(yè)進(jìn)行內(nèi)容處理,消除噪聲、提取該頁(yè)面主題文本內(nèi)容等;
第三步:對(duì)網(wǎng)頁(yè)的文本內(nèi)容進(jìn)行中文分詞;
第四步:分詞完畢后判斷該頁(yè)面內(nèi)容是否與已索引網(wǎng)頁(yè)重復(fù),剔除重復(fù)頁(yè),對(duì)剩余網(wǎng)頁(yè)進(jìn)行倒排索引,然后等待用戶檢索。
2、匹配結(jié)果
當(dāng)有用戶進(jìn)行搜索查詢時(shí),搜索引擎工作的流程機(jī)制一般如下:
第一步:先對(duì)用戶所查詢的關(guān)鍵詞進(jìn)行分詞處理,并根據(jù)用戶的地理位置和歷史檢索特征進(jìn)行用戶需求分析,以便使用地域性搜索結(jié)果和個(gè)性化搜索結(jié)果展示用戶最需要的內(nèi)容;
第二步:查找緩存中是否有該關(guān)鍵詞的查詢結(jié)果,如果有,進(jìn)一步綜合該用戶的各種信息分析判斷其真正需求,對(duì)緩存中的結(jié)果進(jìn)行微調(diào)或直接呈現(xiàn)給用戶;
第三步:如果緩存不存在該用戶所查詢的關(guān)鍵詞,那么就在索引庫(kù)進(jìn)行調(diào)取排名呈現(xiàn),并將該關(guān)鍵詞和對(duì)應(yīng)的搜索結(jié)果加入到緩存中;
第四步:搜索結(jié)果網(wǎng)頁(yè)排名是根據(jù)用戶的搜索詞和搜索需求,對(duì)索引庫(kù)中的網(wǎng)頁(yè)進(jìn)行相關(guān)性、重要性(權(quán)重)和用戶體驗(yàn)的高低進(jìn)行綜合分析所得。
3、大白話解讀版本
以上就是搜索引擎的工作原理的大致流程,倘若看完之后還有點(diǎn)懵,也沒(méi)關(guān)系,接下來(lái)小編以“相親”為例跟大家好好講解一番~~
準(zhǔn)備好了嘛?大白話版本的搜索引擎原理要來(lái)咯~
為了方便大家理解,先來(lái)個(gè)游戲設(shè)定:
媒婆:搜索引擎/爬蟲(chóng)Spider
適齡少女:網(wǎng)頁(yè)
男求親者:用戶
OK,劇情開(kāi)始咯~
一位男求親者(用戶)想要找對(duì)象,由于身邊的資源有限,因而只能去求助媒婆(搜索引擎)幫忙牽橋搭線,以便更快地物色到適合自己的對(duì)象。
于是他就找到了這個(gè)媒婆,跟媒婆講述了自己對(duì)對(duì)象的基本要求:“身高不低于160CM、中等身材、溫柔體貼、最好是個(gè)老師”(用戶搜索關(guān)鍵詞)
好了,媒婆收到了男求親者的要求之后,就會(huì)根據(jù)這個(gè)要求,從她的早早準(zhǔn)備好的適齡少女資料庫(kù)(網(wǎng)頁(yè))進(jìn)行篩選,排除掉身高160CM以下的、不是中等身材的、不夠溫柔體貼的;然后將符合要求的適齡少女按照相應(yīng)要求滿足程度進(jìn)行排序,優(yōu)先推薦是老師的少女。當(dāng)然,倘若媒婆的資料庫(kù)里暫時(shí)沒(méi)有完全匹配的,也會(huì)適當(dāng)根據(jù)自身經(jīng)驗(yàn)來(lái)進(jìn)行推薦。(匹配結(jié)果)
【而媒婆搜集這個(gè)適齡少女資料庫(kù)的過(guò)程就相當(dāng)于爬蟲(chóng)抓取建庫(kù)的過(guò)程~】
媒婆建立這個(gè)資料庫(kù),需要通過(guò)各種渠道,例如走訪方圓十公里,甚至更遠(yuǎn)的地方,(爬蟲(chóng)Spider)了解并收集適齡少女的相關(guān)信息,然后對(duì)這些信息進(jìn)行加工整理歸檔,按優(yōu)質(zhì)進(jìn)行排序,以便男求親者上門(mén)時(shí)可以根據(jù)其要求快速匹配合適的適齡少女。
男求親者根據(jù)媒婆的推薦進(jìn)行了解對(duì)方的信息,從而最后確定要不要進(jìn)入相親見(jiàn)面環(huán)節(jié)~
怎么樣?這樣一梳理,是不是對(duì)搜索引擎的大致流程有一個(gè)比較深刻的理解了呢?
本文經(jīng)授權(quán)發(fā)布,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://allfloridahomeinspectors.com/cgo/market/75322.html