中国女篮今晚比赛直播视频_足彩网比分_中超今日赛事_u23亚洲杯 - 500万彩票网


詳細信息
當前位置: 首頁> 詳細信息
【網站百科】搜索引擎的工作原理
專欄:行業資訊
發布日期:2020-03-16
閱讀量:2333
作者:小科


SEO指根據一定策略、運用特定計算機程序從互聯網上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。

又可理解為通過自然搜索結果獲得網站流量的技術和過程,在了解搜索引擎自然排名機制的基礎上,對網站進行內外調整優化,改進網站在搜索引擎中的關鍵詞自然排名,從而獲取更多流量。它是英文Search Engine Optimization的縮寫,譯為“搜索引擎優化”。

1541750911265045549.png

搜索引擎分類
介紹主流的三種,
1.目錄索引Yahoo、新浪
2.元搜索引擎Dogpile搜星搜索
3.全文索引百度、谷歌。


搜索引擎工作原理

爬行和抓取,搜索引擎用來爬行和訪問頁面的程序被稱為蜘蛛,也稱網絡爬蟲。

各主流搜索引擎蜘蛛的名稱:

搜索引擎的工作原理

百度:Baiduspider、Baiduspider-mobile(抓取wap)、Baiduspider-image(抓取圖片)、Baiduspider-video(抓取視頻)、Baiduspider-news(抓取新聞)。

谷歌:Googlebot

雅虎:“Yahoo! Slurp China”或者Yahoo!

360蜘蛛:360Spider,它是一個很“勤奮抓爬”的蜘蛛

微軟MSN: msnbot、網易有道:Roundabout、宜sou蜘蛛:EasouSpider

搜索引擎收錄流程

1.抓取:抓蟲通過百度、谷歌等搜索引擎進行首頁、欄目頁、內容等抓取,在互聯網中發現、搜集網頁信息,不過諸如js、Flash、inframe框架是不利于蜘蛛抓取的。

2.過濾:過濾不符合網站的相關內容,將那些內容雜亂無章、難易排序、采集的內容沒有價值,不符合用戶的需求的內容過濾掉,好的資源都放在數據庫中。

3.存儲:對信息進行有質量的提取和組織建立索引庫

4.排序:當用戶在搜索欄中輸入關鍵詞或目標詞組后,搜索引擎能快速調用索引庫(數據庫)信息,搜索引擎通過一系列復雜的算法對即將呈現的結果進行復雜的分析計算,排列出先后名次,呈現在用戶面前,方便用戶查詢預覽。

1541750931169044024.png

排名的先后當然取決于用戶和搜索引擎的認可程度!我們平時看到的搜索界面,實際上只是搜索引擎系統的一個檢索界面,當你輸入關鍵詞查詢時,搜索引擎會從龐大的數據庫中找到符合該關鍵詞的所有相關網頁的索引,并按一定的排名規則呈現給用戶。不同的搜索引擎排名不盡相同。

蜘蛛抓取策略

1.深度優先
什么是深度優先?簡單的說,就是搜索引擎蜘蛛在一個頁面發現一個連接然后順著這個連接爬下去,然后在下一個頁面又發現一個連接,然后就又爬下去并且全部抓取,這就是深度優先抓取策略。

假如不是很理解,不妨理解為某個神秘的文件夾,打開打開再打開。

2.寬度優先
寬度優先比較好理解,就是搜索引擎蜘蛛先把整個頁面的鏈接全部抓取一次,然后在抓取下一個頁面的全部鏈接。所以網頁的層度不能太多,否則會導致收錄難,因為它妨礙了搜索引擎蜘蛛的寬度優先策略。

3.權重優先
寬度優先比深度優先,只能說各有各的好處,而且蜘蛛都是兩種抓取策略一起用,也就是深度優先+寬度優先, 只不過在使用兩種策略抓取時,會參照鏈接的權重,如果說這條連接的權重還不錯,那么采用前者,權重低,那么采用寬度優先!
那么蜘蛛怎樣知道鏈接的權重呢?有2個因素,層次的多與少、外鏈多少與質量。


重訪抓取
比如今天蜘蛛來抓取了的網頁,如果明天網頁加了新的內容,那么蜘蛛會來抓取新的內容!重訪抓取分為全部重訪:指蜘蛛上次抓取的鏈接,然后在這一個月的某一天,全部重新去訪問抓取一次!單個重訪:針對某個頁面更新的頻率比較快比較穩定的頁面,如果說有個頁面1個月不更新。那么蜘蛛第三天就不來了,會隔段時間,比如隔個半年,或等全部重訪時再來。

搜索引擎的工作原理

PS:檢查網站是否收錄的方法:
1.在百度搜索框中輸入,site:網站網址
2.在站長工具當中輸入域名,進行查詢


上一頁:【網站百科】網站seo是什么意思?
下一頁:【網站百科】那些昂貴域名背后的傳奇故事

本文由今科科技用戶上傳并發布,今科科技僅提供信息發布平臺。文章代表作者個人觀點,不代表今科科技立場。未經作者許可,不得轉載,有涉嫌抄襲的內容,請通過 反饋中心 進行舉報。


售前咨詢:0760-2332 0168  
售后客服:400  830  7686



1998~2024,今科26年專注于企業信息化服務

立 即 注 冊 / 咨 詢
上 線 您 的 網 站