來(lái)源:https://www.bb620.com| 2014-10-25 13:43:30
搜索引擎的(de)基本工作原理包括如下三個(gè)過程:首先在(zài)互聯網中發現、搜集網頁信息;同時(shí)對信息進行提取和(hé / huò)組織建立索引庫;再由檢索器根據用戶輸入的(de)查詢關鍵字,在(zài)索引庫中快速檢出(chū)文檔,進行文檔與查詢的(de)相關度評價,對将要(yào / yāo)輸出(chū)的(de)結果進行排序,并将查詢結果返回給用戶。 搜索引擎蜘蛛程序,其實就(jiù)是(shì)搜索引擎的(de)一(yī / yì /yí)個(gè)自動應用程序,它的(de)作用是(shì)什麽呢?其實很簡單,就(jiù)是(shì)在(zài)互聯網中浏覽信息,然後把這(zhè)些信息都抓取到(dào)搜索引擎的(de)服務器上(shàng),然後建立索引庫等等,我們可以(yǐ)把搜索引擎蜘蛛當做一(yī / yì /yí)個(gè)用戶,然後這(zhè)個(gè)用戶來(lái)訪問我們的(de)網站,然後在(zài)把我們網站的(de)内容保存到(dào)自己的(de)電腦上(shàng)!比較好理解。
1. 搜集信息:搜索引擎的(de)信息搜集基本都是(shì)自動的(de)。搜索引擎利用稱爲(wéi / wèi)網絡蜘蛛的(de)自動搜索機器人(rén)程序來(lái)連上(shàng)每一(yī / yì /yí)個(gè)網頁上(shàng)的(de)超連結。理論上(shàng),若網頁上(shàng)有适當的(de)超鏈結,機器人(rén)便可以(yǐ)遍曆絕大(dà)部分網頁。
2. 整理信息:搜索引擎整理信息的(de)過程稱爲(wéi / wèi)“建立索引”。搜索引擎不(bù)僅要(yào / yāo)保存搜集起來(lái)的(de)信息,還要(yào / yāo)将它們按照一(yī / yì /yí)定的(de)規則進行編排。那麽它每次找資料都得把整個(gè)資料庫完全翻查一(yī / yì /yí)遍,如此一(yī / yì /yí)來(lái)再快的(de)計算機系統也(yě)沒有用。
3. 接受查詢:用戶向搜索引擎發出(chū)查詢,搜索引擎接受查詢并向用戶返回資料。搜索引擎每時(shí)每刻都要(yào / yāo)接到(dào)來(lái)自大(dà)量用戶的(de)幾乎是(shì)同時(shí)發出(chū)的(de)查詢,用戶便能到(dào)達含有自己所需資料的(de)網頁。通常搜索引擎會在(zài)這(zhè)些鏈接下提供一(yī / yì /yí)小段來(lái)自這(zhè)些網頁的(de)摘要(yào / yāo)信息以(yǐ)幫助用戶判斷此網頁是(shì)否含有自己需要(yào / yāo)的(de)内容。
通過指向該網頁的(de)外鏈錨文本所傳遞的(de)權重數值,來(lái)爲(wéi / wèi)此網頁确定一(yī / yì /yí)個(gè)權重數值,同時(shí)結合上(shàng)述的(de)“重要(yào / yāo)信息分析”,從而(ér)确立此網頁的(de)關鍵詞集合p中每一(yī / yì /yí)個(gè)關鍵詞所具備的(de)排名系數。
搜索引擎的(de)工作分爲(wéi / wèi)四個(gè)步驟:
1. 爬行和(hé / huò)抓取
搜索引擎派出(chū)一(yī / yì /yí)個(gè)能夠在(zài)網上(shàng)發現新網頁并抓文件的(de)程序,這(zhè)個(gè)程序通常稱之(zhī)爲(wéi / wèi)蜘蛛。搜索引擎從已知的(de)數據庫出(chū)發,這(zhè)些新的(de)網址會被存入數據庫等待抓取。所以(yǐ)跟蹤網頁鏈接是(shì)搜索引擎蜘蛛發現新網址的(de)最基本的(de)方法,所以(yǐ)反向鏈接成爲(wéi / wèi)搜索引擎優化的(de)最基本因素之(zhī)一(yī / yì /yí)。搜索引擎抓取的(de)頁面文件與用戶浏覽器得到(dào)的(de)完全一(yī / yì /yí)樣,抓取的(de)文件存入數據庫。
2.索引
蜘蛛抓取的(de)頁面文件分解、分析,并以(yǐ)巨大(dà)表格的(de)形式存入數據庫,這(zhè)個(gè)過程即是(shì)索引(index).在(zài)索引數據庫中,網頁文字内容,關鍵詞出(chū)現的(de)位置、字體、顔色、加粗、斜體等相關信息都有相應記錄。
3.搜索詞處理
用戶在(zài)搜索引擎界面輸入關鍵詞,單擊“搜索”按鈕後,搜索引擎程序即對搜索詞進行處理,如中文特有的(de)分詞處理,去除停止詞,判斷是(shì)否需要(yào / yāo)啓動整合搜索,判斷是(shì)否有拼寫錯誤或錯别字等情況。搜索詞的(de)處理必須十分快速。搜索引擎蜘蛛幾乎是(shì)24小時(shí)不(bù)休息的(de)(在(zài)此爲(wéi / wèi)它感到(dào)悲劇,沒有假期。哈哈。)那麽蜘蛛下載回來(lái)的(de)網頁怎麽辦呢?這(zhè)就(jiù)需要(yào / yāo)到(dào)了(le/liǎo)第二個(gè)系統,也(yě)就(jiù)是(shì)搜索引擎的(de)分析系統。
4.排序
對搜索詞處理後,搜索引擎程序便開始工作,從索引數據庫中找出(chū)所有包含搜索詞的(de)網頁,再好的(de)搜索引擎也(yě)無法與人(rén)相比,這(zhè)就(jiù)是(shì)爲(wéi / wèi)什麽網站要(yào / yāo)進行搜索引擎優化。沒有SEO的(de)幫助,搜索引擎常常并不(bù)能正确的(de)返回最相關、最權威、最有用的(de)信息。
正如上(shàng)文所說(shuō),用戶在(zài)查詢時(shí)所得到(dào)的(de)查詢結果并非是(shì)及時(shí)的(de),而(ér)是(shì)在(zài)搜索引擎的(de)緩存區已經大(dà)體排好的(de),當然搜索引擎不(bù)會未蔔先知,那麽這(zhè)樣下來(lái),搜索引擎就(jiù)可以(yǐ)在(zài)用戶産生查詢行爲(wéi / wèi)之(zhī)前,将詞庫中的(de)每一(yī / yì /yí)個(gè)關鍵詞其對應的(de)URL排名先行計算好,這(zhè)樣就(jiù)大(dà)大(dà)節省了(le/liǎo)處理查詢的(de)時(shí)間了(le/liǎo)。
搜索引擎直至現在(zài),都是(shì)在(zài)不(bù)斷完善用戶體驗,争取在(zài)用戶搜索查詢時(shí)輸出(chū)最匹配的(de)結果,從而(ér)讓用戶依賴上(shàng)搜索引擎,才能賺取更多的(de)廣告費用(例如百度推廣),舉個(gè)例子(zǐ):CCTV頻道(dào)的(de)用戶很多,但是(shì)從不(bù)跟看CCTV的(de)用戶收錢,但能賺到(dào)很多的(de)廣告費;在(zài)這(zhè)裏指的(de)匹配不(bù)光是(shì)字符上(shàng)的(de)匹配,我們可以(yǐ)去百度搜索“PC”會看到(dào)“電腦”也(yě)是(shì)飄紅的(de)。
簡述搜索引擎的(de)工作原理由東莞網站設計編輯 /news/210.html如需轉載請注明出(chū)處
東莞做網站公司 東莞網絡推廣 東莞小程序開發 東莞網頁制作 東莞網站改版 東莞小程序制作 東莞微信小程序開發 東莞網站開發 揭陽網站建設 免費網站建設 珠海網站建設 營銷型網站建設 商城網站建設 江門網站建設 廣州網站建設 潮州網站建設 河源網站建設 外貿網站建設 關鍵詞優化 網站托管 SEO外包