MENU 服務(wù) 案例
網(wǎng)站建設(shè)-網(wǎng)站設(shè)計(jì)-北京網(wǎng)站建設(shè)-高端網(wǎng)站制作公司-尚品中國(guó)
我們通過(guò)擁抱變化創(chuàng)造
360°的品牌價(jià)值__
簡(jiǎn)體
簡(jiǎn)體中文 English

尚品與山東真諾智能設(shè)備有限公司簽署網(wǎng)站改版合作協(xié)議

類型:尚品動(dòng)態(tài) 了解更多

利用www搜索引擎檢索

來(lái)源:尚品中國(guó)| 類型:網(wǎng)站百科| 時(shí)間:2014-07-07
WWW也稱為Web網(wǎng)或萬(wàn)維網(wǎng),是歐洲粒子物理研究所的美國(guó)科學(xué)家Tim Bemers-Lee在1989年開(kāi)發(fā)并命名的一種以超文本為基礎(chǔ)形成的信息傳輸網(wǎng)絡(luò),翻開(kāi)了Internet新的一頁(yè)。Tin Bemcrs-L“因此被譽(yù)為萬(wàn)維網(wǎng)之父,獲得全球首個(gè)“千年技術(shù)獎(jiǎng)”。WWW與Internet并非一個(gè)概念,而是Internet提供的服務(wù)功能之一,WWW使網(wǎng)絡(luò)用戶不再面對(duì)枯燥費(fèi)解的機(jī)器指令。通過(guò)瀏覽器和超鏈接就能直觀、方便地訪問(wèn)網(wǎng)絡(luò)上以指數(shù)級(jí)增長(zhǎng)的文本、圖像和各種多媒體信息,除此之外,收集互聯(lián)網(wǎng)上用戶感興趣的信息還必須借助的有力工具便是WWW搜索引擎。

搜索引擎是互聯(lián)網(wǎng)上提供信息搜索服務(wù)的平臺(tái),是應(yīng)用最廣泛的網(wǎng)絡(luò)服務(wù)工具。我們現(xiàn)在通常使用的搜索引攀基本上是運(yùn)行于WWW中的,所以也可以稱為WWW搜索引攀。隨著網(wǎng)絡(luò)信息越來(lái)越滲入普通人的生活,搜索引攀已經(jīng)成為互聯(lián)網(wǎng)上一種熱門(mén)和關(guān)鍵的技術(shù),研究與開(kāi)發(fā)的競(jìng)賽此起彼伏,從未停止。我們之所以能輕點(diǎn)”數(shù)億計(jì)的Internet網(wǎng)頁(yè)信息,全倚仗互聯(lián)網(wǎng)中上千個(gè)搜索引攀兢兢業(yè)業(yè)不斷地進(jìn)行著發(fā)現(xiàn)、抓取、存儲(chǔ)、索引并提供網(wǎng)絡(luò)信息檢索服務(wù)的工作。它們正朝著專業(yè)化、本土化、生活化方向邁進(jìn)。WWW搜索引擎按其運(yùn)作方式差異可劃分為三種類型:目錄網(wǎng)站、全文搜索引擎和元搜索引擎。

萬(wàn)維網(wǎng)

一、目錄網(wǎng)站

日錄網(wǎng)站建設(shè)屬早期的WWW信息搜索工具,其工作方式是由人工進(jìn)行網(wǎng)絡(luò)信息的收集、整理,以分類主題形式呈現(xiàn)和瀏覽。由于人工成本極高,技術(shù)含里比較低。從本質(zhì)上講算不上真正的搜索引攀,所以至今不受人重視,幾乎全部目錄網(wǎng)站后來(lái)都開(kāi)發(fā)了自己獨(dú)立的新一代的搜索引攀,演變成常見(jiàn)的關(guān)鍵詞搜索形式,如新浪、搜狐、中國(guó)雅虎目前都己難覓當(dāng)初目錄瀏覽風(fēng)格的蹤影,僅有少數(shù)還保留著原始網(wǎng)站分類搜索的特征。最著名的網(wǎng)站目錄當(dāng)數(shù)Yahoo中文的網(wǎng)站目錄從出現(xiàn)的時(shí)間排序有搜狐、網(wǎng)易、新浪等,國(guó)外有LookSmart. About等,目錄網(wǎng)站有如下特點(diǎn)。

①基于樹(shù)型目錄瀏覽網(wǎng)絡(luò)信息,簡(jiǎn)單,易用。以樹(shù)型目錄結(jié)構(gòu)組織的信息資游,具有嚴(yán)密的系統(tǒng)性和良好的可擴(kuò)充性,該月錄加入了人類智稼,屏蔽了網(wǎng)絡(luò)資深系統(tǒng)相對(duì)于用戶的復(fù)雜性,可以提高信息的準(zhǔn)確性,導(dǎo)航質(zhì)量高。②資源分類目錄不夠細(xì)致。網(wǎng)絡(luò)信息資派的龐雜性,決定了很難確定一個(gè)全面的范疇體系作為主題樹(shù)結(jié)構(gòu)的基礎(chǔ)來(lái)涵蓋所有的網(wǎng)絡(luò)信息資源。為了保證主題的可用性和結(jié)構(gòu)的清晰性,范疇體系的類目也不宜過(guò)多,這就使一方面有些特殊的類別無(wú)處可尋,另一方面大量的Web頁(yè)因沒(méi)有包含在目錄中而被忽略。隨著Web的增長(zhǎng),這個(gè)問(wèn)題會(huì)越來(lái)越嚴(yán)重。利用聚類或其他自動(dòng)分類(包括自然語(yǔ)言處理,相關(guān)頂抽取等)的方法仍然不能讓人滿意。并且還會(huì)出現(xiàn)機(jī)器自動(dòng)得到的類與人工分類的結(jié)果不相同的問(wèn)題。⑧由于人工介入、維護(hù)量大、信息呈相對(duì)少、信息更新不及時(shí)等,所以為使用戶得到更多的信息,這種目錄網(wǎng)站常把查詢送到其他搜索引擎上,對(duì)整個(gè)Web進(jìn)行搜索。當(dāng)今的目錄網(wǎng)站與全文搜索引擎是相互融合的,用戶基本不能區(qū)分。如Yahoo曾經(jīng)采用Google的搜索引攀提供頁(yè)面搜索,Google則采用“OpenDirectory”目錄提供分類查詢,搜索界面也幾乎是千篇一律。

二、全文搜索引攀

全文搜索引擎被稱為真正的搜索引擎,與網(wǎng)站目錄的區(qū)別在于它不再使用人工參與的信息搜索與分類,全部采用軟件程序來(lái)搜集、索引、檢索網(wǎng)絡(luò)信息,全文搜索引攀的結(jié)構(gòu)由四部分組成。

 (I)搜索器。搜索器或稱網(wǎng)絡(luò)機(jī)器人。是一種網(wǎng)絡(luò)自動(dòng)搜索軟件,通常稱為“蜘蛛”(spider)、爬蟲(chóng)(crawler)或機(jī)器人(robots)等。“蜘蛛”唯一的工作就是在Web中漫游發(fā)現(xiàn)和收集信息,它每天可以“爬行”大約一千萬(wàn)個(gè)網(wǎng)頁(yè),盡可能多快地收集各種類型的新信息。同時(shí)因?yàn)閃eb的信息更新很快,所以還要定期更新已經(jīng)收集過(guò)的舊信息,以免死鏈接和無(wú)效鏈接。收集信息的策略有兩個(gè)。第一,從一組URL (資源定位器)開(kāi)始,順?lè)圻@些URL中的超鏈接,以寬度優(yōu)先或深度優(yōu)先方式遞歸地在Web中抽取信息。這些起始URL常常是一些非常流行的、包含很多鏈接的站點(diǎn),例如Yahoo的分類節(jié)點(diǎn);第二,可以通過(guò)設(shè)置“添加網(wǎng)址”欄,允許網(wǎng)絡(luò)信息作者主動(dòng)給搜索引擎提供網(wǎng)頁(yè)地址,但這種方法常受到垃圾網(wǎng)頁(yè)制造的轟擊,幾乎有95%通過(guò)添加網(wǎng)址欄提交的網(wǎng)址被拒收。搜索引攀采用的搜索信息策略不同,如搜索頻率、搜索對(duì)象等會(huì)造成每個(gè)搜索引擎的搜索結(jié)果、質(zhì)量之間存在差異。

(2)索引器。 索引器或稱為標(biāo)引程序。它的功能是分析收集器所收集的信息,進(jìn)行自動(dòng)標(biāo)引,將文檔表示為一種便于檢索的形式并儲(chǔ)存在索引庫(kù)中,也就是建立倒排文檔。倒排文檔中的每個(gè)標(biāo)引項(xiàng)都包含一組指針,指向它出現(xiàn)的網(wǎng)頁(yè)。為了給用戶提供有關(guān)被檢出文檔的信息,標(biāo)引中還包含每個(gè)頁(yè)面的簡(jiǎn)單描述,如產(chǎn)生日期、大小、標(biāo)題、子標(biāo)題和摘要等。
   
(3)檢索器。檢索器或稱為檢索軟件,它的功能是根據(jù)用戶的查詢,在索引庫(kù)中快速檢索出相關(guān)文檔,進(jìn)行文檔與查詢的相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果進(jìn)行排序,并能夠?qū)崿F(xiàn)某種用戶相關(guān)反饋機(jī)制(即可以對(duì)檢索策略的不斷修正)。檢索器被視為搜索引擎中最復(fù)雜的部分,其中包含關(guān)于檢索結(jié)果的排序的重要問(wèn)題。研究者發(fā)現(xiàn)用戶不可能耐心地去瀏覽動(dòng)輒上萬(wàn)的搜索結(jié)果,而只會(huì)注意到最前幾頁(yè)的搜索結(jié)果,光靠點(diǎn)擊率和詞頻來(lái)簡(jiǎn)單排序的方法顯然有缺陷。
   
三、元搜索引攀

 元搜索引攀又稱多搜索引擎,這類搜索引攀沒(méi)有自己的海量數(shù)據(jù)庫(kù),而是將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果進(jìn)行去排序等處理后再將結(jié)果返回給用戶。按其搜索機(jī)制可分為并行式和串行式。并行式元搜索引攀指將查詢要求問(wèn)時(shí)發(fā)向各個(gè)獨(dú)立的搜索引攀。然后將結(jié)果按特定的順序提供給用戶。串行式元搜索引攀是將查詢耍求先發(fā)給某個(gè)獨(dú)立的搜索引擎,待其返回結(jié)果后再將請(qǐng)求發(fā)給另一個(gè)搜索引攀。
來(lái)源聲明:本文章系尚品中國(guó)編輯原創(chuàng)或采編整理,如需轉(zhuǎn)載請(qǐng)注明來(lái)自尚品中國(guó)。以上內(nèi)容部分(包含圖片、文字)來(lái)源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)及時(shí)與本站聯(lián)系(010-60259772)。
TAG標(biāo)簽:

如果您的網(wǎng)站可以增加轉(zhuǎn)化次數(shù)并提高客戶滿意度,該怎么辦?

預(yù)約專業(yè)咨詢顧問(wèn)溝通!

*尚品專業(yè)顧問(wèn)將盡快與您聯(lián)系

免責(zé)聲明

非常感謝您訪問(wèn)我們的網(wǎng)站。在您使用本網(wǎng)站之前,請(qǐng)您仔細(xì)閱讀本聲明的所有條款。

1、本站部分內(nèi)容來(lái)源自網(wǎng)絡(luò),涉及到的部分文章和圖片版權(quán)屬于原作者,本站轉(zhuǎn)載僅供大家學(xué)習(xí)和交流,切勿用于任何商業(yè)活動(dòng)。

2、本站不承擔(dān)用戶因使用這些資源對(duì)自己和他人造成任何形式的損失或傷害。

3、本聲明未涉及的問(wèn)題參見(jiàn)國(guó)家有關(guān)法律法規(guī),當(dāng)本聲明與國(guó)家法律法規(guī)沖突時(shí),以國(guó)家法律法規(guī)為準(zhǔn)。

4、如果侵害了您的合法權(quán)益,請(qǐng)您及時(shí)與我們,我們會(huì)在第一時(shí)間刪除相關(guān)內(nèi)容!

聯(lián)系方式:010-60259772
電子郵件:394588593@qq.com

現(xiàn)在就與專業(yè)咨詢顧問(wèn)溝通!

  • 全國(guó)服務(wù)熱線

    400-700-4979

  • 北京服務(wù)熱線

    010-60259772

信息保護(hù)中請(qǐng)放心填寫(xiě)
在線咨詢

免責(zé)聲明

非常感謝您訪問(wèn)我們的網(wǎng)站。在您使用本網(wǎng)站之前,請(qǐng)您仔細(xì)閱讀本聲明的所有條款。

1、本站部分內(nèi)容來(lái)源自網(wǎng)絡(luò),涉及到的部分文章和圖片版權(quán)屬于原作者,本站轉(zhuǎn)載僅供大家學(xué)習(xí)和交流,切勿用于任何商業(yè)活動(dòng)。

2、本站不承擔(dān)用戶因使用這些資源對(duì)自己和他人造成任何形式的損失或傷害。

3、本聲明未涉及的問(wèn)題參見(jiàn)國(guó)家有關(guān)法律法規(guī),當(dāng)本聲明與國(guó)家法律法規(guī)沖突時(shí),以國(guó)家法律法規(guī)為準(zhǔn)。

4、如果侵害了您的合法權(quán)益,請(qǐng)您及時(shí)與我們,我們會(huì)在第一時(shí)間刪除相關(guān)內(nèi)容!

聯(lián)系方式:010-60259772
電子郵件:394588593@qq.com