搜尋引擎
此條目或其章節極大或完全地依賴於某個單一的來源。 (2019年5月12日) |
本條目屬於網絡搜尋引擎系列 |
網絡搜尋引擎 |
元搜尋引擎 |
國際性搜尋引擎(多語言) |
Yahoo! Search |
Bing |
僅中文搜尋引擎 |
百度 |
360搜索 |
搜狗 |
yam蕃薯藤 |
其他搜尋引擎 |
DuckDuckGo |
Ecosia |
Exalead |
Naver |
Yandex |
Alexa Internet |
AOL |
Ask.com |
Qwant |
其他連結 |
工作方式
搜尋引擎為一組專案提供了一個介面,使用戶能夠指定關於感興趣的專案的標準,並讓引擎找到匹配的專案,這些標準稱為搜尋查詢。在文字搜尋引擎的情況下,搜尋查詢通常表示為辨識一個或多個文件可能包含的期望概念的一組單詞。[1]有多種樣式的搜尋查詢語法在嚴格性上有差異。它也可以在以前的站點中搜尋搜尋引擎中的名稱。而一些文字搜尋引擎要求用戶輸入由白色空格分隔的兩個或三個字,其他搜尋引擎可以使用戶能夠指定整個文件,圖片,聲音和各種形式的自然語言。一些搜尋引擎對搜尋查詢進行改進,以增加通過稱為查詢擴充的過程提供質素集合的可能性。查詢理解方法可用於標準化查詢語言。
基於索引的搜尋引擎符合查詢指定條件的專案列表通常會排序或排名。按相關性排列專案(從最高到最低)減少尋找所需資訊所需的時間。概率搜尋引擎根據相似性度量(每個專案和查詢之間,通常以1到0,1的比例最相似)和有時受歡迎程度或權限或使用相關性反饋來評估專案。布林搜尋引擎通常只返回匹配的專案,而不考慮排列順序,為了提供根據一些標準快速排序的一組匹配專案,搜尋引擎通常將通過稱為索引的過程來收集關於所考慮的一組專案的元數據。索引通常需要較少量的電腦儲存,這就是為什麼一些搜尋引擎僅儲存索引的資訊而不是每個專案的完整內容,而是提供導航到搜尋引擎結果頁面中的專案的方法。或者,搜尋引擎可以將每個專案的副本儲存在高速緩衝記憶體中,使得用戶可以在索引時或為了歸檔目的看到該專案的狀態,或者使得重複的行程更有效和更快地工作。其他類型的搜尋引擎不儲存索引。抓取器或蜘蛛型搜尋引擎(也稱為即時搜尋引擎)可以在搜尋查詢時收集和評估專案,基於起始專案的內容(稱為種子或種子URL)動態考慮附加專案互聯網爬蟲的情況)。元搜尋引擎既不儲存索引也不儲存快取,而只是重新使用一個或多個其他搜尋引擎的索引或結果來提供聚合的最終結果集。
類型
按來源
- 桌面搜尋(Desktop search)
- 聯合搜尋(Federated search)
- 人類搜尋引擎(Human search engine)
- 元搜尋引擎(Metasearch engine)
- 多搜尋(Multisearch)
- 搜尋聚合器(Search aggregator)
- 網頁搜尋引擎(Web search engine)
- 實體搜尋引擎(Physical search engine)
按內容類型
按介面
- 增量搜尋(Incremental search)
- 即時回答(Instant answer)
- 語意檢索(Semantic search)
- 基於選擇的搜尋(Selection-based search)
- 語音搜尋(Voice Search)
按主題
另見
參考文獻
- ^ Voorhees, E.M. Natural Language Processing and Information Retrieval. National Institute of Standards and Technology. March 2000.