這篇文章,小編來(lái)跟大家分享的內容是關(guān)于谷歌的搜索特色~
Google的一些特色包括:支持多種搜索語(yǔ)言,種數達到了上百種;搜索速度快,據說(shuō)Google擁有8000多臺服務(wù)器,200多條T3級別的寬帶;Google還擁有專(zhuān)利網(wǎng)頁(yè)級別技術(shù)PageRank,可以提供高命中率的搜索結果;Google的智能化的“手氣不錯”功能,可以提供最符合要求的網(wǎng),谷歌涂鴉是谷歌于節日和其他紀念日在主頁(yè)上展示的定制版谷歌圖標,如搜一下日本的:
為了做更深入了了解,我們還是先來(lái)學(xué)習一下Google的搜索語(yǔ)法。谷歌的搜索語(yǔ)法分成了兩大類(lèi),一類(lèi)是基本語(yǔ)法,另一類(lèi)就是高級語(yǔ)法了。這一次,就先介紹一下Google的基本語(yǔ)法。
基本語(yǔ)法
1)谷歌的默認搜索是and邏輯,意思就是,我們在輸入關(guān)鍵字后進(jìn)行搜索時(shí),如輸入:“computer google”后,會(huì )搜出包含“computer”和“google”的文件內容,如圖:
對于一個(gè)搜索引擎來(lái)說(shuō),進(jìn)行搜索的時(shí)候是要搜索和匹配到所有關(guān)鍵詞的頁(yè)面,還是包含關(guān)鍵詞中的任意關(guān)鍵詞?,取決于一個(gè)搜索引擎的一些特別算法,稱(chēng)之為搜索引擎的布爾邏輯默認值。而google就是用and作為默認邏輯(搜索到所有的關(guān)鍵詞),當然這個(gè)前提是我們沒(méi)有輸入一些特殊的命令。
3)如果我們在字母之間不想插入任何東西,即我就想搜“computerGoogle”那么可以輸入“computerGoogle”【注:字符用雙引號引起來(lái)】:
4)如果我們只想顯示computer,而不想看到Google,那么我們看可以這樣輸入:在computer后面加一個(gè)空格,然后減號“-”Google,即:computer -Google:
高級語(yǔ)法
1)intitle
首先要介紹的就是“intitle:”的用法,這個(gè)串的作用是將搜索的范圍局限在標題上。在關(guān)鍵詞前面加上這個(gè),就會(huì )只對網(wǎng)頁(yè)的標題進(jìn)行搜索并且配對,最后將結果返回給用戶(hù)。例如輸入“intitle YouTube computer”進(jìn)行搜索,就會(huì )返回如下圖所示:
但是可以看到,貌似搜索結果中只出現了關(guān)于YouTube的內容,而computer相關(guān)的內容很少,這里其實(shí)還是牽扯到搜索引擎的基礎布爾邏輯問(wèn)題,在intitle:語(yǔ)法上,google會(huì )檢索所有的網(wǎng)頁(yè),只要出現YouTube或者computer其中的一個(gè)就會(huì )被匹配,意料之中的是,關(guān)于YouTube的內容肯定是要遠遠多于computer的內容,所以搜索結果里關(guān)于YouTube的內容占據了主導,但是如果我們想要找到網(wǎng)頁(yè)標題中既有YouTube又有computer的網(wǎng)頁(yè),我們就要使用“intitle:”的一個(gè)變體“allintitle:”,使用這個(gè)前綴后,就能得到我們想要的結果了。如下圖所示:
看到這個(gè)單詞,大概就可以猜到它的意義了,“intext:”是用來(lái)搜索網(wǎng)頁(yè)正文內容的,這樣就可以忽略網(wǎng)頁(yè)中的超文本鏈接、URL和題目。我們輸入“intext:2018 tjut”進(jìn)行搜索,結果如下圖所示,結果中顯示的網(wǎng)頁(yè)大部分標題幾乎沒(méi)有規律,但是網(wǎng)頁(yè)的索引中都包含著(zhù) “2020 tjut”,但是因為2020和tjut的同時(shí)出現的網(wǎng)頁(yè)實(shí)在比較少,兩個(gè)關(guān)鍵詞的關(guān)聯(lián)度實(shí)在不高,因為現在才是2018年,如果換成“2018 tjut”我相信應該會(huì )有更多的結果出現。但是我們要明白,這時(shí)搜索引擎關(guān)注的內容是網(wǎng)頁(yè)的正文。與之相對應的也有一個(gè)變體:“allintext:”,用法和上面的“allintitle”相似,這里就不做過(guò)多的介紹了。
3)inanchor(錨mao點(diǎn))
這個(gè)語(yǔ)法的意思是在頁(yè)面的鏈接錨點(diǎn)進(jìn)行搜索。
鏈接錨點(diǎn)指的是一個(gè)鏈接的描述文本,如這樣的一段HTML代碼:
<a href=https://www.baidu.com>百度</a>,鏈接的錨點(diǎn)就是“百度”了。
我們搜索“inanchor:YouTubeFacebook”就可以搜索到有那些含有錨點(diǎn)的網(wǎng)頁(yè)了,如下圖所示。當然,這個(gè)語(yǔ)法也有一個(gè)變體“allinanchor:”,意思也與前面的類(lèi)似。
這個(gè)語(yǔ)法是把搜索限制在站點(diǎn)域名之內。例如我們搜索“site:google.com”,結果如下圖所示,這里我們通常不需要加上前面的www,這樣搜索的結果就會(huì )是包括所有含有g(shù)oogle.com域名的有關(guān)內容,包括頂級域名和二級域名甚至三級域名的內容。也就是說(shuō)我們甚至可以通過(guò)搜索,確定google.com大概有多少個(gè)子域名!
inurl:會(huì )將搜索的范圍限制在URL或者網(wǎng)站的頁(yè)面上,這個(gè)語(yǔ)法對于查找搜索和幫助是很有用的,不僅適合我們普通的搜索,在黑客搜索中用處也很大。例如我們輸入“inurl:password”,結果如下圖所示,結果顯示了所有URL中含有password的網(wǎng)頁(yè)。另外,這個(gè)語(yǔ)法也有一個(gè)變體:“allinurl:”,用法與前面的相似。
注:“site:google.com –inurl:www.google.com”的意義【查詢(xún)谷歌有多少個(gè)子域名】
這個(gè)的功能是查詢(xún)所有鏈接到某個(gè)特定URL上的列表。要注意的是,是特定的URL頁(yè)面,如輸入:“l(fā)ink:www.baidu.com”進(jìn)行搜索,如下圖所示,就會(huì )返回所有鏈接到百度主頁(yè)的網(wǎng)頁(yè)了。因此,我們同樣可以指定特定的URL頁(yè)面來(lái)進(jìn)行搜索。
Cache可以幫助我們查找到google索引過(guò)的頁(yè)面副本,它最大的好處就是及時(shí)源文件界面不存在了,或者變成了其它的內容,我們依然可以搜索的到。例如輸入:“cache:www.baidu.com”,結果如下所示,可以看到,格式雖然亂糟糟的,但是依稀可以從中獲取一些有用的信息的。在國內的搜索引擎上,可能也有類(lèi)似的功能,比如百度的網(wǎng)頁(yè)快照,其功能與這個(gè)類(lèi)似。
filetype是指搜索指定后綴的文件。這個(gè)不太常用,但是在黑客領(lǐng)域有一定的作用。但是我們的重點(diǎn)是講解語(yǔ)法,如下圖所示,輸入“filetype:mdb”,結果就會(huì )顯示出一些網(wǎng)站的數據庫文件。
這個(gè)語(yǔ)法是用于搜索語(yǔ)某些頁(yè)面相關(guān)的網(wǎng)站的,可以輔助我們搜索同類(lèi)的頁(yè)面。比如我們輸入“related:www.google.com”,顯示的結果都是一些其他的搜索引擎。
這個(gè)語(yǔ)法可以搜索到關(guān)于一個(gè)URL的更多信息的頁(yè)面列表,這里的信息包括這個(gè)網(wǎng)頁(yè)的cache,還有與這個(gè)網(wǎng)頁(yè)相似的網(wǎng)頁(yè)等等,注意下面的英文信息就好。輸入“info:www.baidu.com”,結果如下圖所示。