大年初二,邊鋒(化名)看到公司微信群里老板發(fā)了一條消息:“為什么沒(méi)有我們?”
他趕緊點(diǎn)開(kāi)看了一眼,之前從來(lái)不用AI大模型產(chǎn)品的老板用DeepSeek和豆包問(wèn)了與公司所在行業(yè)相關(guān)的問(wèn)題,并讓大模型推薦行業(yè)內(nèi)知名的公司,老板曬出了問(wèn)答截圖,但大模型的回答有競(jìng)品公司,沒(méi)有他們公司的信息。
邊鋒測(cè)試了其他大模型產(chǎn)品,有的就能顯示他們公司的信息,有的還能排在第一位。他把這些信息反饋給了老板,老板只回答了三個(gè)字:“多思考。”
春節(jié)假期之后,邊鋒的老板再次曬出DeepSeek的回答截圖,要求團(tuán)隊(duì)按照DeepSeek方案去做用戶(hù)增長(zhǎng)并更新了KPI。有同事委婉地向老板提出疑問(wèn),老板回應(yīng)了六個(gè)字:“你要被淘汰了。”
邊鋒的老板因?yàn)镈eepSeek的回答沒(méi)有他們公司而生氣,但也有商家因?yàn)樽约涸贒eepSeek的回答中排名靠前而高興,并利用DeepSeek的回答做起了營(yíng)銷(xiāo)。
「甲子光年」注意到,大模型產(chǎn)品的回答,尤其是DeepSeek的回答,正在被越來(lái)越多的人認(rèn)可,且已具有商業(yè)價(jià)值。
而邊鋒的老板看似離譜行為的背后,藏著一個(gè)真需求——AI搜索引擎優(yōu)化。
邊鋒所在的這家公司屬于傳統(tǒng)行業(yè),且是行業(yè)頭部公司,擁有較高的行業(yè)知名度。如果在傳統(tǒng)搜索引擎中搜索,只要正常做好SEO(搜索引擎優(yōu)化),搜索相關(guān)內(nèi)容都會(huì)出現(xiàn)該公司的信息。
但是,AI搜索的結(jié)果就不一定了。
1.AI搜索的邏輯變了
由于目前越來(lái)越多的大模型產(chǎn)品加入了聯(lián)網(wǎng)搜索功能,因此有聯(lián)網(wǎng)搜索功能的大模型產(chǎn)品(如ChatGPT、DeepSeek、Kimi、豆包等)和專(zhuān)門(mén)的AI搜索產(chǎn)品(Perplexity、夸克、秘塔AI搜索、納米AI搜索等)都屬于AI搜索的范疇。
此前,在《拆解SearchGPT后,我們發(fā)現(xiàn)了AI搜索的壁壘、突破和未來(lái)》一文中,我們?cè)f(shuō),AI搜索已經(jīng)不是傳統(tǒng)搜索。
為什么會(huì)這么說(shuō)?
AI搜索主要有檢索(Retrieval)和生成(Generation)兩個(gè)步驟。
如果你在大模型產(chǎn)品中打開(kāi)了聯(lián)網(wǎng)搜索模式再提問(wèn)的話(huà),你會(huì)發(fā)現(xiàn)它會(huì)先檢索了若干個(gè)網(wǎng)頁(yè),找到相關(guān)參考資料之后,再生成回答。
在檢索方面,AI搜索會(huì)接入傳統(tǒng)搜索引擎API,采用自建索引庫(kù),或使用新一代AI搜索引擎架構(gòu)。在檢索步驟里還有很多小步驟,比如意圖識(shí)別、問(wèn)題改寫(xiě)、檢索結(jié)果重排、獲取詳情內(nèi)容、內(nèi)容過(guò)濾、上下文增強(qiáng)等。
在生成方面,AI搜索就是根據(jù)用戶(hù)需求,基于檢索出來(lái)的內(nèi)容,通過(guò)不同的模型生成回答。
如果把檢索和生成比作備菜和炒菜的話(huà),那么接入傳統(tǒng)搜索引擎API的“備菜”方式是相對(duì)粗放的,而使用新的AI搜索引擎架構(gòu)的“備菜”的食材來(lái)源更有保障、質(zhì)量更高,配料、調(diào)味料也更加精細(xì),雖然最后“炒菜”的廚師是不同的大模型,經(jīng)驗(yàn)?zāi)芰τ懈哂械停皞洳恕蓖鶝Q定了最后菜品的口味。
博查AI搜索CTO翁柔瑩Eileen告訴「甲子光年」,新一代AI搜索引擎和傳統(tǒng)搜索引擎不同,它不再通過(guò)關(guān)鍵字密度和PageRank排序,而是通過(guò)混合檢索和語(yǔ)義排序,為大模型提供最需要的內(nèi)容。
第一階段,進(jìn)行向量+關(guān)鍵詞兩路混合檢索。通過(guò)向量關(guān)聯(lián),直接匹配用戶(hù)意圖,然后通過(guò)關(guān)鍵字搜索解決部分直接匹配的需求,之后召回結(jié)果進(jìn)行第一次排序。在這一層中,搜索引擎會(huì)沿用谷歌的EEAT原則(專(zhuān)業(yè)性、經(jīng)驗(yàn)、權(quán)威性、可信度),對(duì)信息源的權(quán)威性、原創(chuàng)性、邏輯性等進(jìn)行評(píng)分,增加內(nèi)容源的排序權(quán)重分。
第二階段,通過(guò)Semantic Reranker(語(yǔ)義重排器)進(jìn)行語(yǔ)義排序。基于用戶(hù)問(wèn)題與搜索結(jié)果的語(yǔ)義相關(guān)性進(jìn)行評(píng)分,并作為最終結(jié)果輸出給相關(guān)AI應(yīng)用中的大模型。由于Semantic Reranker與大模型都是基于Transformer架構(gòu),語(yǔ)義排序后的結(jié)果會(huì)更受大模型的“喜歡”,更加符合大模型生成內(nèi)容的需要。
“博查目前在做的就是專(zhuān)為AI設(shè)計(jì)的世界知識(shí)搜索引擎,是基于混合檢索和語(yǔ)義排序的新一代搜索引擎。”翁柔瑩Eileen說(shuō),“目前我們主要服務(wù)B端AI應(yīng)用廠(chǎng)商,承接著國(guó)內(nèi)AI應(yīng)用60%以上的聯(lián)網(wǎng)搜索請(qǐng)求。”
AI搜索邏輯變了,就會(huì)導(dǎo)致即使是同一個(gè)用戶(hù)用同樣的問(wèn)題,問(wèn)不同AI搜索產(chǎn)品,也會(huì)得出不一樣的結(jié)果。更不用說(shuō)不同用戶(hù)去問(wèn)了。
這就可以解釋前文那位老板的困惑。
那么SEO對(duì)于AI搜索還有用嗎?
傳統(tǒng)搜索引擎支持的是關(guān)鍵字搜索,SEO的核心是通過(guò)關(guān)鍵字密度、鏈接權(quán)重、頁(yè)面結(jié)構(gòu)等技術(shù)手段影響網(wǎng)頁(yè)位置,希望可以獲得更高的競(jìng)價(jià)排名。
而在AI搜索產(chǎn)品中,用戶(hù)搜索方式轉(zhuǎn)變?yōu)槭褂米匀徽Z(yǔ)言提問(wèn),必須使用新的AI搜索引擎架構(gòu)來(lái)滿(mǎn)足用戶(hù)需求,這就會(huì)帶來(lái)變化。“學(xué)術(shù)論文、權(quán)威機(jī)構(gòu)網(wǎng)站的內(nèi)容權(quán)重更高,低質(zhì)量、過(guò)度優(yōu)化或AI生成的SEO內(nèi)容可能被判定為‘噪聲’而過(guò)濾。”翁柔瑩Eileen說(shuō)。
總結(jié)來(lái)說(shuō),如果相關(guān)AI搜索產(chǎn)品是直接接入傳統(tǒng)搜索引擎API的話(huà),SEO還會(huì)有一定作用;隨著越來(lái)越多的AI搜索產(chǎn)品使用新一代AI搜索引擎,SEO的作用將會(huì)逐漸下降。
但這并不意味著整體SEO市場(chǎng)已死。
市場(chǎng)研究機(jī)構(gòu)Research and Markets數(shù)據(jù)顯示,2024年全球SEO市場(chǎng)規(guī)模為891億美元,預(yù)計(jì)到2030年將達(dá)到1439億美元,2024年至2030年的復(fù)合年均增長(zhǎng)率(CAGR)為 8.3%。
不過(guò),AI搜索SEO是一個(gè)客觀(guān)存在的需求,且隨著DeepSeek的火熱,需求被逐漸放大,這種需求不容忽視。
有人想到了方法——GEO。
2.GEO有效果嗎?
2024年6月,來(lái)自印度理工學(xué)院德里分校、普林斯頓大學(xué)的學(xué)者和一些獨(dú)立研究者在arXiv上發(fā)表了論文《GEO: Generative Engine Optimization(生成引擎優(yōu)化)》,提出了GEO(生成引擎優(yōu)化)概念、 框架及相關(guān)的實(shí)驗(yàn)設(shè)計(jì)。
這篇論文介紹,大模型的出現(xiàn)帶來(lái)了搜索引擎的新范式,這些搜索引擎利用生成式模型收集和總結(jié)信息以回答用戶(hù)的查詢(xún)。這一新興技術(shù),論文作者在統(tǒng)一的框架下稱(chēng)之為生成引擎(Generative Engines)。
雖然生成引擎顯著提高了用戶(hù)效率和相關(guān)產(chǎn)品的流量,但它給第三方利益相關(guān)者——網(wǎng)站和內(nèi)容創(chuàng)作者帶來(lái)了巨大的挑戰(zhàn)。由于生成引擎具有黑箱性質(zhì)且變化迅速,內(nèi)容創(chuàng)作者幾乎無(wú)法控制他們的內(nèi)容何時(shí)以及如何被展示。隨著生成引擎的普及,論文作者認(rèn)為,必須確保創(chuàng)作者經(jīng)濟(jì)不被邊緣化。
因此,這篇論文提出了GEO,這是第一個(gè)幫助內(nèi)容創(chuàng)作者提高其內(nèi)容在生成引擎響應(yīng)中可見(jiàn)度的新型框架。作者認(rèn)為,設(shè)計(jì)得當(dāng)?shù)腉EO方法相當(dāng)于一個(gè)黑箱優(yōu)化方法,它可以在不知道生成引擎的具體算法設(shè)計(jì)的情況下,提升相關(guān)網(wǎng)站的可見(jiàn)性。
論文中提出了9種方法:
權(quán)威性(Authoritative):將源內(nèi)容的文本風(fēng)格修改為更具說(shuō)服力和權(quán)威性。
增加統(tǒng)計(jì)數(shù)據(jù)(Statistics Addition):在可能的情況下,用定量統(tǒng)計(jì)數(shù)據(jù)替代定性討論。
關(guān)鍵詞堆砌(Keyword Stuffing):在內(nèi)容中加入更多來(lái)自查詢(xún)的關(guān)鍵詞,這也是經(jīng)典的SEO優(yōu)化方法。
引用來(lái)源(Cite Sources):標(biāo)注相關(guān)內(nèi)容的來(lái)源。
添加引語(yǔ)(Quotation Addition):從可信來(lái)源添加相關(guān)的引用語(yǔ)。
易于理解(Easy-to-Understand):簡(jiǎn)化網(wǎng)站的語(yǔ)言表達(dá)。
優(yōu)化流暢度(Fluency Optimization):改善網(wǎng)站文本的流暢度。
獨(dú)特詞匯(Unique Words):在可能的地方加入獨(dú)特的詞匯。
技術(shù)術(shù)語(yǔ)(Technical Terms):在內(nèi)容中加入更多的技術(shù)術(shù)語(yǔ)。
由于目前沒(méi)有公開(kāi)可用的包含生成引擎相關(guān)查詢(xún)的數(shù)據(jù)集,論文作者推出了一個(gè)名為GEO-bench的基準(zhǔn)測(cè)試。這是一個(gè)涵蓋多個(gè)領(lǐng)域和相關(guān)網(wǎng)頁(yè)來(lái)源的大規(guī)模基準(zhǔn)測(cè)試,用于評(píng)估不同用戶(hù)查詢(xún)。
測(cè)試發(fā)現(xiàn),關(guān)鍵詞堆砌和獨(dú)特詞匯的方法沒(méi)有效果,其他方式都有效果,其中添加引語(yǔ)和增加統(tǒng)計(jì)數(shù)據(jù)的方式效果最好。
論文中還呈現(xiàn)了GEO方法的定性分析,包含了引用來(lái)源、增加統(tǒng)計(jì)數(shù)據(jù)、權(quán)威性這三種方法的示例,展示了GEO方法如何在最小變動(dòng)的情況下提升源網(wǎng)站內(nèi)容的可見(jiàn)性。
示例一,引用來(lái)源。僅僅添加聲明的來(lái)源就可以顯著提升最終答案的可見(jiàn)性。
示例二,增加統(tǒng)計(jì)數(shù)據(jù)。添加相關(guān)統(tǒng)計(jì)數(shù)據(jù)可以確保在最終生成引擎的響應(yīng)中提升來(lái)源的可見(jiàn)性。
示例三,權(quán)威性。僅僅強(qiáng)調(diào)文本的某些部分,并使用說(shuō)服性的文本風(fēng)格也可以提升可見(jiàn)性。
論文指出,通過(guò)嚴(yán)格的評(píng)估,GEO可以將內(nèi)容在生成引擎響應(yīng)中的可見(jiàn)度提升多達(dá)40%。
不過(guò),論文作者也承認(rèn),GEO也存在一定局限性。隨著生成式引擎的演變,這些方法可能需要隨著時(shí)間的推移進(jìn)行適應(yīng)性調(diào)整,這與SEO的演變類(lèi)似。GEO方法所做出的改變是針對(duì)文本內(nèi)容的針對(duì)性改變,與SEO方法有一定相似性,但不會(huì)影響其他元數(shù)據(jù),例如域名、反向鏈接等,因此它們不太可能影響搜索引擎的排名。
「甲子光年」注意到,GEO相比SEO更加注重內(nèi)容的與用戶(hù)問(wèn)題的語(yǔ)義相關(guān)性,符合EEAT原則的內(nèi)容質(zhì)量依然很重要。
翁柔瑩Eileen認(rèn)為,企業(yè)通過(guò)做GEO來(lái)提高內(nèi)容的質(zhì)量,相較于傳統(tǒng)搜索引擎的SEO成本更低,也更加容易,新一代AI搜索引擎將不再是通過(guò)廣告競(jìng)價(jià)排名機(jī)制來(lái)破壞用戶(hù)體驗(yàn),更有可能是通過(guò)優(yōu)質(zhì)內(nèi)容獲得曝光度,甚至直接獲得分潤(rùn)。
“企業(yè)的GEO策略需要從‘關(guān)鍵詞優(yōu)化’轉(zhuǎn)向‘知識(shí)庫(kù)建設(shè)’,可以構(gòu)建高質(zhì)量、結(jié)構(gòu)化、多模態(tài)的知識(shí)庫(kù),如技術(shù)白皮書(shū)、案例研究,去提升推廣內(nèi)容被模型引用的概率。”翁柔瑩Eileen告訴「甲子光年」。
大模型知識(shí)庫(kù)旨在通過(guò)深度學(xué)習(xí)和自然語(yǔ)言處理技術(shù),自動(dòng)化地存儲(chǔ)、管理和檢索大量信息。隨著大模型的快速發(fā)展,結(jié)合知識(shí)庫(kù)的應(yīng)用成為提升信息檢索和問(wèn)答系統(tǒng)性能的重要方向。
3.我們與信息的距離
AI搜索主要有檢索(Retrieval)和生成(Generation)兩個(gè)步驟,如果在兩個(gè)步驟之外再加上推薦(Recommendation)呢?
2024年12月,在火山引擎冬季Force原動(dòng)力大會(huì)上,火山引擎推出全域AI搜索,通過(guò)場(chǎng)景化搜索推薦一體化服務(wù)、企業(yè)私域信息整合服務(wù)、聯(lián)網(wǎng)問(wèn)答服務(wù),將企業(yè)的信息、業(yè)務(wù)和用戶(hù)需求緊密結(jié)合,幫助企業(yè)實(shí)現(xiàn)“發(fā)現(xiàn)更多,推薦更準(zhǔn),搜索無(wú)限可能”。
AI搜推引擎的應(yīng)用場(chǎng)景中,最典型的是電商零售場(chǎng)景。用戶(hù)可以在大模型產(chǎn)品聊天對(duì)話(huà)框上傳一張場(chǎng)景照片,讓AI推薦一些“在這拍照能出片的服裝搭配”。
用戶(hù)也可以更詳細(xì)地描述需求,例如:“我正在尋找完美的滑雪板。在冬季,我主要會(huì)在北海道滑雪,每月大約兩次。我喜歡平整的滑道,但也希望有一塊能夠偶爾應(yīng)對(duì)新鮮粉雪的滑雪板……”O(jiān)penAI全新的Agent(智能體)deep research就可以給出極為專(zhuān)業(yè)的滑雪用具推薦。
AI搜推引擎可以廣泛覆蓋多種應(yīng)用場(chǎng)景,在電商零售場(chǎng)景之外,還有企業(yè)信息檢索、媒體內(nèi)容推送、本地生活服務(wù)、游戲、教育等。
火山引擎智能算法負(fù)責(zé)人吳迪告訴「甲子光年」,搜索和推薦此前在產(chǎn)品層面是比較割裂的,通過(guò)傳統(tǒng)搜索引擎搜索東西,推薦的可能并不太符合用戶(hù)需要。而推薦又主要根據(jù)用戶(hù)的興趣、行為,用戶(hù)的主動(dòng)表達(dá)沒(méi)有很好兼顧,“從現(xiàn)在開(kāi)始,AI搜索推薦將會(huì)真正被緊密地融合在一起。”
「甲子光年」了解到,火山AI搜索推薦引擎是用Agent-base搜推統(tǒng)一的框架對(duì)混合模型進(jìn)行端到端、輕量、靈活編排調(diào)度,具有開(kāi)放的可擴(kuò)展功能。
“團(tuán)隊(duì)也在技術(shù)和算法上面投入了很大的力量,讓推薦模型能夠?qū)ontext(上下文)的理解更加深入。” 吳迪說(shuō), “強(qiáng)大的AI搜索加強(qiáng)大的AI推薦,可以形成1+1>2的效果。”
「甲子光年」認(rèn)為,從表面上來(lái)看,AI搜推引擎可以幫助企業(yè)應(yīng)對(duì)信息獲取和搜索推薦的挑戰(zhàn),但在更深維度,它其實(shí)是在拉近人與信息之間的距離。
AI搜索的邏輯變了,但沒(méi)有變的是大家對(duì)有價(jià)值、更精準(zhǔn)信息的需求,這種需求在DeepSeek出圈后更加旺盛了,標(biāo)準(zhǔn)也更高了,無(wú)論是從技術(shù)角度還是從營(yíng)銷(xiāo)角度,AI搜索及相關(guān)的SEO、GEO都值得重新思考和創(chuàng)新。
*王藝對(duì)本文亦有貢獻(xiàn)
**應(yīng)受訪(fǎng)者要求,邊鋒為化名