Gemini Deep Research效果怎么樣？

文：王智遠(yuǎn) | ID:Z201440

去年12月，谷歌推出了Gemini Deep Research。

什么是Deep Research？它像一個(gè)AI助理一樣，輸入一個(gè)問題，它立馬能搜索、規(guī)劃、推理、最后形成一個(gè)報(bào)告。

今年，它做了大升級(jí)。升級(jí)后能力凸顯在三方面：

一，它能幫你把一個(gè)大問題拆成幾個(gè)小問題，一個(gè)一個(gè)解決；二，能從很多不同的地方找到信息，分析幾百個(gè)來源；三，特別快，幾分鐘就能做出一個(gè)詳細(xì)的報(bào)告，從計(jì)劃到總結(jié)，全都有。而且，它還能處理45種以上的語(yǔ)言。

官方說的是，目前免費(fèi)試用，我用免費(fèi)賬號(hào)折騰半天不行，后來去某寶租了一個(gè)Gemini Advanced 賬號(hào)，一下子就能用了。

體驗(yàn)地址是：https://gemini.google.com

打開Gemini的網(wǎng)頁(yè)，登錄后，你可以在左上角切換不同的模型，現(xiàn)在有五種。

2.0 Flash 適合快速回答問題，處理簡(jiǎn)單任務(wù)；2.0 Flash Thinking 能分析復(fù)雜問題；Personalization 會(huì)根據(jù)你的習(xí)慣調(diào)整回答；2.0 PRO（Experimental）是還在測(cè)試的高級(jí)版本，適合專業(yè)人士。

最后說說，它的第五個(gè)能力：Deep Research。

話不多說，直接在Gemini Deep Research 里輸入了一個(gè)問題：幫我寫一個(gè)關(guān)于 Gemini Deep Research 的深度研究報(bào)告。

它很快給我擬定了一個(gè)方案。這個(gè)方案列出 7 條主要內(nèi)容。每一條都很清晰，具體是這樣的：

第一條，先整理 Gemini Deep Research 的官方資料；第二條，會(huì)分析這個(gè)工具可以用在哪些場(chǎng)景，還有它的主要特點(diǎn)是什么。

第三條，去找一些用戶對(duì)這個(gè)工具的評(píng)價(jià)，看看大家用起來覺得哪里好、哪里不好；第四條，收集一些專業(yè)人士的測(cè)評(píng)和分析，看看專家們是怎么評(píng)價(jià)它的。

第五條，它會(huì)找一些和 Gemini Deep Research 類似的工具，做一個(gè)對(duì)比，看看它在競(jìng)爭(zhēng)中有什么優(yōu)勢(shì)或者不足；第六條，研究一些實(shí)際使用過的案例，看看這個(gè)工具在解決實(shí)際問題時(shí)表現(xiàn)如何。

最后一條，也就是第七條，它會(huì)深入探討這個(gè)工具的技術(shù)原理，評(píng)估數(shù)據(jù)是否可靠、準(zhǔn)確；同時(shí)，它還會(huì)把工具放在更大的學(xué)術(shù)背景中，看看在整個(gè)領(lǐng)域里的水平如何，未來發(fā)展?jié)摿υ趺礃印?/span>

方案列完后，它問我我：你覺得這個(gè)方案行不行？如果覺得沒問題，可以直接開始研究了。

從整個(gè)研究結(jié)構(gòu)來看，它確實(shí)比我個(gè)人想得更全面。

至少它不僅提供了背景資料，還給出優(yōu)劣勢(shì)分析、專業(yè)人士的測(cè)評(píng)、工具對(duì)比，以及最后在更大背景下的表現(xiàn)評(píng)估；所以，在我看來，這更像一份簡(jiǎn)單而完整的工具測(cè)評(píng)報(bào)告。

我確認(rèn)方案后，它便開始了工作。

一開始，它從 7 個(gè)網(wǎng)站中幫我查找資料，這些網(wǎng)站包括 ZDNet、YouTube.com、SearchEngineJournal、Google、播客，以及 WorkspaceUpdates.Google 等。

這些網(wǎng)站可能會(huì)提供有關(guān) Google Gemini 的基礎(chǔ)信息、使用教程、新聞報(bào)道或者用戶支持等內(nèi)容。

找資料過程中，我發(fā)現(xiàn)它把核心功能、關(guān)鍵特點(diǎn)、技術(shù)亮點(diǎn)都整理得清清楚楚。

接著，它開始了下一步：

從更多地方收集信息。它訪問了 Reddit、How-To Geek、SectionSchool、Google 的官方頁(yè)面，以及 SearchEngineJournal。

我覺得，這些網(wǎng)站選擇，它主要為了獲取幾類不同信息。

首先是用戶的討論和評(píng)價(jià)。它想看看大家實(shí)際用起來感覺怎么樣，我還隨機(jī)點(diǎn)開了幾個(gè) Reddit 頁(yè)面，發(fā)現(xiàn)它不僅抓取了博主寫的文章內(nèi)容，還提取了下面的評(píng)論。

這些評(píng)論往往是用戶的真實(shí)感受，特別有參考價(jià)值。

第二類是教程和學(xué)習(xí)資料。像 How-To Geek 和 SectionSchool 這樣的網(wǎng)站，會(huì)提供詳細(xì)的使用指南或者教學(xué)資源。

第三類是官方信息；最后一類是專業(yè)分析和評(píng)價(jià)。SearchEngineJournal 這個(gè)網(wǎng)站專注于 SEO 和數(shù)字營(yíng)銷，上面有不少專業(yè)人士對(duì)工具的深入分析和評(píng)測(cè)。

所以，我認(rèn)為，這一步，它想全面收集用戶反饋、專業(yè)解讀、使用教程和官方的公告；這樣的信息組合，確實(shí)能讓人從不同角度了解 Google Gemini。

然后，它總結(jié)了三個(gè)重點(diǎn)：

它說：我看了用戶對(duì)產(chǎn)品的評(píng)價(jià)，發(fā)現(xiàn)體驗(yàn)各不相同。大家普遍贊賞，工具能幫他們節(jié)省時(shí)間，快速了解主題或者寫個(gè)初步報(bào)告。

不過，也有人擔(dān)心質(zhì)量問題，工具在判斷信息來源的可靠性上可能不夠好，有時(shí)候，生成的信息太泛泛，不夠深入。還有人提到，工具會(huì)突然中斷，導(dǎo)致研究失敗。

在比較方面，它說，有些用戶把GEMINI Deep Research和Perplexity、DeepSeek做了對(duì)比。

一些人認(rèn)為Perplexity在講故事和挖細(xì)節(jié)上做得更好，而DeepSeek的新模型在研究質(zhì)量和速度上表現(xiàn)最佳；甚至，ChatGPT在某些情況下能提供更高質(zhì)量的研究結(jié)果；這些比較顯示，Deep Research在某些方面可能還有提升的空間。

通過這一步詳細(xì)拆解，我認(rèn)為細(xì)節(jié)對(duì)我?guī)椭艽蟆．吘?，別人對(duì)Deep Research的看法，是他們的本地知識(shí)，這些有助于做商業(yè)分析用。

第三步研究中，它開始尋找找更專業(yè)的知識(shí)。

看了看它推薦的9個(gè)網(wǎng)站，發(fā)現(xiàn)網(wǎng)站和第二步里的不一樣。它們更關(guān)注怎么提高工作效率的工具、人工智能研究，還有戰(zhàn)略和市場(chǎng)分析這些內(nèi)容。

看起來這些網(wǎng)站挺權(quán)威，里面有技術(shù)支持文檔、新聞博客、社交討論和專業(yè)教程，各種信息都有。

我覺得，這些網(wǎng)站是對(duì)之前研究的一個(gè)補(bǔ)充，之前分析了好壞，現(xiàn)在要找更專業(yè)、更深入的信息。

所以，它給我的結(jié)論是：Deep Research 功能很強(qiáng)，但在準(zhǔn)確性上還得提高；還有，Gemini 2.0 的深度思考模型是個(gè)重要的升級(jí)。

接下來第四步、第五步和第六步，步驟都差不多。它找的是些專業(yè)網(wǎng)站。它主要關(guān)注三個(gè)方面：

專家怎么說，怎么評(píng)價(jià)
看看實(shí)際用起來怎么樣，有沒有案例
再深挖一下技術(shù)原理和數(shù)據(jù)來源

這個(gè)過程，像從不同角度，找問題的答案和評(píng)價(jià)。

它給出的結(jié)論也挺清楚。專家們覺得工具挺有潛力，特別是在升級(jí)到Gemini 2.0 Flash Thinking Experimental模型后，規(guī)劃、搜索、推理和報(bào)告的能力都提高了不少。

專家們還說，它免費(fèi)對(duì)所有人開放，這在和ChatGPT這些競(jìng)爭(zhēng)對(duì)手比起來，是很大優(yōu)勢(shì)。不過，他們也指出了一些不足，比如：信息來源的可靠性、準(zhǔn)確性，還有避免生成不符合事實(shí)的內(nèi)容，這些地方還要改進(jìn)。

但是，我個(gè)人有點(diǎn)遺憾的是，在實(shí)際案例這部分，它并沒有給出具體的應(yīng)用例子，只是提了幾個(gè)問題。

比如：處理需要專業(yè)知識(shí)或最新信息的復(fù)雜主題時(shí)，表現(xiàn)怎么樣？生成的報(bào)告準(zhǔn)不準(zhǔn)確、深入不深入、有沒有用？

這些問題，它都沒有回答。

還有，技術(shù)原理和數(shù)據(jù)來源這部分，也沒有給出清晰的對(duì)比。我點(diǎn)開它給的9個(gè)網(wǎng)站，發(fā)現(xiàn)確實(shí)有一些技術(shù)對(duì)比的內(nèi)容，但它沒有很好地展示這些信息，感覺有點(diǎn)匆忙。

所以，我理解的是：后面步驟不夠細(xì)致，有些草率。

可能因?yàn)槟芰€有局限，特別是專家分析、實(shí)際案例部分，它應(yīng)該做個(gè)表格，把幾者的對(duì)比都展示出來，這樣可以清楚地展示Gemini 2.0深度研究和其他深度研究能力上的對(duì)比，這樣更有說服力，也更容易理解。

第七步是：學(xué)術(shù)信息收集。

我注意到，它對(duì)學(xué)術(shù)研究特別感興趣，它搜了27個(gè)學(xué)術(shù)網(wǎng)站，想找些和深度研究有關(guān)的文獻(xiàn)，還有AI在學(xué)術(shù)界的應(yīng)用信息。

但是呢，最后得出的結(jié)論太匆忙了。簡(jiǎn)單說了兩句：開發(fā)團(tuán)隊(duì)訓(xùn)練的模型能很好地做計(jì)劃，還設(shè)計(jì)了個(gè)任務(wù)管理器；這些是大家一看就知道，我本來希望能看到更深入的研究結(jié)果。

比如說：

怎么讓模型更準(zhǔn)確？有哪些具體的改進(jìn)方法？需要哪些技術(shù)能力？甚至怎么優(yōu)化架構(gòu)等等。

還有，做完學(xué)術(shù)信息收集后，它突然又來了一句：之前用工具時(shí)出了語(yǔ)法錯(cuò)誤，得修正一下，這樣才能拿到最新信息。

這讓我覺得到，它在用搜索工具獲取信息時(shí)，可能還有遺漏，不夠完善；換句話說，它的表現(xiàn)還不穩(wěn)定，甚至因?yàn)榧夹g(shù)上的小問題，影響了最后的結(jié)果質(zhì)量。

最后，我下載了它生成的報(bào)告，一看整整 8700 字。

不過，把不太重要的內(nèi)容去掉，最核心的部分是關(guān)于用戶體驗(yàn)和反饋。這部分它確實(shí)做得不錯(cuò)，不僅做了深入研究，還詳細(xì)列出了優(yōu)點(diǎn)和缺點(diǎn)，甚至還用表格進(jìn)行了對(duì)比，非常直觀。

另一部分讓我比較欣賞的是，它把自家工具和其他人工智能研究工具做了詳細(xì)的對(duì)比分析；這部分內(nèi)容挺實(shí)用，能讓人清楚地看到它的優(yōu)勢(shì)和不足。

至于技術(shù)分析和學(xué)術(shù)研究的部分，寫得有點(diǎn)太理論化了，像在堆砌術(shù)語(yǔ)，實(shí)際參考價(jià)值不大，讀起來像“八股文”一樣枯燥。

值得一提的是，8700 字的報(bào)告里，一共引用了28 個(gè)鏈接，而鏈接加起來差不多占了 1000 字的篇幅；如果除去這 1000 字，再加上報(bào)告開頭和結(jié)尾那些常規(guī)性的內(nèi)容，仔細(xì)算算，真正有價(jià)值的信息還能剩下多少呢？

所以，要我評(píng)價(jià)的話，主要有三點(diǎn)：

一，和國(guó)內(nèi)的產(chǎn)品如 Kimi、Qwen、豆包、夸克相比，它絕對(duì)是領(lǐng)先的；它能生成這么長(zhǎng)的報(bào)告，還能調(diào)動(dòng)多種能力，從用戶體驗(yàn)上來說，國(guó)內(nèi)很多產(chǎn)品目前還做不到這一點(diǎn)。它的綜合表現(xiàn)確實(shí)更勝一籌。

二，記憶能力和處理長(zhǎng)文本的能力還是很強(qiáng)的。相比之下，國(guó)內(nèi)一些產(chǎn)品在生成報(bào)告時(shí)，后半部分會(huì)顯得比較隨意，有些草率。

當(dāng)然，Gemini 的深度搜索也存在類似的問題，但沒有國(guó)內(nèi)產(chǎn)品那么嚴(yán)重，整體表現(xiàn)依然更穩(wěn)定。

第三，和 Manus 相比，它在工具調(diào)用方面還有不足。Manus 能生成 PDF，可視化能力也很強(qiáng)。Gemini 深度搜索在這方面就顯得遜色，它最多提供一個(gè)類似 Word 文檔的文件，里面帶一個(gè)非常簡(jiǎn)單的表格。

在工具調(diào)用和功能擴(kuò)展上，Gemini 深度搜索顯然還有提升的空間。

值得一提的是，Gemini 本周的密集更新，無疑讓它的地位在生態(tài)系統(tǒng)里變得更重要的，高頻的優(yōu)化和功能擴(kuò)展，也讓它在競(jìng)爭(zhēng)中占據(jù)了更有利的位置。

今年是 Agent 元年，AI 在 TOC 領(lǐng)域的這波機(jī)會(huì)，它自然不能錯(cuò)過；這種快加速，無疑也把壓力傳給了其他競(jìng)爭(zhēng)對(duì)手。

————

這是我目前現(xiàn)有的三個(gè)產(chǎn)品：AI強(qiáng)壯手冊(cè)、磨稿知識(shí)庫(kù)、以及小生意知識(shí)庫(kù)。如果你在這些方面有任何困惑，可以隨時(shí)訂閱，里面全是個(gè)人經(jīng)驗(yàn)的沉淀，希望能幫到你。

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

开心六月综合激情婷婷|欧美精品成人动漫二区|国产中文字幕综合色|亚洲人在线成视频