开心六月综合激情婷婷|欧美精品成人动漫二区|国产中文字幕综合色|亚洲人在线成视频

    1. 
      
        <b id="zqfy3"><legend id="zqfy3"><fieldset id="zqfy3"></fieldset></legend></b>
          <ul id="zqfy3"></ul>
          <blockquote id="zqfy3"><strong id="zqfy3"><dfn id="zqfy3"></dfn></strong></blockquote>
          <blockquote id="zqfy3"><legend id="zqfy3"></legend></blockquote>
          打開APP
          userphoto
          未登錄

          開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

          開通VIP
          Gemini Deep Research效果怎么樣?

          文:王智遠(yuǎn) | ID:Z201440

          去年12月,谷歌推出了Gemini Deep Research。

          什么是Deep Research?它像一個(gè)AI助理一樣,輸入一個(gè)問題,它立馬能搜索、規(guī)劃、推理、最后形成一個(gè)報(bào)告。

          今年,它做了大升級(jí)。升級(jí)后能力凸顯在三方面:

          一,它能幫你把一個(gè)大問題拆成幾個(gè)小問題,一個(gè)一個(gè)解決;二,能從很多不同的地方找到信息,分析幾百個(gè)來源;三,特別快,幾分鐘就能做出一個(gè)詳細(xì)的報(bào)告,從計(jì)劃到總結(jié),全都有。而且,它還能處理45種以上的語(yǔ)言。

          官方說的是,目前免費(fèi)試用,我用免費(fèi)賬號(hào)折騰半天不行,后來去某寶租了一個(gè)Gemini Advanced 賬號(hào),一下子就能用了。

          體驗(yàn)地址是:https://gemini.google.com

          打開Gemini的網(wǎng)頁(yè),登錄后,你可以在左上角切換不同的模型,現(xiàn)在有五種。

          2.0 Flash 適合快速回答問題,處理簡(jiǎn)單任務(wù);2.0 Flash Thinking 能分析復(fù)雜問題;Personalization 會(huì)根據(jù)你的習(xí)慣調(diào)整回答;2.0 PRO(Experimental)是還在測(cè)試的高級(jí)版本,適合專業(yè)人士。

          最后說說,它的第五個(gè)能力:Deep Research。

          話不多說,直接在Gemini Deep Research 里輸入了一個(gè)問題:幫我寫一個(gè)關(guān)于 Gemini Deep Research 的深度研究報(bào)告。

          它很快給我擬定了一個(gè)方案。這個(gè)方案列出 7 條主要內(nèi)容。每一條都很清晰,具體是這樣的:

          第一條,先整理 Gemini Deep Research 的官方資料;第二條,會(huì)分析這個(gè)工具可以用在哪些場(chǎng)景,還有它的主要特點(diǎn)是什么。

          第三條,去找一些用戶對(duì)這個(gè)工具的評(píng)價(jià),看看大家用起來覺得哪里好、哪里不好;第四條,收集一些專業(yè)人士的測(cè)評(píng)和分析,看看專家們是怎么評(píng)價(jià)它的。

          第五條,它會(huì)找一些和 Gemini Deep Research 類似的工具,做一個(gè)對(duì)比,看看它在競(jìng)爭(zhēng)中有什么優(yōu)勢(shì)或者不足;第六條,研究一些實(shí)際使用過的案例,看看這個(gè)工具在解決實(shí)際問題時(shí)表現(xiàn)如何。

          最后一條,也就是第七條,它會(huì)深入探討這個(gè)工具的技術(shù)原理,評(píng)估數(shù)據(jù)是否可靠、準(zhǔn)確;同時(shí),它還會(huì)把工具放在更大的學(xué)術(shù)背景中,看看在整個(gè)領(lǐng)域里的水平如何,未來發(fā)展?jié)摿υ趺礃印?/span>

          方案列完后,它問我我:你覺得這個(gè)方案行不行?如果覺得沒問題,可以直接開始研究了。

          從整個(gè)研究結(jié)構(gòu)來看,它確實(shí)比我個(gè)人想得更全面。

          至少它不僅提供了背景資料,還給出優(yōu)劣勢(shì)分析、專業(yè)人士的測(cè)評(píng)、工具對(duì)比,以及最后在更大背景下的表現(xiàn)評(píng)估;所以,在我看來,這更像一份簡(jiǎn)單而完整的工具測(cè)評(píng)報(bào)告。

          我確認(rèn)方案后,它便開始了工作。

          一開始,它從 7 個(gè)網(wǎng)站中幫我查找資料,這些網(wǎng)站包括 ZDNet、YouTube.com、SearchEngineJournal、Google、播客,以及 WorkspaceUpdates.Google 等。

          這些網(wǎng)站可能會(huì)提供有關(guān) Google Gemini 的基礎(chǔ)信息、使用教程、新聞報(bào)道或者用戶支持等內(nèi)容。

          找資料過程中,我發(fā)現(xiàn)它把核心功能、關(guān)鍵特點(diǎn)、技術(shù)亮點(diǎn)都整理得清清楚楚。

          接著,它開始了下一步:

          從更多地方收集信息。它訪問了 Reddit、How-To Geek、SectionSchool、Google 的官方頁(yè)面,以及 SearchEngineJournal。

          我覺得,這些網(wǎng)站選擇,它主要為了獲取幾類不同信息。

          首先是用戶的討論和評(píng)價(jià)。它想看看大家實(shí)際用起來感覺怎么樣,我還隨機(jī)點(diǎn)開了幾個(gè) Reddit 頁(yè)面,發(fā)現(xiàn)它不僅抓取了博主寫的文章內(nèi)容,還提取了下面的評(píng)論。

          這些評(píng)論往往是用戶的真實(shí)感受,特別有參考價(jià)值。

          第二類是教程和學(xué)習(xí)資料。像 How-To Geek 和 SectionSchool 這樣的網(wǎng)站,會(huì)提供詳細(xì)的使用指南或者教學(xué)資源。

          第三類是官方信息;最后一類是專業(yè)分析和評(píng)價(jià)。SearchEngineJournal 這個(gè)網(wǎng)站專注于 SEO 和數(shù)字營(yíng)銷,上面有不少專業(yè)人士對(duì)工具的深入分析和評(píng)測(cè)。

          所以,我認(rèn)為,這一步,它想全面收集用戶反饋、專業(yè)解讀、使用教程和官方的公告;這樣的信息組合,確實(shí)能讓人從不同角度了解 Google Gemini。

          然后,它總結(jié)了三個(gè)重點(diǎn):

          它說:我看了用戶對(duì)產(chǎn)品的評(píng)價(jià),發(fā)現(xiàn)體驗(yàn)各不相同。大家普遍贊賞,工具能幫他們節(jié)省時(shí)間,快速了解主題或者寫個(gè)初步報(bào)告。

          不過,也有人擔(dān)心質(zhì)量問題,工具在判斷信息來源的可靠性上可能不夠好,有時(shí)候,生成的信息太泛泛,不夠深入。還有人提到,工具會(huì)突然中斷,導(dǎo)致研究失敗。

          在比較方面,它說,有些用戶把GEMINI Deep Research和Perplexity、DeepSeek做了對(duì)比。

          一些人認(rèn)為Perplexity在講故事和挖細(xì)節(jié)上做得更好,而DeepSeek的新模型在研究質(zhì)量和速度上表現(xiàn)最佳;甚至,ChatGPT在某些情況下能提供更高質(zhì)量的研究結(jié)果;這些比較顯示,Deep Research在某些方面可能還有提升的空間。

          通過這一步詳細(xì)拆解,我認(rèn)為細(xì)節(jié)對(duì)我?guī)椭艽蟆.吘?,別人對(duì)Deep Research的看法,是他們的本地知識(shí),這些有助于做商業(yè)分析用。

          第三步研究中,它開始尋找找更專業(yè)的知識(shí)。

          看了看它推薦的9個(gè)網(wǎng)站,發(fā)現(xiàn)網(wǎng)站和第二步里的不一樣。它們更關(guān)注怎么提高工作效率的工具、人工智能研究,還有戰(zhàn)略和市場(chǎng)分析這些內(nèi)容。

          看起來這些網(wǎng)站挺權(quán)威,里面有技術(shù)支持文檔、新聞博客、社交討論和專業(yè)教程,各種信息都有。

          我覺得,這些網(wǎng)站是對(duì)之前研究的一個(gè)補(bǔ)充,之前分析了好壞,現(xiàn)在要找更專業(yè)、更深入的信息。

          所以,它給我的結(jié)論是:Deep Research 功能很強(qiáng),但在準(zhǔn)確性上還得提高;還有,Gemini 2.0 的深度思考模型是個(gè)重要的升級(jí)。

          接下來第四步、第五步和第六步,步驟都差不多。它找的是些專業(yè)網(wǎng)站。它主要關(guān)注三個(gè)方面:

          • 專家怎么說,怎么評(píng)價(jià)

          • 看看實(shí)際用起來怎么樣,有沒有案例

          • 再深挖一下技術(shù)原理和數(shù)據(jù)來源

          這個(gè)過程,像從不同角度,找問題的答案和評(píng)價(jià)。

          它給出的結(jié)論也挺清楚。專家們覺得工具挺有潛力,特別是在升級(jí)到Gemini 2.0 Flash Thinking Experimental模型后,規(guī)劃、搜索、推理和報(bào)告的能力都提高了不少。

          專家們還說,它免費(fèi)對(duì)所有人開放,這在和ChatGPT這些競(jìng)爭(zhēng)對(duì)手比起來,是很大優(yōu)勢(shì)。不過,他們也指出了一些不足,比如:信息來源的可靠性、準(zhǔn)確性,還有避免生成不符合事實(shí)的內(nèi)容,這些地方還要改進(jìn)。

          但是,我個(gè)人有點(diǎn)遺憾的是,在實(shí)際案例這部分,它并沒有給出具體的應(yīng)用例子,只是提了幾個(gè)問題。

          比如:處理需要專業(yè)知識(shí)或最新信息的復(fù)雜主題時(shí),表現(xiàn)怎么樣?生成的報(bào)告準(zhǔn)不準(zhǔn)確、深入不深入、有沒有用?

          這些問題,它都沒有回答。

          還有,技術(shù)原理和數(shù)據(jù)來源這部分,也沒有給出清晰的對(duì)比。我點(diǎn)開它給的9個(gè)網(wǎng)站,發(fā)現(xiàn)確實(shí)有一些技術(shù)對(duì)比的內(nèi)容,但它沒有很好地展示這些信息,感覺有點(diǎn)匆忙。

          所以,我理解的是:后面步驟不夠細(xì)致,有些草率。

          可能因?yàn)槟芰€有局限,特別是專家分析、實(shí)際案例部分,它應(yīng)該做個(gè)表格,把幾者的對(duì)比都展示出來,這樣可以清楚地展示Gemini 2.0深度研究和其他深度研究能力上的對(duì)比,這樣更有說服力,也更容易理解。

          第七步是:學(xué)術(shù)信息收集。

          我注意到,它對(duì)學(xué)術(shù)研究特別感興趣,它搜了27個(gè)學(xué)術(shù)網(wǎng)站,想找些和深度研究有關(guān)的文獻(xiàn),還有AI在學(xué)術(shù)界的應(yīng)用信息。

          但是呢,最后得出的結(jié)論太匆忙了。簡(jiǎn)單說了兩句:開發(fā)團(tuán)隊(duì)訓(xùn)練的模型能很好地做計(jì)劃,還設(shè)計(jì)了個(gè)任務(wù)管理器;這些是大家一看就知道,我本來希望能看到更深入的研究結(jié)果。

          比如說:

          怎么讓模型更準(zhǔn)確?有哪些具體的改進(jìn)方法?需要哪些技術(shù)能力?甚至怎么優(yōu)化架構(gòu)等等。

          還有,做完學(xué)術(shù)信息收集后,它突然又來了一句:之前用工具時(shí)出了語(yǔ)法錯(cuò)誤,得修正一下,這樣才能拿到最新信息。

          這讓我覺得到,它在用搜索工具獲取信息時(shí),可能還有遺漏,不夠完善;換句話說,它的表現(xiàn)還不穩(wěn)定,甚至因?yàn)榧夹g(shù)上的小問題,影響了最后的結(jié)果質(zhì)量。

          最后,我下載了它生成的報(bào)告,一看整整 8700 字。

          不過,把不太重要的內(nèi)容去掉,最核心的部分是關(guān)于用戶體驗(yàn)和反饋。這部分它確實(shí)做得不錯(cuò),不僅做了深入研究,還詳細(xì)列出了優(yōu)點(diǎn)和缺點(diǎn),甚至還用表格進(jìn)行了對(duì)比,非常直觀。

          另一部分讓我比較欣賞的是,它把自家工具和其他人工智能研究工具做了詳細(xì)的對(duì)比分析;這部分內(nèi)容挺實(shí)用,能讓人清楚地看到它的優(yōu)勢(shì)和不足。

          至于技術(shù)分析和學(xué)術(shù)研究的部分,寫得有點(diǎn)太理論化了,像在堆砌術(shù)語(yǔ),實(shí)際參考價(jià)值不大,讀起來像“八股文”一樣枯燥。

          值得一提的是,8700 字的報(bào)告里,一共引用了28 個(gè)鏈接,而鏈接加起來差不多占了 1000 字的篇幅;如果除去這 1000 字,再加上報(bào)告開頭和結(jié)尾那些常規(guī)性的內(nèi)容,仔細(xì)算算,真正有價(jià)值的信息還能剩下多少呢?

          所以,要我評(píng)價(jià)的話,主要有三點(diǎn):

          一,和國(guó)內(nèi)的產(chǎn)品如 Kimi、Qwen、豆包、夸克相比,它絕對(duì)是領(lǐng)先的;它能生成這么長(zhǎng)的報(bào)告,還能調(diào)動(dòng)多種能力,從用戶體驗(yàn)上來說,國(guó)內(nèi)很多產(chǎn)品目前還做不到這一點(diǎn)。它的綜合表現(xiàn)確實(shí)更勝一籌。

          二,記憶能力和處理長(zhǎng)文本的能力還是很強(qiáng)的。相比之下,國(guó)內(nèi)一些產(chǎn)品在生成報(bào)告時(shí),后半部分會(huì)顯得比較隨意,有些草率。  

          當(dāng)然,Gemini 的深度搜索也存在類似的問題,但沒有國(guó)內(nèi)產(chǎn)品那么嚴(yán)重,整體表現(xiàn)依然更穩(wěn)定。

          第三,和 Manus 相比,它在工具調(diào)用方面還有不足。Manus 能生成 PDF,可視化能力也很強(qiáng)。Gemini 深度搜索在這方面就顯得遜色,它最多提供一個(gè)類似 Word 文檔的文件,里面帶一個(gè)非常簡(jiǎn)單的表格。

          在工具調(diào)用和功能擴(kuò)展上,Gemini 深度搜索顯然還有提升的空間。

          值得一提的是,Gemini 本周的密集更新,無疑讓它的地位在生態(tài)系統(tǒng)里變得更重要的,高頻的優(yōu)化和功能擴(kuò)展,也讓它在競(jìng)爭(zhēng)中占據(jù)了更有利的位置。

          今年是 Agent 元年,AI 在 TOC 領(lǐng)域的這波機(jī)會(huì),它自然不能錯(cuò)過;這種快加速,無疑也把壓力傳給了其他競(jìng)爭(zhēng)對(duì)手。

          ————
          這是我目前現(xiàn)有的三個(gè)產(chǎn)品:AI強(qiáng)壯手冊(cè)、磨稿知識(shí)庫(kù)、以及小生意知識(shí)庫(kù)。如果你在這些方面有任何困惑,可以隨時(shí)訂閱,里面全是個(gè)人經(jīng)驗(yàn)的沉淀,希望能幫到你。
          本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
          打開APP,閱讀全文并永久保存 查看更多類似文章
          猜你喜歡
          類似文章
          殺瘋了,谷歌的Deep Research也來了,免費(fèi)!
          OpenAI推出新功能:一款名為Deep Research的新AI工具
          號(hào)稱史上最強(qiáng)AI:Google Gemini AI 3種免費(fèi)使用方法??!
          Google深夜發(fā)o1挑戰(zhàn)OpenAI!實(shí)測(cè)快3倍,AI“高情商”回答成亮點(diǎn)
          互聯(lián)網(wǎng)世界的“人工智能”——探秘“深度學(xué)習(xí)”的前世今生
          【AI大咖】扒一下低調(diào)的Yoshua Bengio大神
          更多類似文章 >>
          生活服務(wù)
          分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
          綁定賬號(hào)成功
          后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
          如果VIP功能使用有故障,
          可點(diǎn)擊這里聯(lián)系客服!

          聯(lián)系客服