Janet是一位投資人,由于AI技術(shù)迭代實(shí)在太快,她想通過AI來快速、準(zhǔn)確且全面的閱讀行業(yè)最新論文。她以蘋果最新模型ReALM論文為例,通過Claude 3做了演示,親測(cè)好用。
推特鏈接:
https://twitter.com/genie0309/status/1775218832883552408
其設(shè)計(jì)的提示詞如下:
我們來分析一下這段提示詞(見加粗部份):
1、“我是一個(gè)對(duì)xx感興趣的xx,但是沒有相關(guān)技術(shù)背景”(特別要提“沒有技術(shù)背景”),這符合我們之前分享的提示詞設(shè)計(jì)技巧「設(shè)定情境」,先給AI介紹你的背景和需求,這樣AI才能懂你。
然后,再介紹你的目的“我想請(qǐng)你幫我xx,以便xx”,讓AI知道你要的是什么。這些地方,均支持自定義,大家可根據(jù)自己的需求進(jìn)行修改。
2、7個(gè)方面給AI制定了閱讀框架,讓AI分別從研究目標(biāo)、新思路、實(shí)驗(yàn)、應(yīng)用、問題與挑戰(zhàn)、未來、不足、補(bǔ)充知識(shí)等角度進(jìn)行閱讀和輸出,并反復(fù)強(qiáng)調(diào)“請(qǐng)盡可能參考論文中的細(xì)節(jié)進(jìn)行分析”、“請(qǐng)引用關(guān)鍵數(shù)據(jù)加以說明”,這幾點(diǎn)提示很重要,它是壓制AI幻覺的關(guān)鍵提示詞。
3、“請(qǐng)用xx字對(duì)論文進(jìn)行解讀,在解讀過程中,請(qǐng)多引用論文中的細(xì)節(jié)內(nèi)容、關(guān)鍵數(shù)據(jù)和實(shí)驗(yàn)結(jié)果”,再次壓制AI幻覺,盡量讓AI的分析和輸出更多地來源于你的材料,而不是AI自己的邏輯。
4、“也請(qǐng)從xx角度,分析其給xx領(lǐng)域帶來的影響。如果論文中有一些技術(shù)概念我可能不太了解,也請(qǐng)給出通俗的解釋?!?strong>這里是對(duì)AI的拓展閱讀要求,是AI自己的思考,其生成的這部分回答,我們需要謹(jǐn)慎對(duì)待。建議結(jié)合自己的閱歷和專業(yè)知識(shí)進(jìn)行吸收,不能盲目全盤吸收。
5、6點(diǎn)輸出要求,這部分提示詞很好,在很多地方,大家可以直接使用。
效果真不錯(cuò)!非常全面,也基本準(zhǔn)確,語言通俗,非專業(yè)人士也能看懂,關(guān)鍵是很快。
過去我們要看論文,要么你有深厚的英語功底以及技術(shù)背景,直接讀原文;要么翻譯過來,讀譯稿;要么被迫去看一些自媒體的片段式解讀。現(xiàn)在通過AI輔助閱讀,閱讀效率和質(zhì)量都提升了許多。
這是用Claude 3(亞馬遜背景)來做的演示,那國(guó)內(nèi)的大模型呢?效果如何?我們先用最能打的Kimi來試下。
選取的主角,是近期登上PaperWithCode熱榜的多模態(tài)模型Mini-Gemini的論文,作者來自香港中文大學(xué)的終身教授賈佳亞團(tuán)隊(duì)。
有自媒體評(píng)論,這款視覺語言模型,可堪比GPT4+Dalle3的王炸組合,媲美Gemini Pro(詳見昨日文章)、GPT-4V。有這么神奇嗎?我們來一看究竟。
Kimi,你好,我是一個(gè)對(duì)人工智能技術(shù)特別感興趣的新媒體編輯,但是沒有相關(guān)的技術(shù)背景。我想請(qǐng)你幫我深入理解一篇最新發(fā)表的多模態(tài)模型研究論文,以便更好地把握該領(lǐng)域的技術(shù)發(fā)展。請(qǐng)從以下7個(gè)方面對(duì)論文進(jìn)行詳細(xì)解讀:
1、論文的研究目標(biāo)是什么?想要解決什么實(shí)際問題?這個(gè)問題對(duì)于AI行業(yè)發(fā)展有什么重要意義?
2、論文提出了哪些新的思路、方法或模型?跟現(xiàn)有的模型相比有什么特點(diǎn)和優(yōu)勢(shì)?請(qǐng)盡可能參考論文中的細(xì)節(jié)進(jìn)行分析。
3、論文通過什么實(shí)驗(yàn)來驗(yàn)證所提出模型的有效性?實(shí)驗(yàn)是如何設(shè)計(jì)的?實(shí)驗(yàn)數(shù)據(jù)和結(jié)果如何?請(qǐng)引用關(guān)鍵數(shù)據(jù)加以說明。
4、論文的研究成果將給AI行業(yè)帶來什么影響?有哪些潛在的應(yīng)用場(chǎng)景和商業(yè)機(jī)會(huì)?作為媒體人我應(yīng)該關(guān)注哪些方面?
5、未來在該研究方向上還有哪些值得進(jìn)一步探索的問題和挑戰(zhàn)?這可能催生出什么新的技術(shù)和商業(yè)機(jī)會(huì)?
6、從critical thinking的視角看,這篇論文還存在哪些不足及缺失?又有哪些需要進(jìn)一步驗(yàn)證和存疑的?
7、作為非技術(shù)背景的讀者,我應(yīng)該從這篇論文中學(xué)到什么,有哪些啟發(fā)?你認(rèn)為我還需要補(bǔ)充了解哪些背景知識(shí)?
請(qǐng)用1000-1500字左右的篇幅,對(duì)論文進(jìn)行深入解讀。在講述過程中,請(qǐng)多引用論文中的細(xì)節(jié)內(nèi)容、關(guān)鍵數(shù)據(jù)和實(shí)驗(yàn)結(jié)果,幫助我清楚地理解論文的創(chuàng)新性貢獻(xiàn)。同時(shí)也請(qǐng)從技術(shù)和商業(yè)的角度,分析其給人工智能領(lǐng)域和產(chǎn)業(yè)界帶來的影響。如果論文中有一些技術(shù)概念我可能不太了解,也請(qǐng)給出通俗的解釋。
在回答格式上,請(qǐng)注意以下幾點(diǎn):
1、用三級(jí)標(biāo)題對(duì)應(yīng)以上7個(gè)問題,清晰劃分不同部分。
2、使用Markdown格式,適當(dāng)加入列表、加粗等排版元素。
3、引用原文時(shí)請(qǐng)使用blockquote的引用格式。
4、關(guān)鍵術(shù)語首次出現(xiàn)時(shí)請(qǐng)加粗。
5、使用中文書寫,學(xué)術(shù)名詞可以用英文補(bǔ)充。
6、適當(dāng)插入圖表,幫助理解論文內(nèi)容。
謝謝!
還不錯(cuò),可以幫助我們快速理解Mini-Gemini模型的底層邏輯和亮點(diǎn),以及其為什么能夠媲美谷歌的Gemini 1.5 Pro。
Kimi總結(jié):
1)能夠懂用戶的提問,并提煉要點(diǎn)。盡管我發(fā)給Kimi的并非結(jié)構(gòu)化提示詞,但它還是理解到位了。
2)嚴(yán)格遵循論文材料做解讀,不自己亂聯(lián)想
3)表述偏學(xué)術(shù),語言高冷,AI味較濃,非專業(yè)人士理解起來有一定門檻。不過,我們可以通過提示詞技巧的「適當(dāng)引導(dǎo)」手法來解決這個(gè)問題,比如讓它用高中生能聽懂的語言來解釋。
文心總結(jié):
1)相比Kimi,語言要通俗化很多,作為新媒體小編的我讀起來無障礙。
2)不過,它會(huì)脫離論文材料,做其他聯(lián)想。7個(gè)問題中只有問題4是需要聯(lián)網(wǎng)的,其他問題都不應(yīng)該聯(lián)網(wǎng),可是文心一言在問題4、5、6、7的回答上都聯(lián)網(wǎng)或從它自己的數(shù)據(jù)庫(kù)里爬了信息。
3)穩(wěn)定性差。回答問題7時(shí),文心一言在補(bǔ)充知識(shí)1處卡了很久都不響應(yīng),直到我繼續(xù)發(fā)問后,才答復(fù)我。
4)又超綱了。我的要求是1000-1500字,這家伙又給我整了2500字。在我們多次測(cè)試中,這已經(jīng)屬于文心一言的常規(guī)操作了
通義總結(jié):
1)回答可用,但對(duì)用戶問題的理解與提煉還缺火候。
2)排版差,get不到Markdown格式。
3)未引用原文。這一點(diǎn),我對(duì)3家的表現(xiàn)都比較失望
最后,來看下訊飛星火。
訊飛總結(jié):
1)無法理解Markdown格式和排版,我就不為難它了。
2)與文心一樣,語言做了通俗化處理,便于用戶理解。
3)嚴(yán)格按照我的要求執(zhí)行,能做到這一步已經(jīng)非常了不起了。不信,你可以回頭去看看文心一言
從整體結(jié)果來講,各大模型反饋給我的回答,基本都能用(翻譯不差+能支持上下文,就可以用),沒有特別明顯偏離論文的。
關(guān)鍵還是在于要有好的提示詞,今天帶大家拆解了AI讀論文的提示詞,趕快去試試吧~
拓展閱讀:
聯(lián)系客服