DeepSeek和豆包根本不是一個(gè)維度產(chǎn)品

DeepSeek肯定是優(yōu)秀的，在大語言模型領(lǐng)域在全球是極其優(yōu)秀的，但是DeepSeek和豆包在模型結(jié)構(gòu)、算力需求、推理效率等參數(shù)方面都是不同的，DeepSeek屬于大語言模型，豆包屬于多模態(tài)大模型，在大語言模型基礎(chǔ)上，融合了圖片、音頻、視頻等多種模態(tài)。

DeepSeek V3暫無多模態(tài)生成能力?！八惴▋?yōu)化—成本下降—滲透率提升—強(qiáng)化訓(xùn)推投入”正向反饋持續(xù)。算法優(yōu)化后，相同的訓(xùn)練算力投入，能進(jìn)行更多模型開發(fā)嘗試，加速模型能力的提升，帶動(dòng)應(yīng)用爆發(fā)，推理算力爆發(fā)，模型廠商的ROI提升，會(huì)維持算力投入強(qiáng)度。

算力需求方面，DeepSeek v3為例，通過減少激活參數(shù)、降低精度（從16位變?yōu)?位）等優(yōu)化手段減少算力消耗；而R1版本在v3基礎(chǔ)上投入大量算力增強(qiáng)推理能力。豆包：涉及多模態(tài)訓(xùn)練和應(yīng)用，對(duì)算力底座要求更高，不僅要支持大規(guī)模訓(xùn)練任務(wù)，還要確保端側(cè)應(yīng)用的實(shí)時(shí)性和高效性。

DeepSeek V3 671B，使用2048塊H800訓(xùn)練2個(gè)月。2048塊H800并非全部訓(xùn)練算力投入，這里不包括DeepSeek R1模型（對(duì)標(biāo)OpenAI o1）生成的高質(zhì)量數(shù)據(jù)消耗的算力，不包括模型架構(gòu)的探索調(diào)試階段消耗的算力。

推理效率方面，DeepSeek-R1通過強(qiáng)化學(xué)習(xí)飛輪效應(yīng)，顯著提升了推理效率。豆包采用稀疏MoE架構(gòu)，實(shí)現(xiàn)了訓(xùn)練和推理效率的雙重優(yōu)化。

使用成本方面，DeepSeek：DeepSeek-R1的API使用成本為100萬tokens輸出需16元。豆包1.5Pro處理100萬tokens僅需0.8元，使用成本極低。

開源特性方面，DeepSeek-R1開源了大量模型和訓(xùn)練細(xì)節(jié)，為開發(fā)者提供了更多創(chuàng)新空間。豆包未明確開源，但自主數(shù)據(jù)生產(chǎn)體系和高效模型結(jié)構(gòu)獲得廣泛認(rèn)可。

如果二級(jí)市場(chǎng)看，DeepSeek應(yīng)該是周末爆炸吹類型題材，而且DeepSeek周末的小表格很多都是瞎關(guān)聯(lián)的，這個(gè)公司都沒融資過，哪來的參股受益公司。而且他也是囤卡跑出來的模型，其他的國(guó)內(nèi)公司都沒兩張卡，跑啥跑啊。

其實(shí)兩者根本沒有對(duì)比性，周末太熱了，所以講講。周末吹的太降智了，周末吹的DeepSeek感覺都問鼎全球的，感覺吹的全球其他的AI路徑都是不如他。

這里依然看好豆包是年度級(jí)別題材，依然看好春節(jié)期間豆包熱度最好。

短期從跨春節(jié)角度，豆包依然是最優(yōu)解啊。不知道大家如何，反正一月?lián)肀Ф拱止蛇€是很舒服的。

講講年后吧，歷年春節(jié)一到兩個(gè)月在A股都是好時(shí)光。積極看多，持倉(cāng)50% 過年。明天春節(jié)前最后一個(gè)交易日，再干一天。

【聲明】本文所有內(nèi)容均不構(gòu)成任何投資建議。文章內(nèi)容僅是個(gè)人筆記和觀點(diǎn)，不具任任何指導(dǎo)作用，據(jù)此操作，風(fēng)險(xiǎn)自負(fù)。

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

开心六月综合激情婷婷|欧美精品成人动漫二区|国产中文字幕综合色|亚洲人在线成视频