DeepSeek正在成為國(guó)產(chǎn)AI大模型領(lǐng)域的新寵。
2月5日,中國(guó)移動(dòng)旗下的移動(dòng)云宣布接入DeepSeek大模型,繼此前中國(guó)電信、中國(guó)聯(lián)通分別在2月1日、2月3日相繼官宣,至此,三大運(yùn)營(yíng)商已全部接入DeepSeek。這也意味著DeepSeek成為國(guó)內(nèi)首個(gè)獲三大電信巨頭支持的國(guó)產(chǎn)AI大模型。
在蛇年春節(jié)期間橫空出世后,DeepSeek目前已推出多個(gè)大模型,涵蓋自然語(yǔ)言處理、代碼生成等多個(gè)領(lǐng)域。其中,DeepSeek-R1在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,測(cè)評(píng)性能與GPT-o1模型正式版接近。
此次合作中,三大運(yùn)營(yíng)商各自推出了不同的接入方式。中國(guó)電信通過(guò)“息壤”智算平臺(tái),提供DeepSeek-R1模型的推理、訓(xùn)練及微調(diào)支持,并在GPU云主機(jī)、科研助手、AI云電腦等業(yè)務(wù)場(chǎng)景中部署應(yīng)用。
中國(guó)聯(lián)通則借助“星羅”平臺(tái),實(shí)現(xiàn)DeepSeek-R1在編程助手、云桌面等產(chǎn)品中的集成,并在全國(guó)270多個(gè)骨干云池預(yù)部署,以優(yōu)化推理效率和數(shù)據(jù)安全能力。
中國(guó)移動(dòng)的接入范圍相對(duì)更廣泛,宣布支持DeepSeek全版本、全尺寸模型,并通過(guò)智算中心、云計(jì)算平臺(tái)進(jìn)行深度適配,同時(shí)結(jié)合自研的COCA算力平臺(tái),實(shí)現(xiàn)更靈活的模型調(diào)用與部署。
三大運(yùn)營(yíng)商自研的大模型相比DeepSeek顯得十分遜色,或許是三大運(yùn)營(yíng)商主動(dòng)選擇擁抱DeepSeek的原因之一。過(guò)去兩年,三大運(yùn)營(yíng)商曾相繼推出自研大模型——中國(guó)移動(dòng)的“九天”、中國(guó)聯(lián)通的“聯(lián)智”、中國(guó)電信的“星辰”,并嘗試在智能客服、云計(jì)算、政企市場(chǎng)等領(lǐng)域進(jìn)行落地,但未在市場(chǎng)激起較大水花。
2023年,中國(guó)移動(dòng)發(fā)布的“九天”大模型,主打智能語(yǔ)音助手、智慧政務(wù)等場(chǎng)景;中國(guó)聯(lián)通推出“聯(lián)智”大模型,強(qiáng)調(diào)5G+AI的融合應(yīng)用;中國(guó)電信的“星辰”大模型則依托天翼云,聚焦安全及企業(yè)級(jí)AI服務(wù)。然而,相較于百度、阿里等互聯(lián)網(wǎng)公司推出的AI大模型,三大運(yùn)營(yíng)商的自研產(chǎn)品在市場(chǎng)認(rèn)知度、技術(shù)成熟度及行業(yè)拓展方面仍有較大差距。
此次三大運(yùn)營(yíng)商接入DeepSeek,被視為對(duì)其自研AI能力的一次補(bǔ)充。在運(yùn)營(yíng)商的智能算力平臺(tái)上,DeepSeek的加入將進(jìn)一步豐富其AI產(chǎn)品矩陣,提升大模型在云計(jì)算、智能客服、辦公自動(dòng)化等場(chǎng)景中的應(yīng)用能力。
同時(shí),三大運(yùn)營(yíng)商仍保留自研模型,并在特定行業(yè)及定制化服務(wù)中繼續(xù)推進(jìn)落地。如何在DeepSeek的通用能力與自研模型的行業(yè)適配性之間形成互補(bǔ),成為三大運(yùn)營(yíng)商下一步需要探索的方向。
此外,除了三大運(yùn)營(yíng)商,華為云,騰訊云、阿里云等國(guó)內(nèi)主流云平臺(tái)也相繼接入DeepSeek,英偉達(dá)、微軟、亞馬遜在內(nèi)的多家海外公司也在加速接入DeepSeek-R1。1月31日,英偉達(dá)宣布NVIDIA NIM已經(jīng)可以使用DeepSeek-R1模型。當(dāng)天,亞馬遜也表示DeepSeek-R1模型可以在Amazon Web Services上使用。微軟也在同一天宣布,已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業(yè)級(jí)AI服務(wù)平臺(tái)的一部分。
聯(lián)系客服