开心六月综合激情婷婷|欧美精品成人动漫二区|国产中文字幕综合色|亚洲人在线成视频

    1. 
      
        <b id="zqfy3"><legend id="zqfy3"><fieldset id="zqfy3"></fieldset></legend></b>
          <ul id="zqfy3"></ul>
          <blockquote id="zqfy3"><strong id="zqfy3"><dfn id="zqfy3"></dfn></strong></blockquote>
          <blockquote id="zqfy3"><legend id="zqfy3"></legend></blockquote>
          打開(kāi)APP
          userphoto
          未登錄

          開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

          開(kāi)通VIP
          大模型時(shí)代,「數(shù)據(jù)飛輪」怎么做?

          以數(shù)據(jù)消費(fèi)為目標(biāo),重建「數(shù)據(jù)中臺(tái)」。


          作者 | 宛辰、陳姚戈
          編輯 | 靖宇

          數(shù)據(jù)飛輪,是今年大模型帶火的一個(gè)典型詞匯,通過(guò)客戶在應(yīng)用程序中輸入的提示詞這樣的數(shù)據(jù)反饋,使大模型快速迭代。今年初,數(shù)據(jù)飛輪也曾一度被視為 OpenAI 最重要的先發(fā)優(yōu)勢(shì)。

          但在 All in 大模型的下半年,數(shù)據(jù)飛輪成為了大模型廠商最頭疼的事情。此前在極客公園舉辦的一場(chǎng)大模型研討會(huì)中,不少創(chuàng)業(yè)者表示,「用戶都看重?cái)?shù)據(jù)資產(chǎn),不愿意把數(shù)據(jù)拿出來(lái),模型廠商幫助客戶訓(xùn)好模型,做本地部署,做完了『凈身出戶』,數(shù)據(jù)飛輪很難建立起來(lái)」。
          從 A/B 測(cè)試?yán)锱艹鰜?lái)的今日頭條,基于數(shù)據(jù)分析選品、調(diào)度的抖音直播,火山引擎數(shù)據(jù)平臺(tái)擁有這兩個(gè)互聯(lián)網(wǎng)最艷羨的業(yè)務(wù)實(shí)踐,火山引擎如何看待大模型的數(shù)據(jù)飛輪問(wèn)題?
          帶著這樣的好奇,極客公園在 9 月 19 日 V-Tech 數(shù)據(jù)驅(qū)動(dòng)科技峰會(huì)上,采訪了火山引擎總裁譚待。他表示,大模型的數(shù)據(jù)飛輪問(wèn)題首先要合規(guī),其次,很多企業(yè)愿意與模型廠商共創(chuàng),從而可以讓大模型廠商的大模型數(shù)據(jù)飛輪轉(zhuǎn)起來(lái)。
          火山引擎 V-Tech 數(shù)據(jù)驅(qū)動(dòng)科技峰會(huì)|來(lái)源:火山引擎
          另一方面,在數(shù)據(jù)平臺(tái)的產(chǎn)品層面,火山有更多的數(shù)據(jù)飛輪實(shí)踐。
          峰會(huì)上,譚待和字節(jié)跳動(dòng)數(shù)據(jù)平臺(tái)負(fù)責(zé)人羅旋,介紹了火山引擎在數(shù)據(jù)平臺(tái)層面接入的大模型功能探索。其中,在類 BI(Business Intelligence,商業(yè)智能)產(chǎn)品、自動(dòng)駕駛艙等產(chǎn)品中引入了 AI 助手;在數(shù)據(jù)管理產(chǎn)品中引入了 AI 自動(dòng)補(bǔ)全代碼和修正代碼等功能;目前,相關(guān)數(shù)據(jù)產(chǎn)品已啟動(dòng)邀測(cè)。據(jù)悉,這幾款產(chǎn)品的 AIGC 功能背后,是基于火山自己的大模型——云雀(目前在內(nèi)測(cè)中)。上個(gè)月底,云雀大模型通過(guò)了《生成式人工智能服務(wù)管理暫行辦法》備案。
          事實(shí)上,大模型在數(shù)據(jù)類產(chǎn)品的落地,還有一定距離。
          6 月以來(lái),不少數(shù)據(jù)產(chǎn)品都引入了 AI 助手這樣的功能,目前產(chǎn)業(yè)界普遍仍在打磨落地中,要實(shí)現(xiàn)任何自然語(yǔ)言精準(zhǔn)「召喚」出想要的數(shù)據(jù)形式,還需要幾年的探索時(shí)間?;鹕揭婵偛米T待也表示,真正有比較好的 AI 原生應(yīng)用出來(lái),可能要等到底座模型本身至少具備 GPT3.5+以上水平,才會(huì)清晰一些。
          但在理念上,火山引擎提出了不同的數(shù)據(jù)飛輪理念,數(shù)據(jù)驅(qū)動(dòng)最終是一定要落在企業(yè)不同人員對(duì)數(shù)據(jù)的消費(fèi)上,以此來(lái)建設(shè)數(shù)據(jù)產(chǎn)品,把數(shù)據(jù)「推」到最廣泛的數(shù)據(jù)消費(fèi)者面前,最終形成基于數(shù)據(jù)分析的一致行動(dòng)。這能解決近年來(lái)飽受爭(zhēng)議的數(shù)據(jù)中臺(tái)難落地的問(wèn)題。
          關(guān)于上述問(wèn)題,譚待和羅旋接受了包括極客公園的采訪,以下是對(duì)話節(jié)選:

          01

          數(shù)據(jù),必須被「消費(fèi)」


          問(wèn):峰會(huì)上推出的找數(shù)助手、開(kāi)發(fā)助手、分析助手幾款工具,用戶會(huì)以什么樣的方式獲取這些服務(wù)?
          羅旋:因?yàn)?AI 本身也在快速發(fā)展過(guò)程中,產(chǎn)品經(jīng)過(guò)一段實(shí)踐,不能算是成熟的狀態(tài),我們希望一點(diǎn)點(diǎn)逐漸打磨產(chǎn)品。前期先邀測(cè),不會(huì)大規(guī)模放開(kāi),希望有一些客戶能夠深度跟我們共創(chuàng),更成熟以后,再大規(guī)模對(duì)外公開(kāi)。
          問(wèn):這些 AI 助手用了什么大模型?
          羅旋:我們現(xiàn)在主要依賴于字節(jié)本身有一個(gè)云雀大模型,以及火山方舟 MaaS 平臺(tái)上有一些合作伙伴的大模型。
          問(wèn):怎么理解「以消費(fèi)為核心」的數(shù)據(jù)驅(qū)動(dòng)?
          譚待:回到最大的根本,做這件事情,還是希望把目標(biāo)定清楚,最后其實(shí)是以數(shù)據(jù)消費(fèi)為目標(biāo)來(lái)做這個(gè)事情。跟過(guò)去五六年業(yè)界講的數(shù)據(jù)中臺(tái)的概念相比,這是一個(gè)更大的升級(jí),而且是更有效解決企業(yè)數(shù)據(jù)產(chǎn)生價(jià)值的問(wèn)題。
          否則,很多企業(yè)投入大量的資源,建完之后有數(shù)據(jù),但是沒(méi)有利用起來(lái),本質(zhì)就是沒(méi)有想清楚最終應(yīng)該圍繞什么來(lái)做這件事情。以前我們做建設(shè)的時(shí)候,目標(biāo)是有偏差的,比如我建一個(gè)中臺(tái)其實(shí)不是目標(biāo),是實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的一個(gè)手段。
          所以我們提出了數(shù)據(jù)消費(fèi)、數(shù)據(jù)飛輪這樣的邏輯。企業(yè)建設(shè)數(shù)據(jù)時(shí),應(yīng)該把數(shù)據(jù)消費(fèi)作為目標(biāo),比如峰會(huì)講的兩個(gè) 80%:一是 80% 的企業(yè)員工能夠用到,二是能覆蓋到 80% 的分析場(chǎng)景。
          圍繞數(shù)據(jù)消費(fèi),我們的體系叫數(shù)據(jù)飛輪,數(shù)據(jù)飛輪上層是跟應(yīng)用相關(guān),這些產(chǎn)品里面大部分確實(shí)是 SaaS 的形態(tài),也有一些會(huì)是 PaaS 的形態(tài)。下一層是數(shù)據(jù)資產(chǎn)的建設(shè),這些主要是 PaaS 為主,通過(guò)數(shù)據(jù)消費(fèi)這個(gè)事情端到端應(yīng)用起來(lái),就能解決過(guò)去企業(yè)數(shù)據(jù)建設(shè)過(guò)程中,數(shù)據(jù)團(tuán)隊(duì)和業(yè)務(wù)團(tuán)隊(duì)互相不理解導(dǎo)致最后效果不好的問(wèn)題。
          火山引擎全套數(shù)據(jù)平臺(tái)產(chǎn)品|拍攝:極客公園
          問(wèn):火山引擎一整套數(shù)據(jù)飛輪的產(chǎn)品,如果跟 SnowFlake 相比的話,有哪些相同的地方,有哪些不同的地方?
          羅旋:SnowFlake 本質(zhì)上更多是數(shù)倉(cāng)的引擎,公司做大以后也嘗試著往更多數(shù)據(jù)分析這邊去走,但是更多是從基礎(chǔ)層的引擎往上做。
          我們切入的角度不一樣,我們更強(qiáng)調(diào)業(yè)務(wù),比如 AB 測(cè)試,SnowFlake 沒(méi)有,我們偏數(shù)據(jù)飛輪下面的輪子,偏數(shù)據(jù)資產(chǎn)和數(shù)據(jù)建設(shè)底層的部分,更強(qiáng)調(diào)兩個(gè)輪子兼?zhèn)洹?/span>
          從業(yè)務(wù)需求來(lái)說(shuō)先做應(yīng)用,發(fā)現(xiàn)下一層可能有數(shù)據(jù)質(zhì)量包括治理、資產(chǎn)的問(wèn)題,再建下一個(gè)輪子,可以更靈活,更有選擇性一些,這是一個(gè)比較大的區(qū)別。
          譚待:可以類比一個(gè)概念,叫 DevOps,以前 Dev 和 Ops 完全分開(kāi)的,所以很割裂。其實(shí)數(shù)據(jù)里面也有這個(gè)問(wèn)題,你的應(yīng)用和建設(shè)也是完全分開(kāi)的,我們講數(shù)據(jù)飛輪有點(diǎn)像 DevOps,我要把數(shù)據(jù)應(yīng)用和數(shù)據(jù)資產(chǎn)合在一起
          問(wèn):傳統(tǒng)企業(yè)想做數(shù)字化,或者一開(kāi)始企業(yè)也注重?cái)?shù)據(jù),但是建設(shè)的不是特別好。如果這種情況下,希望能借助數(shù)據(jù)飛輪這個(gè)工具,會(huì)不會(huì)有一些摩擦力?
          譚待:我們這些年也服務(wù)了很多所謂的傳統(tǒng)行業(yè),像制造業(yè)、金融、零售等等都有。這幾年大家已經(jīng)很重視數(shù)據(jù)建設(shè),不是五年前或者七八年前大家覺(jué)得這事不是特別重要。
          現(xiàn)在最大的挑戰(zhàn)是,建設(shè)完發(fā)現(xiàn)數(shù)據(jù)用不起來(lái),因?yàn)榻ㄔO(shè)過(guò)程中跟他的業(yè)務(wù)目標(biāo)是脫離的,是有很多報(bào)表、很多系統(tǒng),但是都用不起來(lái)。這也是我們?yōu)槭裁刺釘?shù)據(jù)飛輪、數(shù)據(jù)消費(fèi)的原因,得重新審視怎么建這個(gè)事情,不然建再多的中臺(tái)也沒(méi)用,這是這個(gè)階段我們需要改變的事情。
          問(wèn):數(shù)據(jù)飛輪相比傳統(tǒng)企業(yè)數(shù)字化工具和數(shù)據(jù)中臺(tái)的升級(jí)點(diǎn)到底在哪?
          羅旋:最大的一點(diǎn)是看業(yè)務(wù)的痛點(diǎn),第一步到底做什么?傳統(tǒng)數(shù)據(jù)中臺(tái)第一步是把數(shù)據(jù)建設(shè)好,數(shù)據(jù)資產(chǎn)弄好,到底有多少數(shù)據(jù)是一個(gè)相對(duì)整齊、統(tǒng)一、高質(zhì)量地呈現(xiàn)出來(lái)。
          數(shù)據(jù)飛輪,很大程度上先聊業(yè)務(wù),業(yè)務(wù)上有什么訴求,看數(shù)據(jù)可以在里面起到多大作用,再看具體應(yīng)該用什么樣的解決方案,什么樣的產(chǎn)品。
          比如有客戶說(shuō)我們做了小程序的頁(yè)面優(yōu)化或者文案優(yōu)化,他的業(yè)務(wù)痛點(diǎn)非常明確——通過(guò)文案的優(yōu)化提高營(yíng)銷的轉(zhuǎn)化率。相應(yīng)地,我們提供的方案就是做 AB 測(cè)試。如果是另一種問(wèn)題,比如說(shuō)數(shù)據(jù)清洗、數(shù)據(jù)質(zhì)量,我們可能需要提供數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)治理的工具,這是非常不一樣的。
          傳統(tǒng)數(shù)據(jù)中臺(tái)上來(lái)先不聊這些,先給你一個(gè)全家桶,先把這些做完。做完之后有什么用?這些事當(dāng)時(shí)沒(méi)有考慮,所以會(huì)遺留大量的工程后面推進(jìn)不下去了,這是本質(zhì)區(qū)別。
          譚待:比如他已經(jīng)投入了數(shù)據(jù)中臺(tái)建設(shè),他再用數(shù)據(jù)飛輪也是一個(gè)繼承關(guān)系,不需要全部推倒重來(lái),這對(duì)于企業(yè)來(lái)說(shuō)也是一個(gè)很好的方式,已有的投入也可以得到延續(xù)。

          02

          大模型的

          數(shù)據(jù)飛輪,有解嗎?


          問(wèn):大模型時(shí)代,數(shù)據(jù)平臺(tái)在火山的戰(zhàn)略定位有沒(méi)有發(fā)生變化?
          譚待:我覺(jué)得數(shù)據(jù)平臺(tái)更重要了,因?yàn)槟P湍軌蚪档褪褂瞄T檻,更多人可以更容易地消費(fèi)數(shù)據(jù),生產(chǎn)和理解數(shù)據(jù)也更容易,對(duì)于數(shù)據(jù)平臺(tái)來(lái)說(shuō)重要性不言而喻。就像改良式的蒸汽機(jī),對(duì)于下游的原材料價(jià)值更高。
          問(wèn):相比數(shù)據(jù)分析的數(shù)據(jù)飛輪,大模型廠商的數(shù)據(jù)飛輪很難建立??蛻舳己芸粗?cái)?shù)據(jù)資產(chǎn),但是不愿意把數(shù)據(jù)拿出來(lái)給模型廠商,怎么看大模型公司自己的數(shù)據(jù)飛輪難以建立的問(wèn)題?
          譚待:比如說(shuō) A 公司用了大模型,但是全部都封閉在自己的體系,A 公司自己的數(shù)據(jù)飛輪是建起來(lái)了,對(duì)他是一個(gè)好事,但是大模型公司怎么搞?最近 OpenAI 的 CEO 也有一個(gè)澄清,GPT 有沒(méi)有用用戶的數(shù)據(jù)。本身新的技術(shù)安全合規(guī),信任是很重要的,肯定要在這個(gè)規(guī)范下做事情。
          在實(shí)際中,有些用戶不愿意那么用,那就肯定不能用。但還有很多企業(yè)發(fā)現(xiàn),用標(biāo)準(zhǔn)的東西不能完全解決我的問(wèn)題,需要和底層的合作方(模型廠商)一起做優(yōu)化,一起做優(yōu)化的過(guò)程中自然而然就可以提升,數(shù)據(jù)飛輪就可以轉(zhuǎn)起來(lái)。
          所以第一要合規(guī),第二,在實(shí)際生活中有些人因?yàn)樾枨篁?qū)動(dòng)導(dǎo)致很多企業(yè)愿意和模型方共建,這種共建可以幫助雙方的數(shù)據(jù)飛輪都建立起來(lái)。
          問(wèn):如何把用戶反饋的數(shù)據(jù)返回基礎(chǔ)模型,有什么方法論嗎?
          譚待:這個(gè)難點(diǎn)就是企業(yè)和用戶愿不愿意給第三方。(盡管)技術(shù)上也有一些難點(diǎn),但是最大的難點(diǎn)是在意愿上。
          問(wèn):MaaS 平臺(tái)推出幾個(gè)月了,也有自己的大模型,現(xiàn)在客戶選擇上選擇最多的是哪一款?
          譚待:我覺(jué)得比較分散,不同的場(chǎng)景同時(shí)考慮效果、性價(jià)比,有的還有私有化部署的需求,不同模型在這方面的表現(xiàn)不一樣。
          第二,相比全球最高水平,中國(guó)幾個(gè)基礎(chǔ)模型都有一定距離,現(xiàn)在大家更多還是在 POC(Proof of Concept,概念驗(yàn)證,被視為發(fā)布功能性產(chǎn)品的第一步)、在做測(cè)試。真正有比較好的 AI 原生的應(yīng)用出來(lái)的話,可能還是要等到底座模型本身至少具備 GPT3.5+以上水平,我覺(jué)得到年底這個(gè)事情才會(huì)更加清晰一些。
          譚待介紹大模型時(shí)代數(shù)據(jù)飛輪的新趨勢(shì)|拍攝:極客公園
          問(wèn):火山提到要全鏈路擁抱 AI,具體如何系統(tǒng)布局,重點(diǎn)是什么?
          譚待:確實(shí)大模型本身能應(yīng)用的范式比較廣泛,比如創(chuàng)作、內(nèi)容、開(kāi)發(fā)都有。其中數(shù)據(jù)分析是里面非常重要的一個(gè)環(huán)節(jié),所以我們今天主要是講我們數(shù)據(jù)分析產(chǎn)品上大概通過(guò) AI 提供了哪些新的能力。其他的產(chǎn)品,我們?cè)谖磥?lái)其他火山會(huì)議上也會(huì)逐步對(duì)外披露。
          問(wèn):目前像字節(jié)內(nèi)部對(duì)于大模型和 AI 業(yè)務(wù)資源傾斜的程度怎么樣?在內(nèi)部的權(quán)重如何?如何跟核心產(chǎn)品——抖音深度融合?
          譚待:這次主要介紹的是數(shù)據(jù)產(chǎn)品的變化,大模型可以在 toB、toC 都有很大變化,你怎么找到這個(gè)方向,哪些優(yōu)化是有價(jià)值的,還是要回到數(shù)據(jù)驅(qū)動(dòng)上。這也是我們?cè)谶@個(gè)階段包括未來(lái),數(shù)據(jù)產(chǎn)品很重要的原因,但是會(huì)通過(guò)模型本身讓數(shù)據(jù)產(chǎn)品使用門檻更低,能創(chuàng)造更多價(jià)值。
          C 端的產(chǎn)品陸續(xù)可以看到一些變化,但是跟火山關(guān)系不會(huì)特別大。
          問(wèn):現(xiàn)在大模型普遍有一個(gè)問(wèn)題是對(duì)齊不太好,經(jīng)常會(huì)有幻覺(jué),給人誤導(dǎo)?;鹕接惺裁幢容^獨(dú)到的經(jīng)驗(yàn)和方案?比如,AB 測(cè)試和數(shù)據(jù)方面,你們有沒(méi)有用這些方法來(lái)校準(zhǔn) AI 大模型?
          羅旋:這確實(shí)是今天模型應(yīng)用上一個(gè)非常大的阻塞點(diǎn),在數(shù)據(jù)領(lǐng)域這個(gè)點(diǎn)尤其突出,因?yàn)閿?shù)據(jù)本身是要求精確的東西,不是一個(gè)主觀化的文本描述,不能是一個(gè)不精確或者錯(cuò)誤的。
          今天這個(gè)問(wèn)題,整個(gè)行業(yè)都沒(méi)有徹底解決,但有一些方法能夠幫助我們一定程度上解決或者緩解這個(gè)問(wèn)題。比如我們可以嘗試讓 AI 把它的思維過(guò)程、分析過(guò)程展示出來(lái),一步步到底怎么推理、怎么想的。這個(gè)展示過(guò)程,人是可以看到的,當(dāng)它出現(xiàn)錯(cuò)誤時(shí),我們是有可能發(fā)現(xiàn)這個(gè)錯(cuò)誤的。
          如果我們通過(guò)一些產(chǎn)品化的方式,能夠讓可能出現(xiàn)的錯(cuò)誤比較顯性地呈現(xiàn)在用戶面前,讓他輕易改動(dòng)之后就能拿到正確結(jié)果的話,這很大程度上還是可用的,這是我目前覺(jué)得最重要的思路。
          另一方面模型能力本身的提升也會(huì)很大程度上緩解這個(gè)問(wèn)題,以 OpenAI 為例,GPT-4 比 GPT-3.5 有巨大提升,所以我們期待隨著模型能力的進(jìn)一步提升也可以變好。
          還有一個(gè)思路,可以在模型上做一些領(lǐng)域的精調(diào),在通用能力基礎(chǔ)上加一些領(lǐng)域的知識(shí),這也有利于幫助我們?cè)诰唧w的領(lǐng)域里面,讓這個(gè)幻覺(jué)變得更小,準(zhǔn)確率更高。這些方法結(jié)合起來(lái),很大程度上這個(gè)產(chǎn)品能力躍過(guò)一個(gè)門檻是真的可用的。
          譚待:AB 測(cè)試確實(shí)很重要,AIGC 生成的內(nèi)容不是唯一的,你怎么看(不同答案的)好壞,就像推薦一樣,AB 測(cè)試是非常重要的。我們現(xiàn)在看模型,你去評(píng)估各種榜單,可能意義不是那么大,因?yàn)槟P吞罅?,它可以把很多題目記下來(lái),最終比較有用的還是通過(guò) AB 測(cè)試來(lái)看,效果可能會(huì)比較好。

          *頭圖來(lái)源:火山引擎
          本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
          打開(kāi)APP,閱讀全文并永久保存 查看更多類似文章
          猜你喜歡
          類似文章
          火山引擎、騰訊們,看透了大模型這場(chǎng)“貓鼠游戲”
          10萬(wàn)億隱形財(cái)富,背后的真相#讓老板心里有點(diǎn)數(shù) #火山引擎數(shù)據(jù)飛輪接入大模型
          垂直大模型競(jìng)爭(zhēng),能突破數(shù)據(jù)“卡點(diǎn)”嗎?
          經(jīng)緯張穎:AI的遠(yuǎn)與近
          王小川:做搜索,我晚了;做AI,我趕上好時(shí)候
          字節(jié)終于等來(lái)了“豆包”
          更多類似文章 >>
          生活服務(wù)
          分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
          綁定賬號(hào)成功
          后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
          如果VIP功能使用有故障,
          可點(diǎn)擊這里聯(lián)系客服!

          聯(lián)系客服