文|《中國科學報》記者 趙廣立
在老電影《橫空出世》中,中國第一顆原子彈成功爆炸的一幕被搬上熒幕,成為影史經(jīng)典。二十多年后的今天,人們不但可以重溫這一幕,甚至可以在高清設備上獲得更佳觀看體驗。這背后,少不了“膠片醫(yī)生”的貢獻。
上圖右側(cè)為電影頻道-百度·文心大模型修復畫面。截圖自電影《橫空出世》
新“膠片醫(yī)生”
在以前,“膠片醫(yī)生”是電影修復工作者的別稱。在電影頻道節(jié)目制作中心(簡稱“電影頻道”)擁有的約2萬部中外電影資源中,超半數(shù)以上是用膠片拍攝的。
為讓影視經(jīng)典色彩更豐富、畫面更高清,“膠片醫(yī)生”們往往要在老電影“分辨率低、噪點高、色彩飽和度低”等問題上“動刀”。
影片主要靠人工手動逐幀修復,費時耗力。隨著人工智能(AI)技術(shù)的進步,AI一度成為“膠片醫(yī)生”的得力助手。然而,面對有諸多細分環(huán)節(jié)的電影修復工作,傳統(tǒng)的模型研發(fā)所需數(shù)據(jù)和時間成本都很高,AI修片的效率和效果難孚眾望。
轉(zhuǎn)機發(fā)生在AI超大規(guī)模預訓練技術(shù)的突破之后。
近日,百度聯(lián)合電影頻道,發(fā)布業(yè)內(nèi)首個影視行業(yè)“智感超清大模型”——電影頻道-百度·文心。智感超清大模型深度結(jié)合百度AI技術(shù)能力和電影頻道長期積累的視頻修復數(shù)據(jù),通過對超分辨率、去噪、去模糊、去壓縮等多任務的聯(lián)合預訓練、億級參數(shù)量的學習,可實現(xiàn)對多種損壞情況的修復,并通過畫質(zhì)提升、邊緣銳化等方式增強視頻的清晰度,達到全方位提升視頻修復效率和觀感體驗的效果。
另外,智感超清大模型可以用一個模型同時處理影片修復的多個任務,全方位助力電影頻道提升視頻修復效率。
測試數(shù)據(jù)顯示,使用電影頻道-百度·文心大模型每天可修復視頻28.5萬幀,解決了絕大部分畫面的修復問題。即便是需要人工進一步精修,修復速度也能提升3~4倍。并且,在老片“超清化”中,大模型可針對影片進行自適應色彩增強、清晰度增強、時序插幀、SDR轉(zhuǎn)HDR等,全面提升老電影的畫質(zhì),使其煥發(fā)新生機。
11月30日,Wave Summit+ 2022深度學習開發(fā)者峰會線上舉行,“電影頻道-百度·文心”也與一眾行業(yè)大模型一起亮相。在“電影頻道-百度·文心”的加持之下,AI成了新的“膠片醫(yī)生”。
這一案例也深刻地表明,AI正隨著深度學習平臺與大模型技術(shù)的成熟而逐漸變得更穩(wěn)健和有效率,而這也為AI普惠的加速到來鋪平道路。
AI普惠,腳步加快
在Wave Summit+ 2022深度學習開發(fā)者峰會上,百度首席技術(shù)官、深度學習技術(shù)及應用國家工程研究中心主任王海峰道出AI普惠加速背后的關(guān)鍵:“深度學習平臺+大模型”能夠貫通AI全產(chǎn)業(yè)鏈,夯實了產(chǎn)業(yè)智能化的基座。
“深度學習平臺+大模型,貫通了從硬件適配、模型訓練、推理部署,到場景應用的AI全產(chǎn)業(yè)鏈,夯實產(chǎn)業(yè)智能化基座,進一步加速產(chǎn)業(yè)智能化升級。”王海峰解釋說,作為基礎共性平臺,開源開放的深度學習開發(fā)平臺下接芯片、上承應用,堪比智能時代的操作系統(tǒng);而大模型具有效果好、泛化能力強、研發(fā)過程標準化程度高等特點,對深度學習模型的開發(fā)、訓練和推理部署都提出了更高的要求,牽引著深度學習平臺的發(fā)展方向。
王海峰表示,具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè),可以將模型生產(chǎn)的復雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務?!按髷?shù)據(jù)、大算力、大模型能力僅需少數(shù)企業(yè)操心,千行百業(yè)直接應用即可?!?/p>
這樣的產(chǎn)業(yè)化路徑已經(jīng)在文心大模型的產(chǎn)業(yè)實踐中得到驗證,聯(lián)合行業(yè)頭部企業(yè)研制行業(yè)大模型就是其中的重要實踐之一。
“冰城”哈爾濱,拿出城市跨業(yè)務、跨結(jié)構(gòu)、跨部門的數(shù)據(jù)知識和多種任務算法,基于文心基礎大模型ERNIE 3.0打造面向城市領域的行業(yè)大模型——冰城-百度·文心。通過構(gòu)建統(tǒng)一預訓練模型,冰城-百度·文心具備超強的語言理解、語義分析等能力,可望支撐城市各領域AI規(guī)?;瘧玫拈_發(fā)效率和效果的提升。
人民網(wǎng),引入人民網(wǎng)輿情數(shù)據(jù)中心積淀的行業(yè)知識與任務樣本數(shù)據(jù),聯(lián)合百度共建媒體行業(yè)大模型——人民網(wǎng)-百度·文心,目前已在“新聞摘編報告生成”等應用場景取得明顯的效果。未來,該模型還將用于新聞事件抽取分析、新聞評論聚合分析、新聞信息個性化推薦等更多場景。
吉利汽車的汽車專家攜手百度AI專家,向文心大模型“投喂”吉利汽車行業(yè)數(shù)據(jù)進行預訓練,得到性能更強、穩(wěn)定性更高的汽車領域大模型吉利-百度·文心,目前已應用于吉利的智能客服系統(tǒng)、車載語音系統(tǒng)和汽車領域知識庫構(gòu)建等業(yè)務場景中。
泰康保險集團則向百度分享其在保險行業(yè)特有知識,共同基于文心CV大模型VIMER-StrucTexT打造保險行業(yè)大模型——泰康-百度·文心。該大模型在泰康典型應用任務中表現(xiàn)亮眼,平均字段識別錯誤率相對下降,有望為AI技術(shù)更大范圍內(nèi)落地保險鋪路。
此外,還有共同研發(fā)面向燃氣行業(yè)大模型“深燃-百度·文心”的深燃集團、聯(lián)合發(fā)布面向電子制造行業(yè)大模型“TCL-百度·文心”的TCL、共同打造知識增強的社科行業(yè)大模型“辭海-百度·文心”的上海辭書出版社……他們通過行業(yè)數(shù)據(jù)學習、知識挖掘、模型訓練,讓AI的觸角深入到安全質(zhì)檢、電子制造、知識產(chǎn)權(quán)保護等各個領域。
加之此前已與百度共創(chuàng)行業(yè)大模型的國網(wǎng)電力、浦發(fā)銀行、中國航天,百度已與合作伙伴在十多個行業(yè)共創(chuàng)共建行業(yè)大模型,推動大模型“下場”,加快了AI普惠的腳步。
大模型生態(tài)初現(xiàn)崢嶸
峰會上,王海峰披露,飛槳生態(tài)持續(xù)繁榮,截至2022 年11月,平臺已凝聚535萬開發(fā)者、服務20萬家企事業(yè)單位、基于飛槳創(chuàng)建67萬個模型。
在深度學習平臺和預訓練大模型的加持下,越來越多領域的行業(yè)關(guān)鍵業(yè)務實現(xiàn)了AI“替補”人類“出場”,大模型生態(tài)初現(xiàn)崢嶸。
農(nóng)業(yè)應用——農(nóng)作物生長,防蟲害是關(guān)鍵。要防蟲害,及時、準確的蟲情監(jiān)測是前提。以往,蟲情監(jiān)測要耗費大量的人力、物力,即便如此也難以做到及時、準確。
寧波“微能物聯(lián)”通過與百度合作,借助飛槳EasyDL平臺產(chǎn)品及背后的文心CV大模型VIMER-CAE,研發(fā)了“微能蟲情測報系統(tǒng)”。這套系統(tǒng)通過“預訓練+微調(diào)”范式,實現(xiàn)資源復用和知識積累,提升模型的復用性,目前它已能夠根據(jù)引誘抓拍的圖像分析識別對應蟲害,并定制防治方案。
工業(yè)應用——韋士肯(廈門)機器人系統(tǒng)有限公司專注于汽車零部件的無損檢測。此前該公司針對公司在汽車零部件軸承、電池等上的質(zhì)檢工作,采用的智能化方案準確率僅有 70%多一點,無法滿足需求;后來借助飛槳EasyDL(背后預置了百度大規(guī)模預訓練模型)圖像任務中的圖像分割應用,韋士肯降低了數(shù)據(jù)標注量,得到了優(yōu)于原方案的模型效果。
保險業(yè)應用——某大型保險公司日常需要處理大量保險合同,復雜的合同條款和快速迭代的業(yè)務內(nèi)容會給保險合同管理帶來巨大的人力成本?;谖男拇竽P?,該保險公司實現(xiàn)了保險合同條款文本的自動解析識別,并智能提取39個維度的關(guān)鍵信息以便于業(yè)務系統(tǒng)管理。
在智能技術(shù)輔助下,該保險公司單份合同的處理時間降低到分鐘級,顯著提升了工作效率及準確度,大幅降低了人力成本。
銀行業(yè)應用——光大銀行過去各業(yè)務環(huán)節(jié)比較依賴線下人工流程處理各類文檔,經(jīng)營成本高、運營效率低。為降本增效,光大銀行積極向智能化靠攏。然而,業(yè)務對AI需求多而復雜,模型生產(chǎn)成本、周期和效果有待改善。
后來,光大銀行以文心大模型為底座,統(tǒng)一規(guī)劃建設企業(yè)級AI平臺,不斷整合和升級AI應用能力、響應各類業(yè)務需求,目前已在手寫簽名OCR識別引擎、終端登記智能識別、私行代銷產(chǎn)品審核、合格投資者審核等場景實現(xiàn)應用,成果顯著。
科研應用(生物醫(yī)藥領域)——化合物的藥物代謝動力學(簡稱ADMET)預測問題對于制藥行業(yè)來說是一個極為重要的場景,若能在藥物研發(fā)早期就排除ADMET性質(zhì)不佳的分子,針對ADMET性質(zhì)對候選化合物進行優(yōu)化,可大幅節(jié)省藥物研發(fā)大量的時間和資金投入。
在大規(guī)模的無標注化合物數(shù)據(jù)庫上訓練化合物表征大模型HELIX-GEM,使大模型學習到化合物中蘊含的物理化學規(guī)律和知識,進而將其應用在眾多的ADMET成藥性預測任務上,可一舉提升ADMET任務的效果。
與傳統(tǒng)實驗方法對比,該模型高效、準確,計算1000個分子的ADMET相關(guān)指標只需不到1分鐘的時間,且有更高的準確率。同時,計算的指標也更多,可以一次性預測50+種ADMET相關(guān)的指標,綜合效果超過其他機器學習方法4%以上。
談到大模型應用進展,在百度集團副總裁、深度學習技術(shù)及應用國家工程研究中心副主任吳甜看來,當下的大模型機制,封裝了復雜的模型生產(chǎn)過程和過程中各種各樣的消耗;如此,行業(yè)應用面對的是一個清晰、簡單、低門檻的界面,因此,大模型與深度學習平臺結(jié)合“給上層的應用帶來了更大的想像空間”。