“人工智能的介入,為生物信息學研究帶來了前所未有的機遇,不僅提高了我們對生命科學的理解,也為疾病治療和基因編輯等領域帶來了新的可能性?!敝袊茖W院新科院士、國家特聘教授、長江學者、北京大學生物醫(yī)學前沿創(chuàng)新中心(BIOPIC)主任張澤民在2023火山引擎AI for Science閉門研討會上提到。
AI for Science(AI4S)無疑正全方位受到熱捧。
無論是國內還是國際,整個行業(yè)都在因AI帶來的結構性變革機遇而“沸騰”。國內更是部署了“重大科學問題研究的 AI 范式”任務,面向地球科學、生物醫(yī)藥科學等重要領域開展創(chuàng)新研究;國際上巨頭間也摩肩擦踵,微軟、英偉達等IT巨頭、賽諾菲等制藥巨頭均紛紛加碼AI4S?!敖?jīng)合組織”更是面向全球決策者發(fā)布了AI in Science的政策建議。
但是,要讓AI4S發(fā)揮其真正效力,真正在諸如生命科學領域實現(xiàn)AI加速分子模擬、AI 預測蛋白結構、AI 賦能藥物和材料設計,在當前算力基座構建的基礎上仍道阻且長。
行業(yè)從業(yè)者無疑也意識到了這個問題。
為了讓AI4S的價值得以發(fā)揮,也是在大會上,火山引擎首次對外發(fā)布了火山引擎科研智算云解決方案,為科研機構和從業(yè)者們提供了從IaaS到PaaS再到SaaS的全場景產(chǎn)品和方案。
火山引擎在如何助力科學研究加速向AI4S挺進,實現(xiàn)生命科學機構的上“云”?動脈網(wǎng)借此機會采訪到了火山引擎副總裁張鑫。
AI帶來結構性變革機遇,
火山引擎加碼生命科學
2021年,火山引擎完成了品牌首秀。作為字節(jié)跳動旗下云服務平臺,火山引擎意圖將字節(jié)跳動快速發(fā)展過程中積累的增長方法、技術能力和應用工具開放給外部企業(yè),作為行業(yè)“引擎”驅動客戶業(yè)務增長。
火山引擎 副總裁 張鑫
而在AI帶來的結構性變革機遇的當下,用張鑫的話來說,火山引擎是“面向智能化新應用打造的新一代基礎設施和配套技術中臺”。
在此背景下,2022年,火山引擎推出以云為底座的一系列產(chǎn)品解決方案,包括企業(yè)上云和智能營銷通用方案,以及覆蓋金融、汽車、醫(yī)療等多個行業(yè)的云上增長方案。也是在2022年,火山引擎首次加碼“醫(yī)療”尤其是生命科學等領域。
而它聚焦生命科學領域的原因顯而易見。
一方面,生命科學領域有著巨幅增長的想象空間。當前,人類全基因組測序已經(jīng)完成,但是測序技術帶來的范式革命剛剛開始。隨著組學時代來臨以及生命科學數(shù)據(jù)的“大爆炸”,傳統(tǒng)研究方法的不足顯現(xiàn)出來。而AI在生物機制、疾病篩查診斷治療等領域無疑將扮演愈加重要的角色。以生物醫(yī)藥領域投資來看,根據(jù)動脈橙&蛋殼研究院《2022年全球醫(yī)療健康產(chǎn)業(yè)資本報告》,生物醫(yī)藥領域憑借1094起融資、累計約346.1億美元融資總額領先其他細分領域。而與其關聯(lián)的云服務市場無疑有著巨大機遇。
另一方面,“工欲善其事必先利其器”。在面向生命科學領域提供普適性解決方案之前,火山引擎早已具備提供成熟解決方案的基礎。而這得益于其在生命科學領域的長期探索——從自身來看,字節(jié)跳動AI-Lab團隊論文曾多次被學術界頂級會議收錄,其涉足領域則涵蓋蛋白質結構預測模型、量子化學等等,而它們正是當前生命科學備受關注的領域;從合作對象來看,廣州實驗室等重要科研機構長期與火山引擎保持著合作。兩者均奠定了其優(yōu)勢基礎。
在AI帶來結構性變革機遇的當下,火山引擎選擇投身其中,并加碼生命科學,無疑是順應潮流的結果。
聚焦生信、AI制藥領域,
推出全鏈路解決方案
“一方面,在生命科學大數(shù)據(jù)時代,科研者面臨多模態(tài)、高維度、跨尺度數(shù)據(jù)帶來的復雜性、多樣性問題;另一方面,科研者還面臨從實驗驅動到數(shù)據(jù)驅動中范式轉型帶來的標準問題等諸多挑戰(zhàn)?!睆場翁岬?。
這些問題在生信、制藥領域尤為明顯。
以生信領域中基因測序來看,高通量基因測序經(jīng)歷樣本制備、上機測序后,將產(chǎn)生龐大的基因序列數(shù)據(jù),它涉及到海量數(shù)據(jù)存儲、計算與傳輸,這對底層基礎設施建構有著極高的要求;并且,面對數(shù)量如此龐大的數(shù)據(jù),企業(yè)還面臨如何高效處理數(shù)據(jù),實現(xiàn)數(shù)據(jù)的分析與分享等難題。
倘若采用傳統(tǒng)的IDC數(shù)據(jù)中心進行建設,企業(yè)IT基礎設施可能面臨資源規(guī)模固定、建設周期長和硬件資源運維成本高等問題,這將導致企業(yè)在快速拓展期的發(fā)展受阻;而基于自身業(yè)務發(fā)展、工作流程等逐步構建起來的系統(tǒng),企業(yè)除了面臨研發(fā)投入大等問題外,往往還面臨對外標準兼容等問題。
制藥領域面臨的困難“只多不少”。由于靶標與疾病的關系探索難度大、靶標成藥難度高、藥物分子的開發(fā)難度大等原因,藥物研發(fā)成功率極低。以往單純依托實驗方式完成藥物研發(fā)已不可取,大量企業(yè)都在探索以AI、大數(shù)據(jù)技術驅動藥物研發(fā),實現(xiàn)物理模式+數(shù)據(jù)驅動的融合,減少實驗帶來的時間和經(jīng)濟成本的消耗。
顯然,生信、制藥領域需要的并非是一套單純的算力解決方案,他們需要的是可以更好地滿足基礎算力需求、并更為快速地實現(xiàn)科研發(fā)現(xiàn)的整體解決方案。
而火山引擎瞄準上述痛點,在會上發(fā)布了科研智算云解決方案,面向生物信息、醫(yī)療健康、人工智能、材料科學、分子模擬、EDA等泛AI場景,構建了囊括基礎設施層、平臺層、科研應用層三層架構的AI4S全場景產(chǎn)品和方案。其目標,正是加速包括生命科學等在內的基礎科學領域專家解鎖新發(fā)現(xiàn)。
火山引擎科研智算云解決方案架構圖
從基礎設施層面來看,當前部分機構出于安全考慮采用混合云策略、部分企業(yè)則選擇了全盤上云?;鹕揭婕瓤梢酝ㄟ^公有云為科學研究提供計算、容器、存儲、網(wǎng)絡等基礎設施,也可以通過火山引擎混合云veStack融合科研機構現(xiàn)有設施,共同打造混合云基礎設施。
從平臺層面來看,以AI制藥為例,基于火山引擎的火山方舟大模型服務平臺以及預訓練大模型,深勢科技完成了Uni-RNA的新型上下文感知深度學習模型的訓練。該模型以迄今為止前所未有的規(guī)模對最大的RNA序列數(shù)據(jù)集進行預訓練,它有望為mRNA 疫苗設計、RNA 結構預測、ASO 開發(fā)、SiRNA 療法創(chuàng)新、靶向 RNA 小分子開發(fā)、Aptamer 研發(fā)等眾多關鍵領域提供全新的解決方案。
從應用層面來看,操作系統(tǒng)的好壞事關科研能否順利進行。火山引擎為此打造了集自動化的工作流編排、Workspace于一身的生物醫(yī)學大數(shù)據(jù)操作系統(tǒng)Bio-OS。以生信領域為例,在火山引擎Bio-OS系統(tǒng)的助力下,分子之心打造并推出了國內首個功能完整的AI蛋白質設計和優(yōu)化平臺。
開源、全鏈路、火山方舟,
火山引擎的增長“三板斧”
縱觀整個行業(yè),生命科學領域云服務平臺業(yè)績的增長有跡可循。
一方面,是生命科學領域的企業(yè)均在加速上“云”。無論是基因測序還是AI制藥領域,海量的數(shù)據(jù)存儲、計算、傳輸?shù)刃枨螅约皩I(yè)務發(fā)展的彈性支持、IT運維成本的控制等,都在推動生命科學領域企業(yè)上“云”加速。
另一方面,企業(yè)出于業(yè)務穩(wěn)定性、可控性、資源互補等諸多需求,紛紛開啟了多云化業(yè)務部署,而這也促成了云市場的進一步擴容。
火山引擎也在生命科學領域云服務市場的逐步擴容中取得了一定成效。自2022年以來,在生命科學領域,火山引擎已與行業(yè)數(shù)十個代表性頭部高校/機構達成合作,并且合作意愿與數(shù)量仍在持續(xù)增長。而隨著火山引擎科研智算云解決方案的發(fā)布,在進一步助力生命科學領域解鎖新發(fā)現(xiàn)的同時,也有望推動其云服務業(yè)務進一步增長。
對于火山引擎來說,除了整體市場向好以外,尤為重要的一點,是其避開了廠商算力方面的同質化競爭,面向應用、場景等提供了差異化服務。一言以蔽之,火山引擎找到了足以發(fā)揮自身優(yōu)勢的“三板斧”。
其一,是火山引擎依托開源開放策略持續(xù)積淀優(yōu)勢。以面向生信領域的生物醫(yī)學大數(shù)據(jù)操作系統(tǒng)Bio-OS為例,除商業(yè)化解決方案外,火山引擎也在提供開源版Bio-OS,并基于此打造社區(qū),通過不斷舉行開源大賽,實現(xiàn)Bio-OS能力完善,沉淀更多工具和數(shù)據(jù)。其首屆Bio-OS開源開放大賽更是吸引來自全球45所高校、16所科研機構、8家企業(yè)單位和個人參賽者的187支團隊參與。作為一款全新的生物醫(yī)學信息分析支撐底座,Bio-OS生物醫(yī)學大數(shù)據(jù)系統(tǒng)基于開源實現(xiàn)了開發(fā)和應用的群策群力,對于未來發(fā)展無疑具備重要意義。
其二,是火山引擎基于全鏈路解決方案充分滿足客戶需求。“相比算力基礎等硬件設施,用戶(企業(yè))更關注的,一定是上層操作界面的體驗和直接的增量價值?!币环矫?,火山引擎避開了已經(jīng)同質化、內卷的“算力”競爭;另一方面,面向整個生命科學領域,火山引擎提供了覆蓋從基礎設施到平臺到應用的全鏈路解決方案,并且覆蓋了產(chǎn)學研各端,在充分滿足B端需求的同時,基于數(shù)據(jù)飛輪效應進一步帶動著企業(yè)及平臺快速發(fā)展。
其三,是火山引擎基于大模型服務平臺“火山方舟”提供著更智能的服務體驗。與其他很多云廠商單純提供算力、基礎底座不同,火山方舟平臺致力于降低推理成本,并聯(lián)合客戶做重點應用共建和應用落地,催化整個大模型、大算力在千行百業(yè)落地加速。諸如在生信領域,基于Bio-OS操作系統(tǒng)及AI大模型的加持,它允許企業(yè)完成科研知識檢索、論文精讀、數(shù)據(jù)分析Agent、論文編寫輔助等工作,更高效精準地開展學術研究,發(fā)現(xiàn)知識和科研決策。
值得一提的是,基于數(shù)億用戶及DAU產(chǎn)品打磨而來的內容生產(chǎn)能力、多人協(xié)同能力,也在火山引擎的發(fā)展中貢獻著力量。它也推動著有著互聯(lián)網(wǎng)基因的火山引擎打造極致化的產(chǎn)品體驗,諸如在科研領域中充分發(fā)揮內容創(chuàng)作、多人協(xié)同的優(yōu)勢,滿足教科研機構的需求。
隨著諸如火山引擎等云服務平臺繼續(xù)面向AI大變革時代不斷發(fā)揮自身平臺價值,助力生命科學領域降本增效、研究提速、商業(yè)創(chuàng)新,我們相信,一個生命科學領域大創(chuàng)新爆發(fā)的時代或許正在到來。