开心六月综合激情婷婷|欧美精品成人动漫二区|国产中文字幕综合色|亚洲人在线成视频

    1. 
      
        <b id="zqfy3"><legend id="zqfy3"><fieldset id="zqfy3"></fieldset></legend></b>
          <ul id="zqfy3"></ul>
          <blockquote id="zqfy3"><strong id="zqfy3"><dfn id="zqfy3"></dfn></strong></blockquote>
          <blockquote id="zqfy3"><legend id="zqfy3"></legend></blockquote>
          打開APP
          userphoto
          未登錄

          開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

          開通VIP
          成立快兩年,阿里巴巴達(dá)摩院都干什么了?

          達(dá)摩院成立快兩年之際,機(jī)器智能技術(shù)實(shí)驗(yàn)室搶先展示了一下成績。

          2017 年10 月,阿里成立了達(dá)摩院,覆蓋5 個(gè)研究領(lǐng)域,建有14 個(gè)實(shí)驗(yàn)室。除了上述的“機(jī)器智能”,達(dá)摩院研究大方向還有數(shù)據(jù)計(jì)算、機(jī)器人、金融科技、X 實(shí)驗(yàn)室。

          機(jī)器智能技術(shù)實(shí)驗(yàn)室側(cè)重于AI 相關(guān)技術(shù)的基礎(chǔ)研究,旗下設(shè)有語音實(shí)驗(yàn)室、視覺實(shí)驗(yàn)室、語言技術(shù)實(shí)驗(yàn)室、決策職能實(shí)驗(yàn)室、以及城市大腦實(shí)驗(yàn)室。

          近日,達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室舉辦了一場小型媒體溝通會(huì),幾位技術(shù)專家向外界介紹了最新成果和進(jìn)展。

          兼具表現(xiàn)力和穩(wěn)定性的語音合成技術(shù)

          首先,機(jī)器智能技術(shù)實(shí)驗(yàn)室正式發(fā)布了新的語音合成技術(shù)KAN-TTS(KAN 指的是Knowledge-Aware Neural)。TTS(Text-To-Speech,文本到語音)是一種將文字轉(zhuǎn)化成語音的技術(shù),智能音箱、個(gè)人虛擬助理都需要這種技術(shù)支持。

          達(dá)摩院機(jī)器智能語音實(shí)驗(yàn)室高級算法專家雷鳴介紹,當(dāng)前業(yè)界商用系統(tǒng)的合成語音與原始音頻錄音的接近程度,通常在85%到90%之間,而基于KAN-TTS技術(shù)的合成語音可將該數(shù)據(jù)提高到97%以上。

          簡單來說,KAN-TTS 合成的語音更加像真人的語音,“接近真人韻律的感覺”。

          “我們新一代的TTS 解決方案深度融合了傳統(tǒng)TTS 和端到端TTS,基于不同領(lǐng)域的深層Knowledge。”雷鳴介紹道。

          所謂端到端TTS,即不依靠領(lǐng)域知識,基于強(qiáng)大的深度學(xué)習(xí)模型、海量數(shù)據(jù)來生成音頻,優(yōu)勢是大大節(jié)省設(shè)計(jì)的工作,并且得到更加流暢、表現(xiàn)力更好的合成語音,但需要大量計(jì)算力支持,而且會(huì)出現(xiàn)丟字、漏字等不穩(wěn)定的情況。Google 的Tacotron 和DeepMind 的WaveNet 都是典型的端到端TTS 模型。

          而傳統(tǒng)TTS 需要花費(fèi)大量時(shí)間和精力去了解相關(guān)的領(lǐng)域知識,設(shè)計(jì)難度較高,但勝在合成的語音比較穩(wěn)定。

          通過將傳統(tǒng)TTS 和端到端TTS 的結(jié)合,KAN-TTS 結(jié)合了兩者的優(yōu)勢,充分利用不同領(lǐng)域的深層Knowledge,合成表現(xiàn)力和穩(wěn)定性具佳的語音。

          針對不同的需求,機(jī)器智能技術(shù)實(shí)驗(yàn)室提供了“開箱即用”的TTS 產(chǎn)品,覆蓋5 大場景(通用場景、客服場景、童聲場景、英文場景和方言場景),具備34 個(gè)高品質(zhì)的聲音。

          除了“開箱即用”的聲音,達(dá)摩院這個(gè)語音合成方案還能讓專業(yè)用戶定制聲音。

          傳統(tǒng)語音合成定制需要10小時(shí)以上的數(shù)據(jù)錄制和標(biāo)注,對錄音人和錄音環(huán)境要求很高?!皬膯?dòng)定制到最終交付,需要半年時(shí)間”。而達(dá)摩院利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jié)合的方法,將語音合成定制成本降低10倍以上,周期壓縮3倍以上。

          也就是說,用1小時(shí)有效錄音數(shù)據(jù)和不到兩個(gè)月制作周期,就能完成一次標(biāo)準(zhǔn)TTS 定制。

          此外,普通用戶也可以自己定制“AI聲音”,只需手機(jī)錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音。

          語音、自然語言、視覺各領(lǐng)域都有新成績

          除了公布新語言合成方案,機(jī)器智能技術(shù)實(shí)驗(yàn)室還亮出了新成績。

          機(jī)器智能技術(shù)實(shí)驗(yàn)室透露,阿里AI在國際頂級技術(shù)賽事上獲得了40多項(xiàng)世界第一,入選了近400篇國際頂會(huì)論文。具體到細(xì)分領(lǐng)域,機(jī)器智能技術(shù)實(shí)驗(yàn)室最近都有不同建樹。

          語音領(lǐng)域,2019年1月機(jī)器智能技術(shù)實(shí)驗(yàn)室在國際頂級對話系統(tǒng)評測大賽(DSTC-7)上獲得雙料冠軍,將人機(jī)對話準(zhǔn)確率的世界紀(jì)錄提升至94.1%,并于2019年7月開源了創(chuàng)造這一記錄背后的人機(jī)對話模型ESIM。

          事實(shí),該算法模型提出了兩年多,已被包括谷歌、facebook在內(nèi)的國際學(xué)術(shù)界在200多篇論文中引用。

          自然語言理解方面,機(jī)器智能技術(shù)實(shí)驗(yàn)室在6 月的MS MARCO 文本閱讀理解挑戰(zhàn)賽中,擊敗了Facebook和微軟,創(chuàng)造了閱讀理解能力測試的新紀(jì)錄,并在開放域問答任務(wù)上超越人類閱讀水平。

          MS MARCO 挑戰(zhàn)賽是AI 閱讀理解領(lǐng)域的權(quán)威比賽,參賽機(jī)構(gòu)提供的AI 模型需要在搜索引擎返回的網(wǎng)頁文檔中,找出100 萬個(gè)問題的正確答案。

          阿里方面介紹,阿里AI 模型的突破在于提出了基于“融合結(jié)構(gòu)化信息BERT 模型” 的“深度級聯(lián)機(jī)器閱讀模型”,可以模仿人類閱讀理解的過程,先對文檔進(jìn)行快速瀏覽,判斷,然后針對相應(yīng)段落進(jìn)行精讀,并根據(jù)“自己的理解” 回答問題。

          達(dá)摩院機(jī)器翻譯技術(shù)團(tuán)隊(duì)已實(shí)現(xiàn)了48個(gè)語言翻譯方向,支持俄、西、法、阿、土,泰、印尼、越南等多種語言翻譯,其中電商覆蓋了大部分語向和場景,超越了谷歌和亞馬遜,日調(diào)用量達(dá)到17.9億次。

          在機(jī)器視覺領(lǐng)域,機(jī)器智能技術(shù)實(shí)驗(yàn)室在圖像搜索、大規(guī)模圖像識別、視頻分析、線下視覺智能等領(lǐng)域都有所建樹。其中,圖像搜索領(lǐng)域,阿里AI 的向量引擎比Facebook快6倍。

          機(jī)器智能技術(shù)實(shí)驗(yàn)室在6 月份剛剛結(jié)束的WebVision 競賽中,阿里AI 以82.54% 的識別準(zhǔn)確率,擊敗了全世界150多支參賽隊(duì)伍,獲得冠軍。機(jī)器智能技術(shù)實(shí)驗(yàn)室稱,阿里AI 目前可以識別超過100 萬種物理實(shí)體。

          WebVison 是目前圖像識別領(lǐng)域最權(quán)威的競賽之一,專注于物體識別,被譽(yù)為接棒ImageNet 的大規(guī)模圖像識別競賽。

          7 月,在CVPR2019舉辦的LPIRC(低功耗圖像識別挑戰(zhàn)賽)中,阿里AI獲得在線圖像分類任務(wù)第一名。在挑戰(zhàn)賽使用的訓(xùn)練數(shù)據(jù)集上,阿里AI實(shí)現(xiàn)了67.4%的分類精度,比官方提供的基準(zhǔn)線高3.5%。

          值得注意的是,上述只是達(dá)摩院旗下機(jī)器智能技術(shù)實(shí)驗(yàn)室的進(jìn)展和成績。到2019 年10 月達(dá)摩院兩周年之際,會(huì)有更加全面的消息公布。

          本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
          打開APP,閱讀全文并永久保存 查看更多類似文章
          猜你喜歡
          類似文章
          阿里巴巴開源語音識別模型 DFSMN | 雷鋒網(wǎng)
          【研究院】一年了,再看看江湖中的達(dá)摩院
          【探秘達(dá)摩院之語音實(shí)驗(yàn)室】對AI說你好壞,它能懂你什么意思嗎?
          走訪阿里達(dá)摩院:用機(jī)器視覺做廣告設(shè)計(jì) 用機(jī)器翻譯推動(dòng)國際電商
          圖解阿里達(dá)摩院內(nèi)部結(jié)構(gòu)
          對話鄢志杰:語音行業(yè)十五年老兵的沿途風(fēng)景
          更多類似文章 >>
          生活服務(wù)
          分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
          綁定賬號成功
          后續(xù)可登錄賬號暢享VIP特權(quán)!
          如果VIP功能使用有故障,
          可點(diǎn)擊這里聯(lián)系客服!

          聯(lián)系客服