近日,國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)年會(huì)(ACL,The Association for Computational
Linguistics)在官網(wǎng)公布了ACL 2020的論文收錄名單,共計(jì)收錄779篇論文。據(jù)不完全統(tǒng)計(jì),此次騰訊共有27篇論文入選,投中論文總數(shù)刷新國(guó)內(nèi)記錄,領(lǐng)跑?chē)?guó)內(nèi)業(yè)界AI研究第一梯隊(duì)。
本年度騰訊ACL入選論文中,有20篇來(lái)自騰訊AI Lab團(tuán)隊(duì),7篇來(lái)自微信AI團(tuán)隊(duì),研究方向涵蓋對(duì)話(huà)及文本生成、機(jī)器翻譯及文本理解、信息抽取、無(wú)監(jiān)督文本等多個(gè)NLP重點(diǎn)領(lǐng)域。
在過(guò)去一年,通過(guò)開(kāi)源協(xié)同,騰訊梳理拉通了各個(gè)事業(yè)群最底層和共性的技術(shù)能力,加強(qiáng)了基礎(chǔ)研發(fā)投入,進(jìn)一步提升了研發(fā)效能和技術(shù)資源的利用效率,為AI技術(shù)的研發(fā)創(chuàng)新提供了更有生命力的土壤。
ACL是自然語(yǔ)言處理領(lǐng)域的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議,也是自然語(yǔ)言處理領(lǐng)域影響力最大、最具活力的國(guó)際學(xué)術(shù)組織之一,論文被錄用代表著研究成果獲得了國(guó)際學(xué)術(shù)界的認(rèn)可。此次ACL 2020的審稿周期相比以往幾乎增加了一倍的時(shí)間,據(jù)最新公布數(shù)據(jù)顯示,本屆大會(huì)最終收到投稿論文3088篇,投稿數(shù)量創(chuàng)下新高。
技術(shù)實(shí)力強(qiáng)勁,AI基礎(chǔ)研究?jī)?yōu)勢(shì)突出
近年來(lái),騰訊在AI基礎(chǔ)研究方面持續(xù)投入,致力于打造面向未來(lái)的技術(shù)引擎。騰訊AI團(tuán)隊(duì)在ACL 2019入選國(guó)內(nèi)首篇最佳長(zhǎng)論文,在ICML、CVPR、NeurIPS、ACL等多個(gè)頂級(jí)學(xué)術(shù)會(huì)議或期刊累計(jì)入選論文超過(guò)285篇,并在DSTC 8等多項(xiàng)競(jìng)賽奪冠,展現(xiàn)了業(yè)界領(lǐng)先的研究能力與技術(shù)實(shí)力。
自然語(yǔ)言處理是騰訊 AI Lab 的重要研究方向之一,研究?jī)?nèi)容囊括了從自然語(yǔ)言理解到生成的整個(gè)鏈條。2019年,騰訊AI Lab在人機(jī)對(duì)話(huà)與文本生成方面,提出多種對(duì)話(huà)生成新框架,發(fā)布了多個(gè)對(duì)話(huà)數(shù)據(jù)集,同時(shí)還改進(jìn)了開(kāi)放域?qū)υ?huà)系統(tǒng)。在機(jī)器翻譯研究方面,騰訊AI Lab探索了主流翻譯模型中的自注意力模型改進(jìn)和篇章翻譯,并嘗試打開(kāi)神經(jīng)網(wǎng)絡(luò)翻譯模型的黑盒子,解釋其中核心問(wèn)題的運(yùn)行機(jī)制。
微信AI團(tuán)隊(duì)也長(zhǎng)期深耕對(duì)自然語(yǔ)言處理領(lǐng)域人工智能技術(shù)的研發(fā),擁有微信智言與微信智聆等領(lǐng)先的NLP技術(shù)產(chǎn)品,其入選ACL 2020 的7篇論文,涉及了機(jī)器翻譯、對(duì)話(huà)系統(tǒng)、信息抽取、無(wú)監(jiān)督文本生成等領(lǐng)域。2019年,微信AI團(tuán)隊(duì)?wèi){借NumNet+模型,超越谷歌獲得DROP閱讀理解榜單第一名。
應(yīng)用場(chǎng)景豐富,面向行業(yè)開(kāi)放技術(shù)能力
頂尖的產(chǎn)品背后離不開(kāi)頂尖的技術(shù)。騰訊豐富的業(yè)務(wù)場(chǎng)景、龐大的用戶(hù)基數(shù),都為前沿的AI研究成果提供了最佳的“訓(xùn)練場(chǎng)”。在此基礎(chǔ)上,騰訊也將充分打磨的技術(shù)能力通過(guò)騰訊云以產(chǎn)品和服務(wù)的形式面向金融、政務(wù)、醫(yī)療、交通、教育等各行業(yè)開(kāi)放,為眾多客戶(hù)和合作伙伴提供底層技術(shù)支撐,助力產(chǎn)業(yè)互聯(lián)網(wǎng)進(jìn)入快車(chē)道。
目前,微信 AI 團(tuán)隊(duì)推出了“微信智聆”和“微信智言”兩大技術(shù)能力品牌,分別關(guān)注語(yǔ)音和語(yǔ)義。微信智聆每天處理超過(guò) 4 億條語(yǔ)音,識(shí)別準(zhǔn)確率為 97%,服務(wù)于騰訊內(nèi)外超過(guò) 100 項(xiàng)業(yè)務(wù)。微信智言專(zhuān)注于智能對(duì)話(huà)和自然語(yǔ)言處理,目前已經(jīng)支持家居硬件、PaaS、行業(yè)云和AI Bot等應(yīng)用領(lǐng)域。
微信AI團(tuán)隊(duì)還將技術(shù)的精進(jìn)不斷用于產(chǎn)品功能,研發(fā)了語(yǔ)音輸入轉(zhuǎn)文字、掃一掃的掃碼 / 封面和翻譯、聊天機(jī)器人、搖一搖 – 音樂(lè) / 電視、聲紋鎖等功能,并為王者榮耀、QQ 音樂(lè)等產(chǎn)品提供技術(shù)支持。
在2020年初的微信公開(kāi)課PRO版上,微信AI宣布開(kāi)放以硬件合作為核心的騰訊小微硬件開(kāi)放平臺(tái)、以對(duì)話(huà)開(kāi)放能力為核心的微信對(duì)話(huà)開(kāi)放平臺(tái)和NLP基礎(chǔ)技術(shù)平臺(tái),全面開(kāi)放各層次 NLP 能力,面向行業(yè)用戶(hù)及開(kāi)發(fā)者,開(kāi)放微信前沿的NLP研究成果。
騰訊 AI Lab則在2018年11月推出了TranSmart產(chǎn)品,采用業(yè)內(nèi)領(lǐng)先的人機(jī)交互式機(jī)器翻譯技術(shù),幫助用戶(hù)更好更快地完成翻譯任務(wù)。
今年4月,騰訊AI Lab研發(fā)的自然語(yǔ)言理解系統(tǒng)TexSmart也對(duì)外開(kāi)放,提供細(xì)粒度命名實(shí)體識(shí)別、語(yǔ)義聯(lián)想、深度語(yǔ)義表達(dá)等特色功能。TexSmart是騰訊公司級(jí)文本處理工具的功能加強(qiáng)版,為自然語(yǔ)言處理相關(guān)的騰訊業(yè)務(wù)及產(chǎn)品提供廣泛支持,日調(diào)用量達(dá)數(shù)千億次。
除了產(chǎn)品和技術(shù)能力的開(kāi)放,騰訊還致力于通過(guò)開(kāi)源與開(kāi)發(fā)者共享代碼,目前開(kāi)源項(xiàng)目總數(shù)已破百。
僅在AI領(lǐng)域,騰訊已開(kāi)源Angel、NCNN等數(shù)十個(gè)優(yōu)質(zhì)項(xiàng)目。針對(duì)業(yè)界現(xiàn)有的中文詞向量公開(kāi)數(shù)據(jù)的稀缺和不足,騰訊AI Lab開(kāi)源了大規(guī)模、高質(zhì)量的中文詞向量數(shù)據(jù),包含了800多萬(wàn)中文詞匯,相比現(xiàn)有的公開(kāi)數(shù)據(jù),在覆蓋率、新鮮度及準(zhǔn)確性上均有大幅提高,為對(duì)話(huà)回復(fù)質(zhì)量預(yù)測(cè)和醫(yī)療實(shí)體識(shí)別等自然語(yǔ)言處理方向的業(yè)務(wù)應(yīng)用帶來(lái)顯著的效能提升。
原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請(qǐng)注明出處:http://rponds.cn/article/495903.html