忠縣橡膠止水帶@百度為2019語言與智能技術(shù)競賽添磚加瓦!
橡膠止水帶@百度為2019語言與智能技術(shù)競賽添磚加瓦!由計算機學會(CCF)和中文信息學會(CIPS)聯(lián)合主辦,百度公司、計算機學會中文信息技術(shù)專委會和中文信息學會評測工作委員會聯(lián)合承辦的“2019語言與智能技術(shù)競賽”于2月25日啟動報名之后,得到了海內(nèi)外AI研發(fā)者的積極響應(yīng)。截至3月21日,已有全球1669支隊伍和個人注冊報名,目前競賽仍在火熱報名中。報名通道將于3月31日關(guān)閉,同時將對報名者開放全部訓練數(shù)據(jù),歡迎登錄競賽官網(wǎng)進行報名和下載。本次競賽獲勝團隊將分享總額達27萬的獎金,并將在第四屆“語言與智能高峰論壇”進行頒獎。誠邀全球AI人才報名參加本次競賽。
報名的1669隊伍中,有767支來自192所高校和科研院所的年輕隊伍,占比超過52%。據(jù)統(tǒng)計信息,全國211高校中70%的高校有研究團隊報名參賽,成為參賽隊伍的主力。值得一提的是,參賽的隊伍覆蓋了20多所海外知名院校,分別來自美國、加拿大、英國、澳大利亞、荷蘭、日本等8個。除此以外,有357支參賽隊伍來自微軟、騰訊、華為、阿里巴巴、移動、工商銀行等226家知名企業(yè),涉及科研領(lǐng)域及互聯(lián)網(wǎng)、數(shù)碼3C、金融、通訊、家電等多個垂直行業(yè)。
本屆競賽設(shè)立了三個任務(wù),包括機器閱讀理解、知識驅(qū)動對話和信息抽取,為全球開發(fā)者提供了具有挑戰(zhàn)性的競技舞臺。。其中,機器閱讀理解任務(wù)是“2018機器閱讀理解技術(shù)競賽”的延伸,今年任務(wù)設(shè)置上更有挑戰(zhàn)性。
百度公司作為本次競賽承辦方,為選手提供了全面的技術(shù)及資源支持,三大任務(wù)上,百度分別開發(fā)了的、基于深度學習框架的開源基線模型,幫助選手快速進入開發(fā)工作,大幅提升參賽效率。

其中,機器閱讀理解任務(wù)提供了基于BiDAF的模型作為基線系統(tǒng)。BiDAF是基于LSTM以及注意力機制的經(jīng)典閱讀理解模型,在多項閱讀理解任務(wù)上均表現(xiàn)良好。在2018機器閱讀理解技術(shù)競賽中,超過80%的參賽選手都基于BiDAF基線進行開發(fā),取得了優(yōu)異的競賽成績。值得一提的是,本屆競賽專門針對基于PaddlePaddle版本的BiDAF基線進行了升級,加入段落抽取模塊擴大召回,并利用先驗概率分布進行段落排序,顯著提升了模型效果。升級后的PaddlePaddle版本BiDAF基線效果可以進入去年競賽前十名。此外,參賽選手還將獲得已訓練好的模型參數(shù),從而更有效地進行開發(fā)。
知識驅(qū)動對話任務(wù)則提供了檢索和生成的兩種基線模型,這是目前對話技術(shù)中主流的兩個技術(shù)線條。檢索模型使用了目前學術(shù)界前沿的的BERT技術(shù),針對對話上下文和候選回復(fù)進行表示,在生成模型中使用Memory Network進行知識表示,并創(chuàng)新性的提出了使用后驗信息(回復(fù)中使用的知識信息)指導(dǎo)模型知識選擇策略的學習,效果上顯著超越基準模型。
信息抽取任務(wù)提供的是業(yè)界主流的pipeline解決方案,其創(chuàng)新性地提出行關(guān)系分類,再進行實體標注的pipeline結(jié)構(gòu),即先基于深層堆疊雙向LSTM網(wǎng)絡(luò)結(jié)構(gòu)進行多標簽關(guān)系分類,再依據(jù)關(guān)系類型采用深層堆疊雙向LSTM-CRF序列標注模型進行subject、object的實體論元標注,高效解決了重疊實體的關(guān)系抽取問題,顯著提升模型準召效果,可以更好地為選手開發(fā)服務(wù)。
基線版本上,本次比賽同時提供了閱讀理解、信息抽取任務(wù)的PaddlePaddle版基線模型,以及基于檢索實現(xiàn)的知識驅(qū)動對話任務(wù)PaddlePaddle基線模型,基于生成實現(xiàn)的PaddlePaddle版基線模型將于近期發(fā)布。PaddlePaddle是百度研發(fā)的開源開放的深度學習平臺,是早開源、也是當前一個功能完備的深度學習平臺,具有簡潔、穩(wěn)定、訓練和預(yù)測速度快等特點。依托百度業(yè)務(wù)場景的長期錘煉,PaddlePaddle有全面的官方支持的工業(yè)級應(yīng)用模型,涵蓋自然語言處理、計算機視覺、推薦引擎等多個領(lǐng)域,并開放多個的預(yù)訓練中文模型,以及多個在范圍內(nèi)取得競賽的算法模型。
資源上,百度將在AI Studio平臺上為參賽選手免費提供GPU集群計算資源,并預(yù)置PaddlePaddle版本基線。AI Studio是百度深度學習一站式開發(fā)平臺,集成了PaddlePaddle開發(fā)環(huán)境、數(shù)據(jù)集和免費算力資源。參賽者借助AI Studio的平臺資源和預(yù)置PaddlePaddle基線,可快速進入模型訓練階段,達到事半功倍的效果。
作為本屆競賽的承辦方,百度不僅為參賽選手提供了三大任務(wù)開源基線系統(tǒng),也開放了大規(guī)模標注的中文數(shù)據(jù)集。百度對于人工智能研發(fā)一直秉承“開放賦能、生態(tài)共贏”的態(tài)度。截至目前,百度大腦開放平臺已對外開放158項AI技術(shù)和能力,更多能力也會逐步地開放出來,供開發(fā)者調(diào)用。開放生態(tài)之下,百度大腦平臺已匯集超100萬開發(fā)者,日調(diào)用量超過4000億,覆蓋20多個行業(yè)。在開放生態(tài)雨林中,百度與360行合作伙伴共同繪制智能生活藍圖,進一步提升我國人工智能實力,讓復(fù)雜的世界變得更簡單。
2019語言與智能技術(shù)競賽報名日期截止于3月31日,將于4月1日至5月20日進行比賽,5月底公布競賽結(jié)果。百度誠邀全球AI人才報名參加本次競賽,與海內(nèi)外眾多開發(fā)者一較高下。具體報名方式及更多賽事信息登錄2019語言與智能技術(shù)競賽官網(wǎng)了解。
| 分享此文章: |
產(chǎn)品中心 Product Center
聯(lián)系電話:15303381562
聯(lián)系人:王經(jīng)理
QQ:249637288
地址:河北省衡水濱湖新區(qū)彭杜鄉(xiāng)西三景官二區(qū)38號
