MS MARCO 排行榜
MS MARCO 官方 twitter 發(fā)出的祝賀
據(jù)了解,百度NLP在MARCO提交的V-NET模型,使用了一種新的多候選文檔聯(lián)合建模表示方法,通過(guò)注意力機(jī)制使不同文檔產(chǎn)生的答案之間能夠產(chǎn)生交換信息,互相印證,從而更好的預(yù)測(cè)答案。此外,此次百度是單模型(single model)拿到了第一,并沒(méi)有提交更容易拿高分的多模型集成(ensemble)結(jié)果。
百度自然語(yǔ)言處理首席科學(xué)家兼百度技術(shù)委員會(huì)主席吳華表示,此次在MARCO的測(cè)試中取得第一,只是百度機(jī)器閱讀理解技術(shù)經(jīng)歷的一次小考,我們希望能夠與領(lǐng)域內(nèi)的其他同行者一起,推進(jìn)機(jī)器閱讀理解技術(shù)和應(yīng)用的研究,使AI能夠理解人類(lèi)的語(yǔ)言、用自然語(yǔ)言與人類(lèi)交流。
據(jù)悉,微軟MARCO是微軟基于搜索引擎BING構(gòu)建的大規(guī)模英文閱讀理解數(shù)據(jù)集,包含10萬(wàn)個(gè)問(wèn)題和20萬(wàn)篇不重復(fù)的文檔。MARCO數(shù)據(jù)集中的問(wèn)題全部來(lái)自于 BING 的搜索日志,根據(jù)用戶(hù)在BING 中輸入的真實(shí)問(wèn)題模擬搜索引擎中的真實(shí)應(yīng)用場(chǎng)景,是該領(lǐng)域有應(yīng)用價(jià)值的數(shù)據(jù)集之一。官方微博
官方微信公眾號(hào)
官方百家號(hào)