2019年4月2日,京東AI研究院自然語(yǔ)言處理組在最難之一的WikiHop機(jī)器閱讀數(shù)據(jù)集(https://qangaroo.cs.ucl.ac.uk/)中以74.3%的盲測(cè)試集精準(zhǔn)度斬獲WikiHop數(shù)據(jù)集排行榜第一,并超越該數(shù)據(jù)集官方給出的人類表現(xiàn)水平74.1%的精準(zhǔn)度。
值得一提的是,京東AI已計(jì)劃將自主研發(fā)的這些優(yōu)秀機(jī)器閱讀能力應(yīng)用于人工智能導(dǎo)購(gòu),虛擬個(gè)人助理,城市助手,合理用藥發(fā)動(dòng)機(jī)等多個(gè)領(lǐng)域,旨在降低成本、提高效率、提升體驗(yàn)。
WikiHop數(shù)據(jù)集是倫敦學(xué)院(UCL)機(jī)器學(xué)習(xí)組提出的一個(gè)需要跨多文檔、多跳推理的機(jī)器閱讀理解數(shù)據(jù)庫(kù)。每一個(gè)WikiHop的樣本有一個(gè)問(wèn)題,多個(gè)支持文檔,和一個(gè)備選答案集,模型需要根據(jù)問(wèn)題從多個(gè)文檔中搜集證據(jù),最后從備選答案集中挑選出正確的答案。由于其更具挑戰(zhàn)性的設(shè)置,WikiHop閱讀理解數(shù)據(jù)集一經(jīng)發(fā)布吸引了全球眾多高校和科研機(jī)構(gòu)的參與,包括來(lái)自卡耐基梅隆大學(xué),南洋理工大學(xué),F(xiàn)acebook AI研究院,IBM,羅切斯特大學(xué),阿姆斯特丹大學(xué),愛(ài)丁堡大學(xué)以及Salesforce等多個(gè)研究小組。
WikiHop數(shù)據(jù)集最新成績(jī)榜單(截至2019年4月2日)
人類的知識(shí)大多是通過(guò)閱讀獲得,所以機(jī)器閱讀技術(shù)在智能對(duì)話與服務(wù)中有極高的應(yīng)用價(jià)值,是對(duì)話發(fā)動(dòng)機(jī)的知識(shí)的重要來(lái)源之一。在中國(guó),技術(shù)與產(chǎn)業(yè)的融合正在如火如荼進(jìn)行,在全球,學(xué)術(shù)研究也越來(lái)越關(guān)注技術(shù)的應(yīng)用價(jià)值。這次京東在機(jī)器閱讀技術(shù)上的突破性研究,也將對(duì)許多相關(guān)的應(yīng)用帶來(lái)創(chuàng)新。
此外,這一最新技術(shù)在京東的業(yè)務(wù)中會(huì)有廣泛的應(yīng)用,在諸如內(nèi)容審核、評(píng)論觀點(diǎn)抽取、情感分析、情感客服等多個(gè)場(chǎng)景中,都需要大規(guī)模的機(jī)器閱讀技術(shù)處理海量的數(shù)據(jù)。目前京東已將一系列的AI能力已沉淀到京東人工智能開(kāi)放平臺(tái)NeuHub之上,2018年11.11期間,NeuHub平臺(tái)的累計(jì)調(diào)用量達(dá)到148.7億次。