點石成金!AI成功挖掘論文“寶藏”

2021年05月19日09:31  來源:科技日報
 
原標題:點石成金!AI成功挖掘論文“寶藏”

  英國《自然·生物技術》雜志18日發表一項跨越人工智能及生物技術的研究,美國麻省理工學院團隊研發的一個機器學習模型,可用於預測科學文獻中已發表研究的未來影響力。目前,這個模型的打分可用來預測任意年份發表的“前5%的論文”,其將能補充當前依賴論文引用量指標的文獻計量分析系統。

  現階段,有許多系統都被用來評估研究人員的科研產出,包括基於他們所著論文引用量的指標。隨著人工智能領域機器學習的興起,科學家們認為可以從研究人員產出的更多角度去評判他們發表研究的潛在影響力。

  為此,麻省理工學院研究團隊推出了一個機器學習模型,該模型能預測以時間為尺度的網頁排名分數——類似於用來給網頁重要性排名的指標,並提議將該模型用於評估研究人員的產出。

  為實現這個想法,科學家詹姆斯·維斯及約瑟夫·賈科布森建立了一個名為“通過學習預測高影響實現動態預警”的模型,並用科學研究圖譜加以訓練。研究團隊使用的數據集,包含1980年到2019年期間發表的1687850篇具有唯一性的論文,從中得到了論文發表后1年到5年與每例論文、作者、期刊、網絡相關的29個特征。研究團隊再用每篇論文的特征訓練一個機器學習模型,讓這個模型給出影響力“預警”分數。

  在一次回顧性盲法研究中,這一最新模型准確識別出了1980年到2014年間20項具有重大影響的生物技術中的19項。這個模型還預測,2018年在42本生物技術領域期刊發表的50篇論文可能會躋身未來排名的前5%,這一結果將能以數據驅動的方式發現並讓經費流向那些“深藏不露”的好研究。

  研究人員表示,在將這類模型應用於其他研究領域前,仍需開展進一步測試,將該方法在生物技術以外領域的表現與常規影響力指數相比較,比如領域歸一化的引用分數。(科技日報記者張夢然)

(責編:袁菡苓、羅昱)