基于机械进修的论文作者名消歧办法研究

作者:邓可君;华凯;邓昌明;姜宁;袁玲;彭一明;张治坤; 刊名:四川大年夜学学报(天然迷信版) 上传者:潘平

【摘要】本文提出了一种基于规矩婚配和机械进修的论文作者名主动化消歧办法:起首基于人工构建的人名婚配规矩肯定候选作者,关于存在多个候选人的情况,基于论文的属性信息(例如协作者、标题、摘要、关键词和出版物称号等)提取特点,然后拔取合适的机械进修算法停止消歧.实验后果注解K近邻和Softmax分类器较合适于论文作者名消歧义务;另外,将作者信息与论文的其他信息分开提取特点可以或许有效进步着者名消歧的精确性.

全文浏览

2019年3月 四川大年夜学学报(天然迷信版) Mar.2019第56卷 第2期 Journal of Sichuan University(Natural Science Edition) Vol.56 No.2 doi:10.3969/ ji.ssn.0490-6756.2019.02.010 基于机械进修的论文作者名消歧办法研究 邓可君,华 凯,邓昌明,姜 宁,袁 玲,彭一明,张治坤 (北京大年夜学计算中间,北京100871) 摘 要:本文提出了一种基于规矩婚配和机械进修的论文作者名主动化消歧办法:起首基于人工构建的人名婚配规矩肯定候选作者,关于存在多个候选人的情况,基于论文的属性信息(例如协作者、标题、摘要、关键词和出版物称号等)提取特点,然后拔取合适的机械进修算法停止消歧.实验后果注解 K近邻和Softmax分类器较合适于论文作者名消歧义务;另外,将作者信息与论文的其他信息分开提取特点可以或许有效进步着者名消歧的精确性.关键词:作者名消歧;机械进修;文本特点提取 中图分类号:TP391.1   文献标识码:A   文章编号:0490-6756(2019)02-0241-05 收稿日期:2018-06-28 作者简介:邓可君(1986-),女,湖南长沙人,博士生,工程师,研究偏向为信息处理.E-mail:kejund@pku.edu.cn通信作者:张治坤.E-mail:zhangzhikun@pku.edu.cn Research on author name disambiguation method based on machine learning DENG Ke - Jun , HUA Kai , DENG Chang - Ming , JIANG Ning , YUAN Ling , PENG Yi - Ming , ZHANG Zhi - Kun ( Computer Center,Peking University,Beijing 100871,China) Abstract:This paper proposes an automatic article author name disambiguation method based on rule matching and machine learning.For each article,the candidate authors are determined based on artificialconstructed name matching rules firstly.For the cases of multiple candidates,features are extractedfrom the attribute information of the article,such as collaborators,title,abstract,key words and publi-cation name,and then selected machine learning models are applied to author name disambiguating.The experimental results show that the K-nearest neighbor and Softmax classifier are more suitable for theauthor name disambiguation task than other mod

参考文献

引证文献

问答

我要提问