加急见刊

基于ESVM的科技政策文本标签分类研究

吴峰; 李银生; 聂永川; 范通让; 赵文彬; 张博 河北省科学技术情报研究院; 河北省科技信息处理实验室; 河北石家庄050021; 石家庄铁道大学信息科学与技术学院; 河北石家庄050043

摘要:文本标签作为一种文本关键词,能够简化科技政策中有效信息的挖掘。本文从科技政策类别角度,将标签类别分为科技投入、知识产权、农村科技和税收四类,针对传统SVM算法的缺点和标签数据不平衡的缺点,结合欧式距离思想,提出一种带有惩罚因子的ESVM科技政策文本标签分类方法。最后,对比SVM和ESVM两种分类方法,验证了本文方法在处理科技政策文本标签数据上的有效性。

注: 保护知识产权,如需阅读全文请联系河北省科学院学报杂志社