6月28日,哲学社会学科百名优秀学者培育计划学术报告在经管楼609会议室召开,邓晓懿博士主讲“大数据环境下个性化推荐系统评价指标评述”。
报告分为推荐系统评价方法、推荐准确度指标和基于排序加权的指标三部分。以“互联网时代为什么要信息推荐”为引论,邓晓懿举例说明各种推荐系统,如Facebook、Google等。他介绍了“在线评价”和“离线评价”两种推荐系统的评价方法,相较于能直观地反映用户系统评价的“在线评价”,“离线评价”更经济,并且已是当前的研究焦点。在推荐准确度指标部分,邓晓懿从预测评分准确度、预测评分关联度、分类准确度和排序准确度四类对其进行阐述。他指出,预测评分准确度分类之一的“RMSE标准误差”能较好地反映出测量的精密度,并在工程中被广泛应用,而预测评分关联度使用度不高、可解释性不强。他还通过“用户对各种电影进行排序”的举例对排序准确度做解释。在基于排序加权的指标部分,他以Half-Life utility(HL)、Discounted Cumulative Gain(DCG)和Rank-Biased Precision(RBP)三个指标为代表进行了说明。
在现场互动中,听众对“用户排序问题”进行讨论,并结合报告内容提出问题。邓晓懿就“如何在海量数据中提取有效信息?”这一疑问做解答,他表示“系统降维”会根据用户需要帮助用户进行分类,并举出“亚马逊网书设置分类”和“微软公司定期降维”的例子以佐证。
邓晓懿,工学博士,太阳集团见好就收97282014年度哲学社会科学百名优秀学者培育计划入选者,现为太阳集团副教授,硕士生导师。目前主要研究领域:个性化推荐、大数据分析。
邓晓懿老师讲解
文:张钟元 陈洋 图:史烨薇