讲座主题: 文本分析中的主题提取方法:人机交互式主题构建
主 讲 人:蔡国瑞 副教授
主 持 人:沙勇忠 教 授
Understanding the content of a large text corpus can be assisted by topic modeling methods, but the discovered topics often do not make clear sense to human analysts. Interactive topic modeling addresses such problems by allowing a human to steer the topic model curation process (generate, interpret, diagnose, and refine). However, human have limited ability to work with the artifacts of computational topic models since they are difficult to interpret and harvest. This paper explores the nature of such challenges and provides a visual analytic solution in the context of supporting political scientists to understand the thematic content of online petition data. We use interactive topic modeling of the White House online petition data as a lens to bring up key points of discussions and to highlight the unsolved problems as well as potentials utilities of visual analytics methods.
蔡国瑞,亚洲bet57365游戏大厅萃英讲席教授,美国宾西法尼亚州立大学信息科学与技术学院副教授(终身教职)。1999年加入美国宾西法尼亚州立大学,是该校“信息科学与技术学院”的五位创始人之一。 “空间信息与智能实验室”主任;国际计算机学会(ACM)、电气电子工程师学会(IEEE)、和美国地理学会(AAG)会员; 国际遥感与测量学会第五工作组执委会委员; 中-美联合国际研讨会“Geo-Collaborative Crisis Management”组委会主席(2008)。先后二十多次担任国际会议的评审组成员或审稿人;数十次应邀在大型国际学术会议上作专题报告。其研究兴趣涵盖信息科学、信息处理与检索、人-机交互、信息可视化、协同工作环境等。曾主持和参与若干重大项目,包括“基于语言和手势的人-机对话式地理信息虚拟环境”(美国NSF),中-美数字政府合作项目:“基于地理信息的部门协同应急管理”(中国NSF和美国NSF),以及“利用地理信息与遥感技术建模研究植被与全球气候变化的动态关系”(美国宇航局)。