SMP 2018 情感分析论坛


论坛概况

论坛时间:2018年8月4日 10:20-12:20

论坛简介:情感分析是社会媒体处理的一个重要子课题,近年来在自然语言处理领域引起广泛关注,特别是随着深度学习技术的发展,如何更加精准的判别文本中的情感仍旧是一个挑战性的问题。本次论坛邀请了来自南京理工大学、复旦大学、腾讯AI Lab和黑龙江大学的四位专家讲者,分别从情感分析中的极性转移和领域适应问题,论辩文本的质量评估,细粒度情感识别与抽取和端到端的细粒度情感要素分析等四个方面展现情感分析研究的前沿动态。具体报告内容如下:极性转移和领域适应问题是情感分析中的一个经典问题,南京理工大学的夏睿教授将围绕这两个问题介绍其最新工作进展;论辩质量评估是情感分析一个新兴的应用任务,复旦大学的魏忠钰教授将针对论辩质量研究的一些基本任务设定以及主流的计算模型进行介绍。腾讯AI Lab的邴立东高级研究员将针对面向目标的情感分类、评论目标抽取以及多领域情感词表示学习等任务介绍其最新研究进展。黑龙江大学的张梅山副教授将对端到端的细粒度情感要素分析这一任务进行分析,介绍目前存在的问题和解决办法,并对现有模型进行简要概括。

论坛主席:刘康副研究员(中国科学院自动化研究所)

主席简介:刘康,博士,现任中科院自动化所模式识别国家重点实验室副研究员,西安电子科技大学客座教授。研究领域包括信息抽取、网络挖掘、问答系统等,同时也涉及模式识别与机器学习方面的基础研究。在自然语言处理、知识工程等领域国际重要会议和期刊发表论文六十余篇(如TKDE、ACL、IJCAI、EMNLP、COLING、CIKM等),获得KDD CUP 2011 Track2 全球亚军,COLING 2014最佳论文奖,首届“CCF-腾讯犀牛鸟基金卓越奖”、2014年度中国中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新一等奖”、2015、2016 Google Focused Research Award等。


论坛嘉宾

南京理工大学计算机学院  夏睿  教授


报告主题:情感分析中的极性转移和领域适应问题
报告摘要:一方面,在当前的情感分析研究中,情感分析大多被当作一种文本分类任务,套用包括深度神经网络在内的文本分类框架进行解决,却往往忽视了情感分析的一些特殊语言学现象(如极性转移问题),使得情感分析的研究和讨论并不深刻。极性转移是指由于一些特殊的语言结构,使得文本中的情感发生转移的一种语言现象,包含否定、转折、加强、削弱等语言结构。另一方面,统计机器学习常常存在领域依赖的问题,即在某一领域(我们称之为源领域)标注样本上学习得到的分类器通常只在相同领域的测试样本上表现较好,换到其他领域(我们称之为目标领域),尤其是目标领域与源领域的分布相差较大的情况下,算法性能会大打折扣。这一领域依赖问题在情感分析任务中表现得尤为突出。 本报告围绕这两个特殊问题,回顾学术界的相关工作,并简介南京理工大学文本挖掘研究组在这两个问题上的一些工作进展。
嘉宾简介:夏睿,南京理工大学计算机学院教授、博导。2011年毕业于中科院自动化所,获得工学博士学位。一直从事自然语言处理、机器学习、数据挖掘、人工智能等方面的研究工作,在领域知名学术期刊和会议(IEEE TKDE, ACM TKDD, IEEE TAFFC, IEEE IS, INS, IPM, IJCAI, AAAI, ACL, EMNLP, COLING等)发表论文30余篇,其中以第一作者身份发表CCF A类、B类论文10余篇、ESI高被引论文2篇,一作论文他引800余次。主持国家自然科学基金面上项目、青年基金,江苏省优青、教育部博士点基金等各类纵向课题和企事业合作项目10余项。2014年入选南京理工大学紫金之星人才计划,2016年获得首届江苏省优青项目资助,2017年入选南京理工大学青年拔尖人才选聘计划并破格晋升为教授。兼任武汉烽火普天信息技术有限公司人工智能技术总监,并入选2017年武汉“3551光谷人才计划”短期创新人才。


复旦大学大数据学院  魏忠钰  青年副研究员


报告主题:论辩文本的质量评估方法研究
报告摘要:近年来,计算论辩学在自然语言处理领域得到越来越多的关注,当前的研究课题包括论辩内容检索、论辩文本结构分析、论辩策略研究以及论辩质量研究等。论辩质量研究旨在对于论辩的质量进行量化分析,它主要包括单体论辩质量 (monological argumentation ) 判别以及对话式论辩质量判别(dialogical argumentation)。单体论辩质量判别的一大应用场景是学生议论文自动评估,这对于互联网教育至关重要;而对话式论辩质量判别则面向多参与者的论辩研究。本报告将简单回顾当前对于论辩质量研究的一些基本任务设定以及主流的计算模型,并且重点介绍复旦大学自然语言处理组在论辩文本质量评估方面的一些工作,包括采用多重注意力机制的对话式论辩质量评估模型和结合了话题内容的单体式论辩质量评估模型。
嘉宾简介:魏忠钰,复旦大学大数据学院青年副研究员,硕士生导师,香港中文大学博士学位,美国德州大学达拉斯分校博士后,中国中文信息学会青年工作委员会委员,中文信息学会社交媒体处理专委会委员,入选2017年度上海市青年科技英才扬帆计划。主要研究领域为社交媒体分析,自动文本生成和论辩挖掘等,在相关领域的国际会议、期刊如ACL,SIGIR,EMNLP,IJCAI, COLING等发表学术论文20余篇。


腾讯人工智能实验室  邴立东  高级研究员


报告主题:Target Sentiment Analysis: Extraction, Classification, and Sentiment-Aware Embeddings
报告摘要:随着人工智能的深入发展,情感分析任务的重要性越来越凸显。该报告将介绍主讲人及合作者最近的几项工作。(1)面向目标的情感分类(Target Sentiment Prediction)框架RAM和TNet:RAM提出了一个基于多次注意力机制的模型,把每次注意力捕获到的情感信息进行非线性融合,再进行情感预测。TNet则使用卷积神经网络(CNN)替代基于注意力机制的循环神经网络(RNN)去提取最重要的分类特征,并引入了“特征变换”组件来利用目标信息和“上下文保留”机制利用上下文信息。RAM和TNet分别取得了EMNLP 2017和ACL 2018的最佳效果;(2)评论目标抽取(Opinion Target/Aspect Extraction)框架HAST:该框架利用了两个有用的线索:Opinion Summary是基于当前预测的token提炼于整个输入句子,其有助于当前 token是否为aspect的预测。另一个线索是从之前token预测提取的预测历史,此线索利用同位词关系和BIO约束来提升效果。HAST取得了该任务的当前最佳效果;(3)多领域情感词表示学习框架DSE:提出了一种学习领域适应和情感感知的词嵌入的新方法,能够同时捕获词的情感语义和领域信息,自动生成领域无关和领域相关的词向量,并且捕获来自不同领域的领域相关词的不同语义。得到的词向量提高了句子级和词汇级的情感分类性能。
嘉宾简介:邴立东,香港中文大学博士,卡内基梅隆大学博士后。现任腾讯人工智能实验室高级研究员,从事自然语言处理领域的研究,如情感分析、文本生成、知识库等。发表论文50余篇,如ACL、EMNLP、AAAI、IJCAI、SIGIR、KDD、TOIS等。个人主页:http://www.cs.cmu.edu/~lbing/


黑龙江大学  张梅山  副教授


报告主题:端到端的细粒度情感要素分析
报告摘要:当前主流的情感分析方法,往往是简单的对一段文本或者文本中的某个主题进行分类,这种做法对于互联网上的很多应用支持还存在一些欠缺。而细粒度的情感要素分析则针对一个具体的情感表达,不仅仅只是获取其情感极性,而且将其情感的表述方式,情感的对象、情感的持有者以及产生情感的原因全部挖掘出来,形成结构化的知识,这些结构化的情感聚集,具有更重要的潜在价值,对公司决策和商业管理更有帮助。本次报告主要描述目前这一任务存在的问题以及相应的解决方法,并且对现有的模型进行简要介绍,最后对我们目前所尝试的基于端到端的情感要素抽取工作进行初步介绍。
嘉宾简介:张梅山,黑龙江大学副教授。2014年博士毕业于哈尔滨工业大学,2014年11月至2015年11月在新加坡科技与设计大学做博士后,2016年1月入职黑龙江大学。目前主要从事自然语言处理和机器学习的研究工作,尤其词法句法分析、情感分析以及它们与深度学习的结合,并在自然语言处理领域的知名国际期刊和国际会议上包括TASLP、ACL、EMNLP、COLING、AAAI和IJCAI等发表论文20多篇。