SMP 2018 讲习班


北京大学  宋国杰  副教授


题目:大规模网络表示学习
摘要:现实世界中的大量数据是以网络形式存在的,如社交网络、引文网络、交通网络等。基于大规模网络数据开展机器学习和数据挖掘研究是近年来的学术界和工业界关注的热点问题之一。但是,由于网络数据潜在的稀疏性、高维性和大规模等特征,使得基于原始大规模网络数据的建模、挖掘与分析面临巨大挑战。科学的对网络数据进行有效的特征表达,被公认为解决上述挑战的关键技术之一。本报告将对网络表示学习的研究进行较为系统的阐述,主要包括如下四部分内容:1)从传统一般意义的表示学习的角度出发,阐述开展表示学习研究的背景与动机,以及传统表示学习的代表性工作;2)结合网络数据的特点,阐释网络表示学习研究的背景与动机,并对网络表示学习研究的经典代表性工作进行阐述,同时也会对最新的研究进展进行概括和代表性工作阐述;3)然后,会从多层次网络表示学习、动态网络表示学习以及基于网络表示学习的实体标准化三个角度展示我们的工作;4)最后,给出网络表示研究进行展望。
个人简介:宋国杰,北京大学信息科学技术学院副教授。主要从事网络大数据挖掘和智能交通系统等方面的研究与开发工作。承担了国家纵向课题10余项,国际(内)科研机构合作课题和横向企业合作课题20余项。发表论文100余篇,其中包括国际顶级期刊 TKDE、TPDS、TITS以及国际顶级会议 KDD、AAAI、IJCAI、WWW 等 30 余篇。是AAAI、IJCAI、ICDE、WWW等多个国际会议的程序委员。研究成果获得“中国公路学会科学技术奖一等奖”2次。部分成果已经获得实际应用,产生了显著的经济效益和社会效益。


清华大学政治学系  孟天广  副教授


题目:基于大数据方法的计算社会科学:从探索性研究到因果推论
摘要:大数据时代以来,随着计算科学、数据科学与社会科学的深入融合,计算社会科学这一新兴学科和研究方法逐步形成。报告将结合政治学、经济学和社会学等领域的探索,阐述大数据资源和机器学习在社会科学领域的创新应用,讨论应用大数据方法的方法论基础、主要的大数据分析方法、大数据方法的优点和局限,以及大数据方法开展因果推论的若干路径。因果推论是社会科学研究的重要任务,大数据方法对传统社科因果推论带来了一系列挑战和机遇,借助大数据与统计方法、大数据与小数据、大数据与实验研究、大数据与模拟研究的结合为社会科学开展因果推论提供了新路径。
个人简介:清华大学政治学系副教授,苏世民书院兼聘教授,仲英青年学者。兼任清华大学计算社会科学平台执行主任、北京大学中国社会调查中心兼职研究员,曾在哈佛大学、加州大学圣地亚哥分校等担任访问学者。研究领域包括中国政府与政治、比较政治经济分析、大数据与计算社会科学等。他在国内外知名学术期刊Comparative Political Studies、Global Environmental Change、Policy Study Journal、Social Science Research、《政治学研究》等发表过40多篇中英文论文。


清华大学计算机系  黄民烈  副教授


题目:深度强化学习及其在自然语言处理中的应用
摘要:深度强化学习在以Alpha GO/Zero为代表的许多应用中取得了前所未有的成功,其广泛地应用在游戏控制、机器人、自动驾驶、语言交互等场景中。强化学习的序列决策、尝试试错、延迟奖励等特点,使得其处理非直接信号的弱监督学习问题具有较强的优势。本讲座将首先介绍强化学习的基本理论,并介绍Q-Learning、策略梯度、Actor-Critic三大主要的方法;其次,将介绍强化学习在自然语言处理中的常见应用场景,包括其信息抽取、关系预测、样本去噪、标记纠正、结构探索、搜索策略优化等。这些工作具有的共性是:在无直接监督信息、弱信号场景中,利用强化学习的试错和概率探索能力,通过编码先验或领域知识,达到学习目标。
个人简介:黄民烈,清华大学计算机系副教授,博士生导师,计算机系人工智能研究所副所长。研究兴趣主要集中在人工智能、深度学习、强化学习,自然语言处理如自动问答、人机对话系统、情感与情绪智能等。已超过60篇CCF A/B类论文发表在ACL、IJCAI、AAAI、EMNLP、KDD、ICDM、ACM TOIS、Bioinformatics、JAMIA等国际顶级和主流会议及期刊上。曾担任多个国际顶级会议的领域主席或高级程序委员,如AAAI 2019、IJCAI 2018、IJCAI 2017、ACL 2016、EMNLP 2014/2011,IJCNLP 2017等,担任ACM TOIS、TKDE、TPAMI、CL等顶级期刊的审稿人。作为负责人或学术骨干,负责或参与多项国家973、863子课题、多项国家自然科学基金,并与国内外知名企业如谷歌、微软、三星、惠普、美孚石油、斯伦贝谢、阿里巴巴、腾讯、百度、搜狗、美团等建立了广泛的合作。获得专利授权近10项,其中2项专利技术授权给企业应用。


同济大学设计创意学院  曹楠  教授


题目:交互式可视化异常检测及其在社交媒体分析中的应用
摘要:异常检测是数据科学领域的重要研究课题,被广泛应用在金融(检测金融诈骗)、互联网(检测网络攻击及异常用户行为)、医疗信息(检测疾病)以及其他众多应用领域当中。由于其重要性,众多机遇机器学习的自动化的异常检测算法再过去的几十年中被广泛研究。但是,由于缺乏用于训练模型或者检验计算结果的基本事实数据,现有技术难以得到广泛应用。为了解决这些困难,我们的研究专注于基于可视化方法的交互式异常检测技术。在此,我们将回顾该领域在可视化方向上的相关研究以及若干关键技术。这些技术通过直观的可视化表达,兼顾用户决策及自动分析于一体,能够帮助用户更加精准高效对异常情况作出分析判断。
个人简介:曹楠博士是国家第十二批青年千人,同济大学设计创意学院正教授,博士生导师,同济大学智能大数据可视化实验室主任。加入同济前,曹楠曾担任美国IBM 沃森研究院研究员以及IBM全球可视化及图形学会共同主席。曹楠主要研究方向是大数据分析及可视化,其研究成果涵盖了数据可视化、数据挖掘、机器学习、及人机交互多个技术层面,并被应用在信息安全、智慧城市、健康医疗、智能设计等众多应用领域。曹楠累计在数据科学领域的重要国际学术期刊及会议上发表论文60余篇,累计申请专利近40项,曾获得ACM智能用户界面国际大会(ACM IUI)最佳论文奖、IEEE 国际可视化分析大会(IEEE VAST) 最佳论文提名奖,“微软最有价值专家” 称号,“ACM上海新星奖”,以及 香港科技大学工学院 “杰出博士研究奖”。他同时还担任了IEEE VAST、IEEE InfoVis、AAAI、SDM等可视化、人工智能、及数据挖掘领域诸多顶级国际学术会议的程序委员会委员,以及重要学术期刊的客座编委。