内容摘要:中国中文信息学会(CIPS)主办的全国“第十四届计算语言学会议”于2015年11月13—14日在广东外语外贸大学举行。“第三届基于自然标注大数据的自然语言处理国际学术研讨会”也同时举行,关注大数据时代自然语言处理的前沿方法和技术。
关键词:中文信息学会;计算语言学;大数据;学术会议;自然标注
作者简介:
中国中文信息学会(CIPS)主办的全国“第十四届计算语言学会议”于2015年11月13—14日在广东外语外贸大学举行。“第三届基于自然标注大数据的自然语言处理国际学术研讨会”也同时举行,关注大数据时代自然语言处理的前沿方法和技术。所谓“自然标注”是指由互联网用户根据其自身目的(而不是出于自然语言处理研究的目的)对各种互联网资源进行的“不自觉”的手工标注,计算语言学家可以将这些标注自觉地、系统性地应用在自然语言处理的各种研究中。典型的例子是,标点符号有助于词边界的识别,社交媒体中的社会标签也有助于关键词抽取,而维基百科中的条目类别信息则可以为文本分类提供帮助。会议聚焦国内外此方向上的各种前沿研究进展,如如何在自然标注大数据上有效进行大规模无监督/半监督机器学习(如深度学习),如何将学习到的资源、模型和已有手工标注的核心资源与核心语言计算模型结合起来,等等。






