访问量:   最后更新时间:--

耿云冬

硕士生导师
教师姓名:耿云冬
教师英文名称:Benedict Geng
教师拼音名称:gengyundong
职务:外国语学院副院长
职称:副教授
在职信息:在职
学历:博士研究生毕业
学位:博士
电子邮箱:
毕业院校:南京大学
所属院系:外国语学院
所在单位:外国语学院
学科:外国语言学及应用语言学    
其他联系方式

邮箱:

论文成果
面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例
发布时间:2023-02-14    点击次数:

所属单位:外国语学院

教研室:英文系

发表刊物:图书馆论坛

关键字:词性,自动标注,数字人文,SikuBERT,预训练技术

摘要:在深度学习技术和预训练语言模型不断发展背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SikuBERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验。结果表明:SikuBERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%。文章还展示了单机版“SIKU-BERT典籍智能处理系统”的词性自动标注功能设计及应用。

备注:CSSCI来源期刊论文

合写作者:刘欢,张逸勤

第一作者:耿云冬

论文类型:期刊论文

通讯作者:王东波

学科门类:

文献类型:J

卷号:42

期号:6

页面范围:55-63

是否译文:

发表时间:2021-09-13