Benedict Geng
Email:
Affiliation of Author(s):外国语学院
Teaching and Research Group:英文系
Journal:图书馆论坛
Key Words:词性,自动标注,数字人文,SikuBERT,预训练技术
Abstract:在深度学习技术和预训练语言模型不断发展背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SikuBERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验。结果表明:SikuBERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%。文章还展示了单机版“SIKU-BERT典籍智能处理系统”的词性自动标注功能设计及应用。
Note:CSSCI来源期刊论文
Co-author:刘欢,张逸勤
First Author:耿云冬
Indexed by:Journal paper
Correspondence Author:王东波
Discipline:否
Document Type:J
Volume:42
Issue:6
Page Number:55-63
Translation or Not:no
Date of Publication:2021-09-13