作者: | Linh The Nguyen | Dat Quoc Nguyen |
摘要:我们提出了第一个多任务学习模型--名为PhoNLP--用于越南语的联合词性标注、实体识别和依赖分析.在越南基准数据集上的实验表明,Phonlp产生了最先进的结果,超过了单一任务学习方法的性能,该方法为每个任务独立地调整了预先训练过的越南语模型PhoBERT(Nguyen和Nguyen,2020)。我们公开发布PhoNLP作为一个开放源码工具包,在麻省理工学院的许可下。我们希望PhoNLP可以作为一个强有力的基线和有用的工具包,为今后的研究和应用在越南NLP。我们的PhoNLP可在https://github.com/VinAIResearch/PhoNLP上使用
论文地址
https://arxiv.org/abs/2101.01476v1
下载地址
https://arxiv.org/pdf/2101.01476v1.pdf
全部源码
https://github.com/VinAIResearch/PhoNLP 类型: pytorch
暂无评论
要发表评论,您必须先 登录