南京农业大学发布首个古籍 AI 大模型“荀子”

   时间:2023-12-14 15:58 来源:中文科技资讯

【中文科技资讯】12月14日消息,南京农业大学信息管理学院王东波教授领导的研究团队日前在北京发布了一款名为“荀子”的古籍大语言模型。

这一名为“荀子”的大模型集结了《四库全书》等众多传世古籍文献,拥有超过20亿字的庞大语料库。据了解,这一大型语言模型是南京农业大学团队在国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”的支持下,与中华书局古联公司联手推出的智能工具,专门用于古籍处理与研究。

南京农业大学表示,这一模型具备多项引人注目的特点:

1. 智能标引:能够高质量地对古籍内容进行主题标引,为研究人员提供了快速了解文章主题的工具;

2. 信息抽取:能够自动从古籍中提取关键信息,包括人物、事件、地点等,极大地节省了信息整理的时间;

3. 诗歌生成:可以根据给定的主题或关键词,自动生成符合语法规则和韵律要求的古诗,为诗词爱好者提供了创作灵感;

4. 高质量翻译:对于难以理解的古籍文献,能够进行精准的现代文翻译,协助研究人员更好地理解原文内涵;

5. 阅读理解:具备对给定的古文文本进行分析和解释的能力,实现了对古籍文本的自动阅读;

6. 词法分析:可以自动完成古籍文本的分词和词性标注,显著提高了研究效率;

7. 自动标点:能够迅速对古籍文本进行断句和标点,提升了用户对古籍文本的阅读体验。

这一模型包含两个部分,基座模型XunziALLM和对话模型XunziChat。此外,用户还可以根据自身需求使用本地训练语料微调基座模型,以获得更出色的古籍处理性能。

目前,这一模型已经作为开源公益研究成果发布在GitHub等网站上。

 
 
更多>同类内容
全站最新
热门内容