通古大模型：华南理工大学推出的古籍文言文AI模型，连接古今的智慧桥梁

在人工智能与中华优秀传统文化交汇的时代浪潮中，华南理工大学深度学习与视觉计算实验室（SCUT-DLVCLab）给我们带来了一份厚重的礼物——通古大模型。它不仅是一个AI模型，更是连接我们与千年文化遗产的桥梁。它如同一位博学的智者，静静地站在数字世界的入口，引领我们重温那些曾经被时光掩盖的智慧与故事。

AI快讯

通古大模型：古籍文言文处理的AI新星

通古大模型，专注于古籍文言文处理，它并非横空出世，而是站在巨人肩膀上的创新。它基于百川2-7B-Base进行增量预训练，如同在一位优秀学生的基础上，再进行针对性的培养，使其在特定领域更加出色。24.1亿古籍语料的无监督训练，让模型在浩如烟海的古籍中汲取营养，理解古文的语言风格和内在逻辑。而400万古籍对话数据的指令微调，则让模型更加“善解人意”，能够更好地理解我们的问题，给出更贴切的答案。

更值得一提的是，通古大模型采用了冗余度感知微调（RAT）技术。这项技术就像一位精明的工匠，在提升模型性能的同时，保留了其原有的能力，确保模型在处理古籍任务时更加得心应手。而检索增强生成（CCU-RAG）技术，则如同给模型配备了一位知识渊博的助手，能够减少知识密集型任务中的“幻觉”问题，提高生成内容的准确性和可靠性。

通古大模型的主要功能：连接古今的钥匙

通古大模型的功能，就像一把把连接古今的钥匙，帮助我们打开尘封的记忆，重温那些曾经被我们忽略的文化瑰宝。

古文句读：让古文不再难懂

古文句读是阅读古籍的第一道门槛。对于现代人来说，没有标点符号的古文，就像一串没有间隔的音符，难以理解其真正的含义。通古大模型能自动为古文添加标点符号，就像一位经验丰富的老师，帮助我们断句，理解古文的内容。

想象一下，当你面对一篇没有标点符号的古文时，不再感到茫然无措，而是可以借助通古大模型，轻松地为它加上标点，让古文的含义跃然纸上，这难道不是一件令人兴奋的事情吗？
文白翻译：跨越语言的障碍

文言文与白话文之间的差异，是横亘在我们与古人之间的一道鸿沟。通古大模型支持文言文与白话文之间的双向翻译，就像一位出色的翻译家，将晦涩的古文翻译为现代文，同时也可将现代文转换为文言文，方便用户进行古籍阅读和研究。

这意味着，我们可以轻松地阅读古籍，了解古人的思想和文化，也可以用文言文来表达自己的想法，感受古文的魅力。这无疑为我们打开了一扇通往古代文化的大门。
诗词创作：感受诗意之美

诗词是中华文化的瑰宝，蕴含着丰富的文化内涵和情感。通古大模型可以生成符合古诗词格律和风格的诗歌，用户可以根据需求提供主题或关键词，模型生成相应的诗词作品。

这让我们有机会体验诗词创作的乐趣，感受诗歌的意境之美。即使我们不擅长诗词创作，也可以借助通古大模型，创作出属于自己的诗篇。
古籍赏析：深入了解文化内涵

古籍赏析是对古籍进行深入解读和分析的过程，有助于我们更好地理解古籍的文化内涵和历史价值。通古大模型能对古籍中的经典篇章进行赏析，解读其文学价值、历史背景和文化内涵，辅助用户深入学习古籍。

这就像一位资深的学者，为我们讲解古籍的精髓，帮助我们更好地理解古人的思想和文化。
古籍检索与问答：高效获取信息

在浩如烟海的古籍中，快速找到所需的信息，并非易事。通古大模型结合检索增强技术，可以快速检索古籍内容，根据用户的问题提供准确的答案，帮助用户高效获取古籍信息。

这就像一位高效的图书管理员，能够迅速地找到我们需要的书籍，为我们节省大量的时间和精力。
辅助古籍整理：让古籍焕发新生

古籍在流传过程中，难免会出现文字错误、缺漏等问题。通古大模型能识别古籍中的文字错误、缺漏等问题，提供修复建议，辅助古籍整理和数字化工作。

这就像一位细心的医生，为古籍进行修复，让它们焕发新生，更好地传承下去。

通古大模型的技术原理：智慧的基石

通古大模型之所以能够拥有如此强大的功能，离不开其背后的技术原理。

基础模型架构：强大的基石

通古大模型基于百川2-7B-Base进行增量预训练。百川2-7B-Base是强大的预训练语言模型，为通古大模型提供了基础的语言理解和生成能力。这就像盖房子，首先要打好地基，才能建造出坚固的房屋。
无监督增量预训练：知识的积累

模型在24.1亿古籍语料上进行无监督增量预训练。使模型学习古籍的语言风格和结构，为后续的古籍处理任务奠定基础。这就像读书，只有读得多了，才能更好地理解书中的内容。
多阶段指令微调：精益求精

通古大模型采用了多阶段指令微调技术，提出了冗余度感知微调（RAT）方法。在提升下游任务性能的同时，保留了基座模型的能力。通过指令微调，模型能更好地适应古籍处理的具体任务，如古文翻译、句读等。这就像学习技能，只有经过反复的练习，才能掌握精髓。
检索增强生成（RAG）技术：智慧的延伸

通古大模型结合了检索增强生成（RAG）技术，减少知识密集型任务中的幻觉问题。核心是将信息检索与文本生成相结合，通过从外部知识库中检索相关信息，作为上下文输入给语言模型，生成更准确、更符合上下文的答案。这就像一位博学的学者，在回答问题时，会查阅大量的资料，确保答案的准确性。

通古大模型的项目地址：探索的起点

如果你对通古大模型感兴趣，可以通过以下地址了解更多信息：

Github仓库：https://github.com/SCUT-DLVCLab/TongGu-LLM
HuggingFace模型库：https://huggingface.co/SCUT-DLVCLab/TongGu-7B-Instruct

通古大模型的应用场景：无限的可能

通古大模型的应用场景非常广泛，几乎涵盖了所有与古籍相关的领域。

古籍处理与数字化：传承文化的基石

通古大模型能高效处理古籍文献，支持文白翻译、句读标点和古籍检索等功能。辅助古籍整理工作，通过智能识别和修复古籍中的文字错误，提升古籍数字化的效率。这为我们更好地传承和保护中华文化奠定了坚实的基础。
教育支持：开启智慧之门

教师可以用来生成教案、教学PPT，设计课堂互动环节。对于学生，模型能提供文言文翻译、成语解释和诗词创作等功能，帮助他们更好地理解古文。这无疑为学生打开了一扇通往古代文化的大门，激发他们学习古文的兴趣。
文化传承与普及：让文化走进生活

通古大模型通过降低古籍阅读难度，让更多人接触和理解中华传统文化。这有助于我们更好地传承和弘扬中华文化，让文化走进生活，融入我们的日常。
学术研究：探索未知的领域

通古大模型为古籍研究提供了强大的技术支持，能帮助学者快速检索和分析古籍内容。这有助于学者们更深入地研究古籍，探索未知的领域，为中华文化的发展做出更大的贡献。

通古大模型，是人工智能与中华文化的一次完美结合。它不仅是一个强大的AI模型，更是一座连接古今的桥梁，一扇通往智慧的大门。让我们一起借助通古大模型，重温那些曾经被我们忽略的文化瑰宝，感受中华文化的博大精深！