Alpaca chinese dataset 是一个基于斯坦福大学发布的 alpaca 数据集(52k 条英文指令跟随数据)翻译而来的中文指令微调数据集,旨在支持中文大语言模型(llm)的训练与研究。 大模型指令微调(instruction tuning)中,alpaca 格式 和 sharegpt 格式的数据集概念详解。 其实并没有多高大上,这两类数据集本质上的差异,就是描述 单轮 、 多轮 对话。 汇聚最新最热 ai 模型,提供模型体验、推理、训练、部署和应用的一站式服务,提供充沛算力,做中国最好的 ai 社区。