[Lora训练-ChatGLM]如何构建自己的数据集?

2023-07-30 11:37:05    来源:哔哩哔哩


(资料图片)

{"instruction": "", "input": "", "output": ""}

这个叫指令模板,instruction代表要让语言模型去干什么。input大部分情况下为空,output就是期望语言模型的输出。

{"instruction": "今天星期几?", "input": "", "output": "今天星期一"}

{"instruction": "1+2等于几?", "input": "", "output": "1+2等于3"}

每行一条数据,不能有换行,换行可以用\n表示

{"instruction": " 每个班里有 18 名学生,学校有 5 个班级,请问学校一共有多少名学生?", "input": "", "output": "要算出学校一共有多少名学生,需要将每个班级的学生人数都加在一起。由于学生数量都是 18 个,所以可以将 18 个学生分别乘以 5 个班级。即:18 x 5 = 90,所以学校一共有 90 名学生。\n答案:学校一共有 90 名学生。"}

这是一个样例,只有"instruction"和"output"有值,换行用\n表示。

关键词:

X 关闭

安阳曹操墓将于2022年5月正式对公众开放
时间·2021-12-29    来源·中新网
为什么这次寒潮南方降雪这么明显?
时间·2021-12-29    来源·新华社
山西绛县6名失踪者全部遇难 当地:已立案调查
时间·2021-12-29    来源·中新网

X 关闭