中国领先的工业平台

返回贤集网 返回微头条
贤集网技术微头条APP获取

国产AI大模型数据量

中国目前可用于大模型训练的悟道语料库,包括文本、图文和对话数据集,最大的仅5TB,其中开源的文本部分仅为200GB。另外一个开源的中文本数据集CLUECorps为100G。相比之下,GPT-3的训练数据量,以英语为主,达到了45TB。

最新回复

还没有人回复哦,抢沙发吧~

发布回复

为您推荐

热门交流