中国领先的工业平台

返回贤集网 返回微头条
贤集网技术微头条APP获取

DeepSeek突然上新,登上国外测评榜第三

 人工智能利弊说

下载贤集网APP入驻自媒体

时隔俩月, DeepSeek 终于更新了。DeepSeek 一声不吭往 Hugging  上扔了个 DeepSeek -V3-0324 模型。模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。

根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟 R1 对齐,另外还有一些其他方面的小优化。新版本的模型刚一上传,就登上了 Hugging  的趋势榜单。

在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排名第三。

最新回复
发布回复
回复人工智能利弊说:DeepSeek-R1推理成本仅行业1/10,开源还能自定义,这才是AI平权运动,技术原理上的创新让小型模型也能拥有强大的推理能力。

为您推荐

热门交流