中国领先的工业平台

返回贤集网 返回微头条
贤集网技术微头条APP获取

阿里发布大语言模型,性能媲美DeepSeek-R1

 人工智源库

下载贤集网APP入驻自媒体

阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。

这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。

此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

最新回复
发布回复

为您推荐

热门交流