通义千问平台上线深度思考功能 基于QwQ-Max推理模型预览版

2025-02-25ASPCMS社区 - fjmyhfvclm

2月25日,通义千问官方账号Qwen在海外社交平台发布了QwQ-Max-Preview(推理模型预览版),即将发布QwQ-Max正式版本、可部署在本地的较小版本以及官方App QwQ-Max。

上证报中国证券网讯(记者 刘怡鹤)2月25日,通义千问官方账号Qwen在海外社交平台发布了QwQ-Max-Preview(推理模型预览版),即将发布QwQ-Max正式版本、可部署在本地的较小版本以及官方App QwQ-Max。

Qwen表示:“我们在Qwen Chat平台上发布了‘思考(QwQ)’功能,由QwQ-Max-Preview 提供支持。这是一个基于Qwen2.5-Max的推理模型。该模型仍为预览版。它具有很强的数学理解、编码、代理等能力。与 Qwen2.5-Max相比,它更聪明,更具创造力。”

Qwen同时宣布,即将发布QwQ-Max的正式版本,将在Apache 2.许可下开源QwQ-Max和 Qwen2.5-Max。此外,还将提供规模较小的版本,例如 QwQ-32B,可部署在本地设备上。另外,将在发布官方QwQ-Max的同时发布安卓和iOS App。

1月20日,DeepSeek-R1推理模型发布后火速出圈,实现了最快复现OpenAI o1推理模型。业内预计,我国头部科技公司阿里巴巴、字节跳动等有望在1到2个月内跟上R1的创新成果。

1月29日,阿里发布通义千问Qwen2.5-Max大模型。在多个基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

值得一提的是,DeepSeek-R1模型出圈后,美国李飞飞团队2月初称以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。随后被爆出s1模型的训练并非从零开始,其基座模型也是阿里通义千问(Qwen)模型。

全部评论