Please wait while we load the page
QwQ-32B 是阿里巴巴 Qwen 团队推出的新型开源320亿参数大型语言模型,通过规模化强化学习实现 DeepSeek-R1 级别的推理能力。它具备用于复杂任务的“思考模式”,属于 Qwen 系列,专注于推理能力。与指令调优模型相比,QwQ 在下游任务中表现出色,尤其是在难题上。该模型基于 Qwen2.5 架构,需使用最新的 Hugging Face transformers 库。
使用 QwQ-32B 时,通过 transformers 库加载模型和分词器。使用 apply_chat_template 函数格式化提示。确保安装最新版本的 transformers。遵循使用指南以获得最佳性能,包括使用 "<think>\n" 强制输出思考内容及调整采样参数。
如果您想要能够处理复杂查询并生成高质量内容的尖端语言模型,选择它。它是高级AI应用的首选。
价格信息不可用