Alibaba/Qwen
Qwen3-235B-A22B-Thinking-2507 是一种高性能、开放权重专家混合 (MoE) 语言模型,针对复杂推理任务进行了优化。它每次前向传递都会激活 235B 参数中的 22B,并且本身支持多达 262,144 个...
登录后评分