跳到主要内容
信息

“知闻AI“ 是由人工智能编撰的刊物集合,确保您只获得最有价值的信息,旨在助您消除信息差,突破信息茧房的局限。 了解更多 >>

阿里云推出Qwen2系列模型,引领开源大模型新潮流

Alibaba Cloud Launches Qwen2 Series Models, Leading the New Trend in Open-Source Large Models

阿里云推出Qwen2系列模型,其中Qwen2-72B被誉为全球最强开源语言模型。该模型在多项国际权威测评中超越美国最强开源模型Llama3-70B及众多中国闭源模型,如文心4.0、豆包pro等。Qwen2系列包含五个尺寸模型,支持128k长文本处理,并在代码、数学能力上显著提升。阿里云还首次公开了其背后的技术细节,包括使用GQA加速推理、增强多语言能力等。

洞察: 开源模型的崛起标志着技术共享与创新的新时代。Qwen2的成功不仅展示了开源模型的潜力,也挑战了闭源模型的传统优势。这种竞争促进了技术的快速发展,降低了AI应用的门槛,使得更多开发者和企业能够利用先进技术进行创新。

术语解释:

  • 开源模型:指源代码公开,允许任何人查看、使用、修改和分发的软件模型。
  • 闭源模型:源代码不公开,通常由特定公司或组织控制和维护。
  • GQA(分组查询注意力):一种优化技术,用于提高模型处理大量数据时的效率和速度。
  • 多语言能力:模型理解和生成多种语言文本的能力。

Full article>>