谁是开源大模型之王？Llama、DeepSeek还是Qwen？-工信会

> 自媒体 > （AI）人工智能 > 谁是开源大模型之王？Llama、DeepSeek还是Qwen？

谁是开源大模型之王？Llama、DeepSeek还是Qwen？

来源：数据猿

2026-04-30 21:10:47

162

管理

“友商，你们拿什么和我比？”

“友商，你们拿什么和我比？”这不是哪家公司的狂妄宣言，而是当前AI战场最真实的写照。IDC预测，2024年，全球各组织将在人工智能上投入2350亿美元，2028年这⼀数字将增长近三倍，超过6300亿美元。这预示着未来⼏年的复合年增长率（CAGR）将接近30%。开源大模型以其开放、透明、可定制的特性，成为驱动AI加速创新进程的核心引擎，它们让全球的开发者和企业能够以前所未有的速度参与到AI的研发和应用中来。

不过我们也不能简单的认为就是各科技厂商之间的技术比拼，其背后更是各国较量科技实力的无声战场。还记不记得当时DeepSeek爆红引发的各种质疑，当时的外媒报道中充斥着大量对DeepSeek的质疑。今日头条的一篇文章中说“一个去年7月成立的公司，刚刚成立一年半，仅有4人缴纳社保，竟然能开发出全球顶尖的AI大模型，你们信吗？它就是——深度求索，开发了DeepSeek的公司。”

“大佬”的进阶之路

说一千道一万，回到日常生活，Meta的Llama 2以开源之名横扫全球，Qwen系列背靠阿里云势头迅猛，DeepSeek以恐怖的技术指标席卷各大版面成功演绎什么叫“后来居上”。真正的实力面前，从来没有谦让，反而是对技术自信的张狂。很多用户可能会问，“这么多大模型公司，该怎么看谁更厉害呢？”今天，我们就来看看他们到底都看什么！先来整体梳理下这三家公司的发展脚步，大致如下图：

图：DeepSeek、Llama、Qwen三家发展梳理图

来源：数据猿经查找网络资料后制作

1. DeepSeek：后来居上，不是闹着玩的

DeepSeek作为中国AI领域的新兴力量，在开源大模型赛道上展现出了令人瞩目的发展速度和技术实力，其发展时间线清晰且迭代迅速，在技术创新和市场响应上极具敏捷性。据大量新闻报道，今年1月26日晚，游戏科学创始人、CEO冯骥发文，称“DeepSeek，可能是个国运级别的科技成果”。他还表示，如果有一个AI大模型做到了以下任何一条，都是超级了不起的突破，DeepSeek全部同时做到了。

图：DeepSeek模型迭代与发展历史沿革

来源:梳理网络信息及国信证券《电子AI 系列专题报告（六）——DeepSeek重塑开源大模型生态，AI应用爆发持续推升算力需求》后制作

2. Llama：开源世界的“鲶鱼”

自2023年2月首次亮相以来，Meta的Llama系列大语言模型（LLM）在AI领域掀起了巨大的波澜。从最初的Llama-1到如今即将发布的Llama-4，这一系列模型不仅在技术上不断突破，更在开源社区和商业应用中展现出强大的影响力。

·2023年2月24日：Meta首次推出Llama-1，包含7B、13B、30B和65B四个参数版本。Llama-1凭借其出色的性能和开源特性，迅速成为开源社区的焦点。然而，由于开源协议限制，该版本不可免费商用。

·2023年7月：Meta发布Llama-2，进一步扩充了模型规模至70B，并引入了分组查询注意力机制（GQA），同时将上下文长度翻倍至4096。Llama-2不仅性能更强，还首次实现了免费可商用。

·2023年8月：基于Llama-2，Meta发布了专注于代码生成的Code-Llama，进一步拓展了Llama的应用场景。

·2024年4月：Llama-3正式发布，包含8B和70B两个版本，并支持8K长文本输入。该版本在多个基准测试中表现优异，超越了同期的多个先进模型。

·2024年7月：Llama-3.1发布，推出了4050亿参数的超大型模型，并将上下文长度提升至128K tokens。

·2024年12月：Llama-3.3发布，仅70亿参数的模型在性能上比肩Llama-3.1的4050亿参数版本，同时大幅降低了推理和部署成本。

·2025年4月：Llama-4发布多次推迟，据新浪财经，关键原因是技术基准测试未达内部预期，如推理和数学任务有短板，模拟人类语音对话不及OpenAI。

3. Qwen：阿里云的“生态王牌”

Qwen（通义千问）是阿里巴巴达摩院研发的大语言模型系列。其命名源自中文“通义千问”，寓意着致力于通过技术回答人类的各种问题。

·2023 年 4 月：通义千问上线并邀请用户测试体验，是国内最早一批类ChatGPT大模型产品。

·2023 年 6 月：聚焦音视频内容的工作学习AI助手“通义听悟”上线。

·2023 年 7 月：AI绘画创作大模型“通义万相”开启定向邀测。

·2023 年 8 月：通义千问70亿参数模型Qwen-7B开源，阿里巴巴成为国内首个开源自研大模型的大型科技企业。

·2023 年 9 月：通义千问正式向公众开放。

·2023 年 10 月：通义千问升级到2.0版本，参数规模达千亿级。

·2024 年 6 月：Qwen2系列发布，包含0.5B到72B多个尺寸。

·2024 年 9 月：Qwen2.5系列发布，涵盖0.5B到72B多个尺寸。

·2025 年 4 月：Qwen3系列发布，包含0.6B到235B多个尺寸。

图：基准

来源：Llama官网

3、Artificial Analysis发布的“AI智能指数”

4月8日，Artificial Analysis更新了AI智能指数，该指数对目前领先的AI模型进行综合评估，结合了MMLU-Pro、GPQA Diamond、Humanity's Last Exam等七项严苛的基准测试。在此次的结果中，Llama 4系列模型表现尤为抢眼，逼近榜首。

图：Meta Llama流量数据统计

（左：2024年全年，右：2025年5月）

来源：aitools.xyz

此外，我们还对比了三家在GitHub上的星标数和fork数，这是GitHub上衡量项目受欢迎程度和参与度的两个重要指标。星标数代表了项目受到的关注程度，用户可以通过点击项目页面上的“Star”按钮来为项目添加星标。

来源：GitHub“Meta-Llama”

来源：GitHub“QwenLM”

来源：Github“DeepSeek-ai”

在关注者数量上，DeepSeek以78k遥遥领先，显示出其在多模态理解领域的广泛影响力。Meta Llama和Qwen虽然在关注者数量上不及DeepSeek，但它们的项目同样在各自的领域内具有显著的影响力；在项目受欢迎程度上，DeepSeek的DeepSeek-V3和DeepSeek-R1项目星标数远超其他两个组织，显示出其在社区中的极高人气。Meta Llama的llama和llama3项目也表现出色，其在语言模型领域有强大的吸引力，Qwen的星标数则相对较低；在项目多样性上，DeepSeek的项目更侧重于多模态理解，Meta Llama的项目集中在语言模型的开发和应用。而Qwen则在大语言模型和多模态模型方面有着更多的探索。

整体来看，DeepSeek、Qwen和Llama在GitHub上的表现各有千秋，它们分别在多模态理解、大语言模型和语言模型领域展现了强大的技术实力和创新能力。Llama的成功在于其极致的开放策略和强大的全球社区凝聚力；DeepSeek 则以其惊人的技术迭代速度和在全球用户侧的爆发式增长，迅速崛起为中国乃至全球开源大模型领域的一股重要力量；而Qwen则凭借阿里巴巴的强大生态支持和在国内市场的深厚根基，成为中国AI应用领域的核心引擎。随着技术的不断进步，我们可以预见这些模型持续赋能千行百业，但是不断优化模型架构、提升推理效率的同时，实在应当更加注重用户隐私和伦理问题。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

阿里Qwen开源模型为什么能火？

1个月前

开源Qwen一周连刷三冠，暴击闭源模型！基础模型推理编程均SOTA

1个月前