
“友商,你们拿什么和我比?”
“友商,你们拿什么和我比?”这不是哪家公司的狂妄宣言,而是当前AI战场最真实的写照。IDC预测,2024年,全球各组织将在人工智能上投入2350亿美元,2028年这⼀数字将增长近三倍,超过6300亿美元。这预示着未来⼏年的复合年增长率(CAGR)将接近30%。开源大模型以其开放、透明、可定制的特性,成为驱动AI加速创新进程的核心引擎,它们让全球的开发者和企业能够以前所未有的速度参与到AI的研发和应用中来。
不过我们也不能简单的认为就是各科技厂商之间的技术比拼,其背后更是各国较量科技实力的无声战场。还记不记得当时DeepSeek爆红引发的各种质疑,当时的外媒报道中充斥着大量对DeepSeek的质疑。今日头条的一篇文章中说“一个去年7月成立的公司,刚刚成立一年半,仅有4人缴纳社保,竟然能开发出全球顶尖的AI大模型,你们信吗?它就是——深度求索,开发了DeepSeek的公司。”
“大佬”的进阶之路说一千道一万,回到日常生活,Meta的Llama 2以开源之名横扫全球,Qwen系列背靠阿里云势头迅猛,DeepSeek以恐怖的技术指标席卷各大版面成功演绎什么叫“后来居上”。真正的实力面前,从来没有谦让,反而是对技术自信的张狂。很多用户可能会问,“这么多大模型公司,该怎么看谁更厉害呢?”今天,我们就来看看他们到底都看什么!先来整体梳理下这三家公司的发展脚步,大致如下图:

图:DeepSeek、Llama、Qwen三家发展梳理图
来源:数据猿经查找网络资料后制作
1. DeepSeek:后来居上,不是闹着玩的
DeepSeek作为中国AI领域的新兴力量,在开源大模型赛道上展现出了令人瞩目的发展速度和技术实力,其发展时间线清晰且迭代迅速,在技术创新和市场响应上极具敏捷性。据大量新闻报道,今年1月26日晚,游戏科学创始人、CEO冯骥发文,称“DeepSeek,可能是个国运级别的科技成果”。他还表示,如果有一个AI大模型做到了以下任何一条,都是超级了不起的突破,DeepSeek全部同时做到了。

图:DeepSeek模型迭代与发展历史沿革
来源:梳理网络信息及国信证券《电子AI 系列专题报告(六)——DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求》后制作
2. Llama:开源世界的“鲶鱼”
自2023年2月首次亮相以来,Meta的Llama系列大语言模型(LLM)在AI领域掀起了巨大的波澜。从最初的Llama-1到如今即将发布的Llama-4,这一系列模型不仅在技术上不断突破,更在开源社区和商业应用中展现出强大的影响力。
·2023年2月24日:Meta首次推出Llama-1,包含7B、13B、30B和65B四个参数版本。Llama-1凭借其出色的性能和开源特性,迅速成为开源社区的焦点。然而,由于开源协议限制,该版本不可免费商用。
·2023年7月:Meta发布Llama-2,进一步扩充了模型规模至70B,并引入了分组查询注意力机制(GQA),同时将上下文长度翻倍至4096。Llama-2不仅性能更强,还首次实现了免费可商用。
·2023年8月:基于Llama-2,Meta发布了专注于代码生成的Code-Llama,进一步拓展了Llama的应用场景。
·2024年4月:Llama-3正式发布,包含8B和70B两个版本,并支持8K长文本输入。该版本在多个基准测试中表现优异,超越了同期的多个先进模型。
·2024年7月:Llama-3.1发布,推出了4050亿参数的超大型模型,并将上下文长度提升至128K tokens。
·2024年12月:Llama-3.3发布,仅70亿参数的模型在性能上比肩Llama-3.1的4050亿参数版本,同时大幅降低了推理和部署成本。
·2025年4月:Llama-4发布多次推迟,据新浪财经,关键原因是技术基准测试未达内部预期,如推理和数学任务有短板,模拟人类语音对话不及OpenAI。
3. Qwen:阿里云的“生态王牌”
Qwen(通义千问)是阿里巴巴达摩院研发的大语言模型系列。其命名源自中文“通义千问”,寓意着致力于通过技术回答人类的各种问题。
·2023 年 4 月:通义千问上线并邀请用户测试体验,是国内最早一批类ChatGPT大模型产品。
·2023 年 6 月:聚焦音视频内容的工作学习AI助手“通义听悟”上线。
·2023 年 7 月:AI绘画创作大模型“通义万相”开启定向邀测。
·2023 年 8 月:通义千问70亿参数模型Qwen-7B开源,阿里巴巴成为国内首个开源自研大模型的大型科技企业。
·2023 年 9 月:通义千问正式向公众开放。
·2023 年 10 月:通义千问升级到2.0版本,参数规模达千亿级。
·2024 年 6 月:Qwen2系列发布,包含0.5B到72B多个尺寸。
·2024 年 9 月:Qwen2.5系列发布,涵盖0.5B到72B多个尺寸。
·2025 年 4 月:Qwen3系列发布,包含0.6B到235B多个尺寸。

图:基准
来源:Llama官网
3、Artificial Analysis发布的“AI智能指数”
4月8日,Artificial Analysis更新了AI智能指数,该指数对目前领先的AI模型进行综合评估,结合了MMLU-Pro、GPQA Diamond、Humanity's Last Exam等七项严苛的基准测试。在此次的结果中,Llama 4系列模型表现尤为抢眼,逼近榜首。

图:Meta Llama流量数据统计
(左:2024年全年,右:2025年5月)
来源:aitools.xyz
此外,我们还对比了三家在GitHub上的星标数和fork数,这是GitHub上衡量项目受欢迎程度和参与度的两个重要指标。星标数代表了项目受到的关注程度,用户可以通过点击项目页面上的“Star”按钮来为项目添加星标。

来源:GitHub“Meta-Llama”

来源:GitHub“QwenLM”

来源:Github“DeepSeek-ai”
在关注者数量上,DeepSeek以78k遥遥领先,显示出其在多模态理解领域的广泛影响力。Meta Llama和Qwen虽然在关注者数量上不及DeepSeek,但它们的项目同样在各自的领域内具有显著的影响力;在项目受欢迎程度上,DeepSeek的DeepSeek-V3和DeepSeek-R1项目星标数远超其他两个组织,显示出其在社区中的极高人气。Meta Llama的llama和llama3项目也表现出色,其在语言模型领域有强大的吸引力,Qwen的星标数则相对较低;在项目多样性上,DeepSeek的项目更侧重于多模态理解,Meta Llama的项目集中在语言模型的开发和应用。而Qwen则在大语言模型和多模态模型方面有着更多的探索。

整体来看,DeepSeek、Qwen和Llama在GitHub上的表现各有千秋,它们分别在多模态理解、大语言模型和语言模型领域展现了强大的技术实力和创新能力。Llama的成功在于其极致的开放策略和强大的全球社区凝聚力;DeepSeek 则以其惊人的技术迭代速度和在全球用户侧的爆发式增长,迅速崛起为中国乃至全球开源大模型领域的一股重要力量;而Qwen则凭借阿里巴巴的强大生态支持和在国内市场的深厚根基,成为中国AI应用领域的核心引擎。随着技术的不断进步,我们可以预见这些模型持续赋能千行百业,但是不断优化模型架构、提升推理效率的同时,实在应当更加注重用户隐私和伦理问题。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106085