or
or
By clicking below, you agree to our terms of service.
New to HackMD? Sign up
Syntax | Example | Reference | |
---|---|---|---|
# Header | Header | 基本排版 | |
- Unordered List |
|
||
1. Ordered List |
|
||
- [ ] Todo List |
|
||
> Blockquote | Blockquote |
||
**Bold font** | Bold font | ||
*Italics font* | Italics font | ||
~~Strikethrough~~ | |||
19^th^ | 19th | ||
H~2~O | H2O | ||
++Inserted text++ | Inserted text | ||
==Marked text== | Marked text | ||
[link text](https:// "title") | Link | ||
 | Image | ||
`Code` | Code |
在筆記中貼入程式碼 | |
```javascript var i = 0; ``` |
|
||
:smile: | ![]() |
Emoji list | |
{%youtube youtube_id %} | Externals | ||
$L^aT_eX$ | LaTeX | ||
:::info This is a alert area. ::: |
This is a alert area. |
On a scale of 0-10, how likely is it that you would recommend HackMD to your friends, family or business associates?
Please give us some advice and help us improve HackMD.
Syncing
xxxxxxxxxx
数据篇
概述
2024 中国开源年度报告以全面、深入的数据洞察为核心,通过九大篇章全方位展现中国开源生态的蓬勃发展。第一部分宏观洞察篇,从基础事件、活跃仓库、活跃用户和编程语言等维度,揭示中国在全球开源生态中的独特地位与影响力。第二部分 OpenRank 排行榜篇,通过全球与中国各领域的开源项目、企业、基金会、开发者及协作机器人排名,为业界提供权威、系统的 OpenRank 指标信息服务,成为衡量开源贡献的重要标尺。第三、四部分企业洞察篇与基金会洞察篇,通过动态演变图和趋势分析,深度解析全球与中国企业、基金会在开源领域的战略布局与演化路径。第五部分技术领域洞察篇,聚焦各领域 Top10 榜单与项目变化,精准捕捉前沿技术的发展方向与创新趋势。第六部分开源项目洞察篇,深入探讨项目类型、领域与主题的多样性,展现开源生态的活力与创新潜力。第七部分开发者洞察篇,通过开发者类型、工作时间分布、地区分布及机器人使用情况的分析,描绘开发者群体的多元化特征与工作模式。第八部分商业开源洞察篇,聚焦中国及全球商业开源企业与项目的发展现状,剖析其成长路径与成功经验。第九部分高校开源洞察篇,结合开源之夏 OSPP 活动与 OpenRank 社区算法,展现高校学生参与开源活动的活跃度与贡献度,揭示开源人才培养的新趋势。整体而言,数据篇以丰富的数据维度与深度的分析视角,勾勒出 2024 年中国开源生态的全景图,为行业提供宝贵的洞察与参考。
指标介绍
影响力/贡献度(OpenRank)
OpenRank 指标由 X-lab 开放实验室研发,基于开发者-项目协作关系网络构建,具备多维度的评价能力。在评估项目时,OpenRank 以影响力为核心,全面衡量项目的整体发展状态与社区参与度;在评估开发者时,则以贡献度为关键指标,精准反映其在开源生态中的协作价值与活跃程度。此外,OpenRank 还可将评价对象聚合至企业、组织、基金会等更高层级,揭示其在开源生态中的战略地位与协作网络中的核心作用。目前,OpenRank 已获得工业界与学术界的广泛认可,并被纳入多项权威标准与实践,包括中国标准化研究院的开源治理标准、信通院的开源治理白皮书、开放原子开源基金会的全球开源大屏,以及企业开源办公室的治理工具箱,成为衡量开源生态健康度与协作价值的权威工具。
OpenRank 参考文献:
[1] Shengyu Zhao et al: OpenRank Leaderboard: Motivating Open Source Collaborations Through Social Network Evaluation in Alibaba. ICSE, 2024
[2] 赵生宇: 如何评价一个开源项目(三)价值流网络, 2021
[3] 工业和信息化部标准化研究院: 《信息技术 开源治理 第3部分:社区治理与运营》[T/CESA 1270.3-2023]、《信息技术 开源治理 第 5 部分:开源贡献者评价模型》[T/CESA 1270.5-2023], 2023
活跃度(Activity)
活跃度是 X-lab 研发的核心指标之一,用于量化评估项目或开发者的活跃程度。开发者活跃度通过对其在开源生态中的关键行为(如 Issue 提交、PR 创建、代码 Review 等)进行加权计算得出,精准反映其参与度与贡献强度。项目活跃度则基于项目中所有开发者的活跃度总和,经过标准化处理后生成,全面衡量项目的整体活跃状态与社区参与水平。这一指标为开源生态的健康度评估提供了科学、可量化的依据。
Activity 参考文献:
[1] Xiaoya Xia et al: Exploring activity and contributors on GitHub: Who, what, when, and where. APSEC, 2023
[2] 赵生宇:如何评价一个开源项目(一)——活跃度,2021
一. 总体宏观洞察
1.1 基础事件
基础事件是开源生态分析的核心数据来源,指全球化开源协作平台(如 GitHub、Gitee 等)上由开发者活动行为产生的事件日志数据。通过对这些事件的统计分析,可以宏观洞察全球开源生态的发展态势。本报告涵盖 GitHub 和 Gitee 两大平台的数据。
1.1.1 GitHub 全域事件趋势
2024 年,GitHub 全域事件日志总数达到 17.5 亿,同比增长约 10%。尽管增速较 2018-2023 年的高速增长期有所放缓,但 10% 的增长率仍表明开源在全球数字化转型中的关键地位。推动这一增长的主要因素包括:
图 1.1 展示了 GitHub 年度事件数的增长趋势,凸显了开源生态的持续活跃。
1.1.2 GitHub 与 Gitee 事件数趋势比较
为便于比较,我们选取 GitHub 和 Gitee 各平台前 3 万个活跃仓库,并聚焦与开源参与密切相关的 8 类事件(如 CommitCommentEvent、PullRequestEvent 等)。分析结果显示:
尽管 GitHub 的事件数量仍远高于 Gitee,但 Gitee 的稳定增长表明国内开发者对开源的热情与贡献度不断提升。图 1.2 展示了两大平台的事件数趋势对比。
1.1.3 细分事件类型分析
进一步分析事件类型的分布(图 1.3 和图 1.4):
1.2 活跃仓库
1.2.1 GitHub 全域活跃仓库趋势
GitHub 活跃仓库数量持续增长,但增速逐年放缓(图 1.5)。2020 年疫情期间的远程办公与数字化转型推动了仓库数量的激增,而 2022 年后增速放缓则与市场趋于成熟及竞争平台(如 Gitee、GitLab)的发展有关。
图 1.6 展示了 GitHub 仓库活跃度的总体趋势,2024 年接近历史最高水平。
Issue 相关事件(如 Issue Comment)和 Pull Request 事件(如 PR 创建与合并)是 GitHub 仓库活跃度的主要驱动力(图 1.7)。具体来看:
图 1.7 展示了 GitHub 仓库活跃度的详细组成,进一步印证了 Issue 和 PR 事件在推动开源项目发展中的关键地位。
GitHub 仓库的 OpenRank 值在 2018-2020 年经历了快速增长期,2020 年增长率达到峰值,反映出这一时期 GitHub 用户扩展与开源项目活跃度的双重爆发。2021-2022 年,增长率逐渐放缓,进入平缓期。然而,从 2023 年开始,增长率有所回升,2024 年虽有小幅回落,但整体仍保持稳定增长,表明 GitHub 作为全球领先开源平台的持续活力与吸引力。
1.2.2 Gitee 全域活跃仓库趋势
Gitee 的仓库活跃度在 2018-2020 年快速增长,2020 年达到顶峰,主要受益于国内开源政策的支持与开放原子开源基金会的成立。2021 年后增速放缓,但 2024 年仍达到新的峰值(图 1.9)。
在 Gitee 平台上,Review Comment 事件占据绝对主导地位,占总活跃事件的 75.6%,远高于其他事件类型(如 Open Issue、Issue Comment、Merged Pull 等,占比约 7%;Open Pull 事件占比仅为 5%)。这一分布表明 Gitee 开发者更聚焦于代码审查环节,而在代码提交与问题讨论的活跃度上略低于 GitHub,反映了平台用户对代码质量的高度关注与规范化流程的逐步成熟(图 1.10)。
Gitee 的 OpenRank 值从 2018 年到 2024 年实现了显著增长,尤其在 2019-2020 年间大幅提升,主要受益于国内开源生态政策的支持与开发者对本土化平台的积极参与。尽管 2021 年后增长率有所放缓,但 Gitee 的综合活跃度仍保持稳步上升趋势,印证了其在国内开源平台中地位的不断提升,以及在社区贡献与活跃度上的持续增长。
1.3 活跃开发者
1.3.1 GitHub 总体活跃用户趋势
2024 年的分析延续了以往的研究方法,并基于更丰富、精细化的数据来源。本次研究覆盖了 GitHub 上 1200 万活跃开发者的样本,其中约 255 万开发者提供了准确的地理位置信息,占 GitHub 全域注册用户总量(约 1.2 亿)的 2%。尽管样本仅为全体用户的一小部分,但数据质量的提升为分析全球开发者地理分布及区域协作模式提供了更具代表性的视角。
图 1.12 展示了 GitHub 年度活跃开发者数量的增长趋势。从 2020 年的 1,454 万增长至 2024 年的 2,511 万,活跃开发者数量总体呈上升趋势。其中:
与仓库增长相比,开发者增长更为稳定,表明 GitHub 的用户基础持续扩大。即使在增长放缓期,每年仍有大量新开发者加入,2024 年的反弹进一步证明了 GitHub 作为全球领先开源平台的强大吸引力。
1.3.2 开发者地理分布
1、全球开发者地域分布
根据统计,全球开发者的地理分布呈现高度集中化特征,前10大国家占全球开发者总量的60%,具体见下表:
主要观察:
2. 中国开发者地域分布
进一步分析中国开发者的分布情况,数据显示,中国开发者总量为9,404,966人,其中北上广深地区占据主要份额,展现出经济发达区域对开源技术的强大吸引力。
主要观察:
总结与观点:
1.4 编程语言
1.4.1 2024 年开发者使用编程语言榜单
编程语言的受欢迎程度一直是开发者关注的重点。以下是 2024 年度最受开发者欢迎的编程语言榜单:
主要观察:
总体来看,主流编程语言的适用领域已基本固化,近年来使用人数排名变化不大,表明开发者对这些语言的选择具有较高稳定性。
1.4.2 2019-2024 年开发者使用编程语言趋势
以下为 2019-2024 年开发者使用编程语言趋势的统计分析:
数据说明:
由于数据源不再提供仓库的元信息,2024 年 10、11、12 月的相关数据缺失,因此结合 2019-2023 年的数据,采用预测模型对 2024 年的数据进行了估算,虚线部分为预测结果。
主要观察:
1.5 总结与趋势洞察:
二. OpenRank 排行榜
在开源领域,排行榜不仅是衡量项目影响力和活跃度的重要工具,也是展示全球开源生态动态的窗口。2024 年度中国开源年报通过 OpenRank 排行榜,以独特的视角呈现了开源社区的关键参与者,包括项目、地区、企业、基金会及新兴项目的活跃度和影响力。报告整合了国内外两大平台 GitHub 和 Gitee 的数据,既涵盖了中国的开源生态,也提供了全球视角的分析。通过这些排行榜,我们期望进一步推动开源文化的普及和开源技术的应用,同时鼓励企业和个人更加积极地参与开源项目。
2.1 全球项目排行榜
根据 2024 年全球项目 OpenRank 排行榜 Top 30,中国开源项目 OpenHarmony 以 67538.71 的 OpenRank 值位居榜首,展现了其在开源社区中的卓越活跃度和全球影响力。Azure 和 .Net 分别排名第二和第三位。值得注意的是,OpenHarmony 和 LLVM 的 OpenRank 分数在过去一年中显著增长,表明它们在特定技术领域或技术栈中具有巨大的成长潜力和社区影响力。
排行榜概览:
2.2 中国项目排行榜
2024 年中国项目 OpenRank 排行榜 涵盖了多个技术领域,包括 操作系统(如 OpenHarmony)、人工智能(如 MindSpore)、数据库(如 openGauss、TiDB)和 大数据处理(如 Apache Flink)。这表明中国开源项目的多样性和技术实力正在不断增强。
主要观察:
2.3 全球企业排行榜
全球企业 OpenRank 排行榜 展示了开源项目国际化与全球化的特点,其中 美国企业占据绝对主导地位。科技巨头如 微软(Microsoft)、谷歌(Google) 和 亚马逊(Amazon) 在 OpenRank 分数上遥遥领先,显示出其在全球开源领域中的领导地位。
亮点:
2.4 中国企业排行榜
2024 年中国企业 OpenRank 排行榜 以大型企业为主导,显示了中国企业在推动开源生态发展中的重要作用。
主要观察:
2.5 开源基金会排行榜
2024 年开源基金会 OpenRank 排行榜 中,开放原子开源基金会(OpenAtom Foundation) 位居第一,表明中国在推动大型开源项目方面取得了重要成就。
亮点:
2.6 全球行政区划开发者排行榜
全球行政区划排行榜 显示了经济发达地区的开源开发活跃程度较高。
主要观察:
2.7 中国行政区划开发者排行榜
中国行政区划排行榜 显示,北京、上海等一线城市继续在开源发展中占据主导地位,同时沿海城市和部分西部地区也展现了较大的开发潜力。
2.8 全球新势力项目排行榜
全球新势力项目排行榜 反映了高度活跃的核心项目和开发团队,代表了未来技术趋势和创新方向。
亮点:
2.9 总结与趋势洞察:
三. 企业洞察
企业在开源生态中的角色与表现,正日益成为衡量其技术创新能力与行业影响力的关键维度。从全球化的技术竞争到本地化的行业应用,开源已成为驱动企业数字化转型和技术突破的重要引擎。随着开源生态的持续扩展,企业在开源领域的活跃度、贡献度和影响力,逐渐成为评估其综合实力的重要指标。
本节将通过分析全球及中国企业近十年来的 OpenRank 演变趋势,并结合 2024 年度的活跃度与 OpenRank 排名,深入探讨企业在开源领域的表现及其对行业生态的推动作用。特别是针对今年中国企业中的黑马——DaoCloud,将通过数据可视化、核心项目生态协作网络与社区协作网络的分析,全面展现其在云原生技术领域的快速崛起与战略布局,为行业提供新的参考与启示。
3.1 近 10 年全球企业 OpenRank 演变图
全球企业在开源领域的影响力观察如下:
3.2 近 10 年中国企业 OpenRank 演变图
本图清晰展现了国内企业在开源战略上的布局及变化趋势:
整体来看,这些趋势展现了国内开源领域的多样化与竞争力,以及在关键技术领域持续发力的方向。
3.3 2024 年度全球企业 OpenRank 变化
3.4 2024 年度中国企业 OpenRank 变化
3.5 2024 年度中国企业黑马 DaoCloud 的解读
在 2024 年度的中国企业 OpenRank 和活跃度两个榜单中,DaoCloud 凭借出色表现成功跻身前十,其 OpenRank 排名较去年大幅提升 9 位,升至全国第 6;活跃度榜单则上升 10 位,来到全国第 5,成为本年度当之无愧的“黑马”。
值得注意的是,2024 年 6 月各高校 Docker 镜像站点被封,导致大量开发者转向 DaoCloud,加速了其快速崛起的进程。
DaoCloud 的崛起不仅得益于其对开源领域的长期投入和技术创新,还源于其在容器云和微服务架构领域的深耕和普及推广。同时,DaoCloud 积极参与国内外主流开源项目的研发与贡献,包括 Kubernetes 生态、容器编排工具以及云原生开发框架等,这些努力显著提升了其在开源社区中的地位和影响力。
DaoCloud 的成功不仅展现了中国科技企业在开源技术发展中的探索和实践成果,也为其他中小型企业提供了宝贵的参考路径。通过技术创新和社区参与,DaoCloud 不仅提升了自身的行业影响力,还推动了中国开源生态的进一步繁荣。
3.5.1 DaoCloud企业洞察大屏
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →这张图展示了 DaoCloud 洞察大屏,全面呈现了 DaoCloud 的总体贡献情况、活跃项目排行、贡献者分布,以及一些关键的开源活动指标(如 Issue、Commit 和 PR 的变化趋势)。这些数据为分析社区动态和发展情况提供了重要依据。
在活动趋势方面,DaoCloud 的表现尤为突出。首先,Issue 数量在 2024 年 5 月达到高峰(超过 60,000),这可能与新版本发布或重大事件引发的社区讨论密切相关。随后,社区在问题关闭与处理上的高效响应,充分显示了其快速解决问题的能力。此外,社区的 Commit 活动历史上也呈现出显著波动,分别在 2020 年和2023 年出现过两次峰值,可能与重要版本发布或功能更新相关。最近一次峰值出现在 2024 年底,Commit 数量显著增长,表明社区的活跃度持续提升。在 PR(Pull Request)的表现上,2024 年度 PR 的打开、合并和关闭数量整体保持稳定,反映出社区开发活动高效有序。
从整体表现来看,DaoCloud 社区展现了健康且持续增长的生态。其核心项目 public-image-mirror(公开镜像服务)和 DaoCloud-docs(相关文档协作)在社区中贡献了主要的活跃度和影响力。其中,public-image-mirror 致力于为开发者提供高效、稳定的镜像支持,不仅推动了 DaoCloud 社区的发展,也为国内外开源用户提供了重要支持。而 DaoCloud-docs 作为文档协作项目,通过提供全面的技术文档和开发指南,显著降低了新开发者的学习门槛,并通过持续优化文档内容提升了用户体验和技术传播能力。
总之,DaoCloud 社区在多个维度上的表现都非常突出。PR 和 Issue 的高效处理凸显了社区的紧密协作,贡献者数量、Commit 活动和 PR 活跃度的增长表明社区仍在快速发展,并具备吸引更多开发者的能力。多样化的贡献者结构、稳定的开发活动和活跃的项目管理进一步巩固了 DaoCloud 社区在开源生态中的重要地位。通过核心项目的成功运营,DaoCloud 不仅提升了自身的行业影响力,也为其他开源社区的建设提供了宝贵的经验借鉴。
3.5.2 DaoCloud核心项目DaoCloud-docs的生态协作网络
这个图是 DaoCloud 社区中 DaoCloud-docs 项目 的生态网络,旨在展示项目与其他项目、组织之间的相互联系,以及它们的开发活动和合作关系。
主要发现:
3.5.3 DaoCloud核心项目DaoCloud-docs的社区协作网络
这个图展示了 DaoCloud-docs 项目的社区网络(Project Community Network),通过开发活动和组织关联分析了项目社区的分布和组成。
主要发现
DaoCloud-docs 项目社区展现出了显著的本地化特性,以中国的开发者和组织为主要贡献力量,同时也具有国际化的潜力。
3.5.4 DaoCloud核心项目public-image-mirror的生态协作网络
强连接的项目:
3.5.5 DaoCloud核心项目public-image-mirror的社区协作网络
主要贡献者:
主要贡献来源:
四. 基金会洞察
作为非营利性开源组织,基金会在推动开源项目和社区的组织、发展以及协同创新中发挥了不可或缺的作用。它不仅为开源软件的孵化提供技术支持、运营管理和法律保障等全方位服务,还为社区建设和运营提供了科学指导,成为孵化器和加速器的结合体,为开源生态注入了持续发展的动力。基金会作为开源生态的重要组织者,其规范化的运作模式和资源整合能力,使其在连接开发者、企业与社区间发挥桥梁作用。本部分从基金会这一维度,对开源生态的发展进行分析,旨在通过数据洞察揭示基金会在开源生态中的核心地位和实际贡献。
4.1 全球基金会 OpenRank 趋势分析
*注:此处 Linux Foundation 不包含子基金会
2024 年整体趋势表明,快速增长的基金会正在凭借创新技术和强大的社区生态获得市场认可,而成熟基金会则需要在保持现有优势的同时,寻找新的突破点来应对日益激烈的竞争。
4.2 全球基金会项目 OpenRank 趋势分析
4.3 全球基金会旗下中国项目 OpenRank 趋势分析
2024 年基金会旗下中国项目中,头部项目快速增长,其他项目稳定发展。中国开源项目在不同技术领域展现了强劲的影响力和发展潜力。
Linux 基金会旗下中国项目 OpenRank 趋势分析
Linux 基金会作为全球开源社区的重要组织,中国项目的参与和发展可以反映中国在全球开源生态中的影响力。
4.4 开放原子基金会旗下项目 OpenRank 趋势分析
五. 技术领域洞察
技术领域的发展在开源技术中起着风向标的作用,众多技术子领域展现出快速的进步和变革:操作系统领域不断适配新架构,在开源社区中持续演化;云原生技术推动企业实现数字化转型,其开源项目生态活跃且增长迅速;数据库作为数据创新的核心基础设施,开源技术的广泛应用促进了多样化场景的突破;大数据领域依托开源工具,正为智能决策提供强大支撑;人工智能借助开源框架加速各行业的自动化进程;前端技术则通过开源项目推动交互体验与视觉设计的不断提升。这些领域以其开放性和创新性吸引了众多开发者与投资者的关注,本节将基于影响力和活跃度两大指标对其进行数据洞察分析。
5.1 各子领域近 5 年变化趋势
从各子领域近 5 年的变化趋势来看,云原生优势明显,该领域下仓库数量相对其他领域较多;AI 在近几年的快速发展中增速显著;数据库作为关键的基础软件,以其活跃性稳居前列;大数据热度在 2024 年略有下降;操作系统领域虽仓库数量较少,但其影响力逐年上升,展现出基础软件高价值的特性;前端领域的影响力则呈现逐年降低的趋势。
5.2 各子领域 OpenRank Top 10 项目近五年变化趋势
大数据
大数据领域的双指标整体呈现上升趋势,其中 Kibana 和 Grafana 在影响力和活跃度上始终位居前二。值得注意的是,2023 年两者之间的差距逐渐缩小,而到了 2024 年,这一差距又开始扩大。此外,Clickhouse 和 Doris 在大数据领域的竞争也日益激烈。
Kibana 是一款开源的数据可视化与探索工具,与 ElasticSearch 无缝集成,支持对 ElasticSearch 数据的查询、分析和可视化。
Grafana 则是一款功能强大的开源数据可视化工具,广泛应用于监控与报告场景。它支持多种数据源,包括 Prometheus、InfluxDB 和 Graphite 等,能够生成多种类型的图表和仪表板,为用户提供灵活的数据展示与分析能力。
数据库
ClickHouse 数据库双指标持续稳定增长,ElasticSearch 重回榜单前三,Doris 的增速虽有所放缓,但活跃度指标已接近第一,预计其双指标未来有望超越 ClickHouse。此外,YDB 增速显著,在 2024 年成功进入榜单前十。
ClickHouse 是由俄罗斯 Yandex 公司开源的一款基于 MPP 架构的高性能分析引擎,其向量化执行引擎使其号称比传统事务型数据库快 100-1000 倍,同时具备丰富的功能和极高的可靠性。
Apache Doris 是百度贡献的开源 MPP 分析型数据库产品,具有简洁的分布式架构,便于运维,广泛应用于高效的实时分析场景。
YDB 作为开源项目于 2020 年发布,旨在提供支持 ACID 事务的高效分布式数据库解决方案,尤其适合高并发和分布式应用场景。YDB 的设计和开发旨在解决 Yandex 自身的技术挑战,随着开源后,它吸引了越来越多的开发者和企业的关注,并成为了现代分布式数据库领域的一部分。
操作系统
可以看到,OpenHarmony 项目下的多个仓库位居榜单前十。本次洞察结合了 Gitee 平台的数据,更直观地展现了国产操作系统的多方面优势。此外,OpenEuler Kernel 项目也表现不俗。
云原生
LLVM-Project 增速显著,双指标位居第一;Grafana 增速放缓,排名第二;Kubernetes 双指标下降明显,其余项目竞争激烈。
LLVM 是一个模块化、可重用的编译器框架和工具链技术的集合,近 3 年来活跃度增长迅速,深受广大开发者喜爱。
前端
Flutter 虽然双指标逐年下降,但相较于 Next.js 仍具明显优势。Next.js 自 2023 年起表现亮眼,增速显著,但在 2024 年有所回落;排名 3-10 的项目竞争激烈,差距较小。
Flutter 是由 Google 开发的框架,前端和全栈开发人员可使用它通过单一代码库为多个平台构建用户界面。
Next.js 是由 Vercel 创建的开源框架,基于 Node.js 和 Babel 构建,设计与 React 单页应用框架配合使用,同时提供预览模式、快速开发编译和静态导出等实用功能。
人工智能
自 2020 年起,TensorFlow 的双指标持续下滑,至 2024 年已跌出 OpenRank 榜单前十。相比之下,PyTorch 稳步增长,与其他项目的差距逐步拉大。值得一提的是,LangChain 自 2022 年开源后双指标一直稳居前三,尽管 2024 年热度略有回落,但其影响力依然显著。同时,vllm 增速显著,超越 LangChain 位居第二,而 Huggingface/Transformers 项目则保持双指标的稳定增长。
LangChain 是 Harrison Chase 于 2022 年 10 月推出的开源项目,已成为 LLM 开发中备受欢迎的框架之一。
vllm-project/vllm 是一个高效、可扩展的分布式推理框架,专为大规模语言模型(LLM)的高效推理优化而设计。近 3 年活跃度显著增长,深受开发者喜爱。
5.3 各子领域 OpenRank Top 10 榜单
下面再给出 2024 年各领域的项目 OpenRank 排行榜。

六. 开源项目洞察
2024 年,开源项目在经历了 AI 大模型、生成式AI的快速发展后逐渐呈现平稳演进的态势,以及在数据库领域的稳步发展后,呈现出新的活力。本章节从开源项目的视角出发,深入分析了项目的多维度数据,以获得更全面的洞察。通过对开源项目的 Topic 进行统计分析,揭示了全球开源社区在 2024 年的共同兴趣点。
6.1 项目类型
本小节选取了 GitHub 活跃度排名前 10,000 的仓库数据进行统计分析。
6.1.1 不同项目类型数量比例
6.1.2 不同项目类型 OpenRank 加总比例
结合 2024 年的 OpenRank 影响力视角再看这几个类别:
6.1.3 不同项目类型近 5 年 OpenRank 变化趋势
从上面的五年 OpenRank 演化图上可以看得出来,系统软件类型(System Software)的影响力逐年升高,软件工具(Software Tools)影响力在今年略有下降,库和框架(Libraries and Frameworks)、应用软件(Application Software)整体呈下降趋势,而内容资源类型(Non Software)项目的影响力比例是在逐年下降。
6.2 项目 Topic 分析
本节同样选取 GitHub OpenRank 排名前 10,000 的仓库数据进行分析,并获取仓库下的 Topic 标签进行深入洞察。
6.2.1 热门 topic
前十的主题涵盖了多个领域,反映了开源社区的广泛兴趣。其中,hacktoberfest 是 GitHub 上的一个开源活动,鼓励开发者贡献代码,以 1132 次的出现次数遥遥领先,显示诸多项目对开发者的欢迎。Python、JavaScript、TypeScript、Java 和 Rust 等 Topic 数量表现了这些语言受到了开源软件开发的青睐。此外,kubernets 和 machine-learning 等是在开源中具有较高关注度的 Topic。
6.2.2 热门 Topic 的仓库总 OpenRank 趋势
6.3 数据库领域项目分析
本小节分析了数据库领域在 OpenRank、 Activity 等指标方面近五年的增长趋势及 Top 10 头部项目的集中度变化趋势,并依据 Database of Databases 及 DB-Engines Ranking 中公开的开源数据库信息,将该领域按数据库的存储结构及用途划分为 Relational、Key-value、Document、Wide Column、Search Engine、Time Series、Vector、Graph、Object Oriented、Hierarchical、RDF、Array、Event、Spatial、Columnar、 Native XML、Content 18 个子类,收集并分析其在 GitHub 上的相应数据库开源项目的协作日志数据。
6.3.1 数据库领域近五年增长趋势及Top 10 头部项目的集中度变化趋势
1、数据库领域头部项目集中度变化分析
过去五年间,数据库领域 Top 10 头部项目的 OpenRank 集中度和Activity 集中度均维持在 [29%, 35%] 的区间范围内,但在最近三年(2022-2024)相比 2020 和 2021 年下降了 3 个百分点左右,并在 2024 年出现小幅度回升。具体来看:
这一趋势表明,数据库领域头部项目的集中度在 OpenRank 和 Activity 两个指标上呈现出一致性变化。此外,通过对两个指标的峰谷值年份及变化趋势进行对比,可以发现 OpenRank 的变化趋势略微滞后于 Activity,滞后的时间差大致在月度到季度水平。这种滞后性反映了数据库头部项目在活跃度和影响力传播上的时序逻辑关系:项目的活跃度变化可能先行,而影响力的变化则随后逐步体现。
2、2024 年集中度回升及未来趋势预测
2024 年,头部项目的各项集中度指标均出现回升,并且 Activity 集中度的环比增幅大于 OpenRank 集中度。这一现象表明,数据库头部项目的活跃度回暖,将进一步推动影响力的积累。基于过去趋势,可以预测 2025 年 OpenRank 集中度可能会加速回升,头部项目对整个领域的影响力也将随之显著增强。
随着头部项目影响力的提升,如何将这种影响力转化为更高的活跃度,进而巩固领域地位,将成为头部项目面临的重要问题。这种动态关系对于头部项目在资源竞争日益激烈的数据库领域中保持优势尤为关键。
3、领域竞争加剧与资源分配挑战
结合近五年 OpenRank 和 Activity 的变化趋势来看,虽然 2024 年头部项目的指标出现回升,但整体增速有所放缓。这表明数据库领域的资源竞争性正在增强,头部项目之间的竞争压力也在加大。在这种背景下,如何发挥已有优势,保持在领域内的领先地位,将成为头部项目未来发展的重要课题。
总的来说,数据库领域头部项目的集中度变化揭示了活跃度与影响力传播之间的时序关系,同时也反映了领域内竞争态势的加剧。在未来,头部项目需要更加注重资源整合与影响力转化,以应对领域竞争,并进一步巩固其在数据库技术生态中的核心地位。
6.3.2 数据库各子领域近五年增长趋势
6.3.3 数据库子领域 OpenRank 榜单和活跃度榜单及占比
从数据库领域各子领域 2024 年的 OpenRank 和活跃度排行可以看出:
6.3.4 数据库领域各子领域下项目的开源象限图
开源象限图共涉及三个度量指标:Activity、Openrank、CommunityVolume。 其中 CommunityVolume 与 open-digger 中的 Attention 指标计算公式相同,即对一定时间内目标项目的 star 数和 fork 数的加权求和:
sum(1*star+2*fork)
。象限图绘制方法:
log(openrank)-log(communityvolume)
的log(x)-log(y)
散点图, log 的底数均为 2,分别表示空间影响力 openrank 与时间影响力 communityvolume 衰减到 1 所需的半衰次数;数据库领域子类标签共计18个,选取2023年活跃度占比超过1%的类别共9个:Relational、Key-value、Document、Wide Column、Search Engine、Time Series、Vector、Graph、Object Oriented,统计分析并绘制开源象限图如下:
搜索引擎类两极分化严重,既有像 ElasticSearch 这样 OpenRank 和 CommmunityVolume 都很高的项目,又有像 lucene-solr 和 Xapian 这样 OpenRank 和 CommmunityVolume 都相对很低的项目。
从第一象限看出:relational、document、searchengine、vector、wide_column 都是 openrank 影响力较强且 CommmunityVolume 关注度也较强的数据库类型,而 object_oriented、graph 则在两方面相对较弱。
从活跃度 Top 9 子类数据库的开源象限图中的纵向分布可以看出:key_value、search_engine 两个子类的valkey、meilisearch等项目的 CommmunityVolume 相较于 OpenRank 更高,有较高的社区声量,相比于其他的子类有较快的发展期望。vector子类的Top10项目CommmunityVolume与 OpenRank 的log-log值线性相关性较好,社区声量与协作影响力比较均衡。
6.3.5 开源数据库项目工作活跃时间分析
可以看出数据库开源项目的高峰工作时间主要集中在周一 ~ 周五的UTC时间2时 ~ 10时,活跃时间主要集中在周一 ~ 周五的UTC时间1时 ~ 18时, 可能与大部分数据库类型的项目都存在公司背景有关系。根据活跃UTC时间,可以看出UTC 2时开始迎来了一天中的活跃阶段,直到在UTC 6时迎来了高峰阶段,持续到UTC 10时,在UTC 11时活跃度大幅降低,并在UTC 18时不再活跃。这两个不同水平的高峰阶段UTC 2时6时,与6时10时分别对应了亚洲与欧洲地区的工作时间(以9时为工作开始时刻,按9时到来顺序对应UTC+7 ~ UTC+3,与UTC+3 ~ UTC-1),之后由于工作时间重合度逐渐降低,工作高峰迅速消退。可以看出亚洲与欧洲的开源数据库项目协作对于开源数据库领域至关重要。
6.4 生成式 AI 领域项目分析
在经历了新的一年的行业发展,生成式AI展现了新的发展样态。总的来说,在2024年AIGC领域全域发展都进入了放缓时期。这可能是因为生成式AI尤其是大模型领域的发展需要海量的资金与算力资源投入。在2022-2023年的增量竞争之后,2024年,AI的发展进入了存量市场的竞争。并且由于各家AI产品的基本构建已经完成,因此其发展趋势也逐渐进入了产品形态的变化而不是扩张时期。并且随着各种头部项目的落地以及应用,我们认为2025年的生成式AI发展也会进入新的平衡时期。
6.4.1 生成式AI各子领域近五年增长趋势
6.4.2 生成式 AI 领域项目 OpenRank 和活跃度 Top 10 变化趋势
6.4.3 2024 年生成式 AI 领域项目 OpenRank 和活跃度 Top 10 榜单
七. 开发者洞察
开发者是开源生态持续发展的核心驱动力。他们不仅是技术创新的生产者和推动者,也是开源社区协作机制的重要基石。开发者的整体数量规模、贡献活跃度及协作方式,对开源项目的繁荣和发展产生深远的影响。本章将从全球视角出发,通过对开发者个体数据的深入分析,结合国家和地区层面的比较,揭示全球开源开发者的分布格局与趋势变化。
7.1 开发者的地区分布
2024 年的分析延续了以往研究方法,并基于更加丰富和精细化的数据来源。本次研究覆盖了 GitHub 上 1200 万活跃开发者的样本,其中约 255 万开发者正确填写了地理位置信息,占 GitHub 全域注册用户总量(约 1.2 亿)的 2%。尽管样本量仅为全体注册用户的一个子集,但数据质量的提升及样本量的扩大,为分析全球开发者的地理分布及区域协作模式提供了更具代表性和可信度的视角。
7.1.1 GitHub 活跃开发者地理分布
从全球视角来看,GitHub 活跃开发者的分布具有显著的区域特点,如下图所示。
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →在全球范围内,开发者主要集中在 人口密集且互联网基础设施发达的地区,例如:
这些地区拥有大量技术人才储备和成熟的科技产业生态,为开源开发活动提供了良好的环境支持。相比之下,在人口稀少或互联网发展较滞后的区域(如沙漠、山地、极地地区),开发者的分布则较为稀疏甚至罕见。这种规律不仅反映了技术资源的全球分布现状,也揭示了数字经济发展的不平衡性。
值得注意的是,一些新兴经济体中的特定区域(如东南亚和非洲部分国家)在近年涌现出越来越多的活跃开发者。随着全球互联网普及率的提升及科技教育的普及,开源开发活动正逐渐从传统的核心技术区域向新兴市场扩展,为全球开源生态注入了新的活力和多样性。
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →7.1.2 GitHub 活跃开发者国家 / 地区分布
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →从数据可以看出,2024 年全球各主要国家的 GitHub 活跃开发者数量相比 2023 年均有显著增长。这表明全球开源生态的活跃度进一步提升,增长的驱动因素可能包括互联网普及率提高、技术教育推广以及企业和个人对开源项目参与意愿的增强。以下是各国的具体表现和亮点分析:
全球开发者数量最多的国家:美国
美国以 22,233,197 名开发者位列全球第一,其增长数量为 3,906,467,增长率为 21.32%。美国作为全球科技领先国家,凭借强大的技术基础设施和成熟的开源文化,继续巩固其在全球开源生态中的核心地位。
增长最快的国家:印度
印度的开发者数量在 2024 年达到 15,209,709,增长了 3,766,222,增幅高达 32.91%,成为全球开发者数量增长最快的国家。印度的快速崛起得益于互联网普及率的显著提升、庞大的技术人才储备以及政府和企业对技术教育的大力支持。
增长率最低的主要国家:中国
中国以 9,404,966 名开发者排名第四,但增长率仅为 6.11%,是所有主要国家中最低的,新增开发者数量为 541,640。尽管中国在开发者总量上依然位居前列,但增长放缓与国内开源托管平台的崛起以及开源生态的本地化发展趋势有关。
表现突出的区域:欧洲联盟
欧洲联盟(EU)以 17,281,528 名开发者排名第二,新增 3,194,776 名,增长率为 22.68%。作为多个发达经济体的集群,欧洲在开源技术和协作方面长期保持领先地位,其开发者数量的增长继续体现了区域内强大的技术创新能力。
新兴市场的迅猛增长:巴西和印度尼西亚
其他表现亮眼的国家:日本和德国
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →这张表格展示了 2023 年至 2024 年间,中国各地区 GitHub 活跃开发者数量的变化情况,包括开发者总量、增长数量和增长率。这些数据揭示了中国不同地区在开源生态中的参与情况及其发展速度。以下是主要亮点和趋势分析:
1、总量与核心区域分析
2、增长量与增长率的亮点
绝对增长量最高:北京
北京新增 14,172 名开发者,增长率为 58.69%,稳居全国首位。这表明北京作为中国科技创新中心,仍在快速扩充其技术人才队伍,持续巩固其在开源生态中的领先地位。
增长率最高:香港
香港的增长率达到了惊人的 98.10%,接近翻倍,新增 3,281 名开发者。这表明香港的开源开发生态正在迅速崛起,这可能得益于其在国际化科技战略布局中的地位提升和资源投入。
表现突出的地区
3、区域发展趋势
华北、华东、华南:开发者数量占据绝对优势
北京、上海、广东、浙江等地是中国经济最发达的区域,也是互联网产业最为成熟的地区。这些区域为开源发展提供了优越的资源和环境支持,开发者数量显著领先。
中西部地区:增长率表现亮眼
湖北、陕西等中西部地区虽然开发者总量相对较少,但增长率均超过 75%,显示出中西部地区技术力量的快速崛起。这一趋势表明,国内开源生态正在逐步从沿海地区向内陆延伸,区域发展更加均衡。
总的来看,中国开源生态的区域分布呈现出“核心区域稳定增长,新兴区域快速崛起”的双重特点。随着中西部地区技术力量的快速扩充和香港等国际化区域的崛起,中国开源生态的区域发展更趋多元化和均衡化。
7.2 开发者工作时间分析
本小节对 GitHub 及 Gitee 开发者工作时间进行分析。本节时间默认使用 UTC 区时,相比东八区滞后 8 小时。数据默认使用 min-max 方法放缩到 [1-10] 区间,时区图中圆点面积越大代表数值越高。
7.2.1 全域开发者工作时间分布
1、GitHub 全域开发者工作时间分布
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →通过统计 GitHub 全域开发者的工作时间分布,可以发现开发者的活跃时段主要集中在 6点至21点之间,而 12点达到一个显著高峰,这可能与定时任务的触发有关。此外,周六和周日的活跃度相对较低,显示出开发者在周末的工作频率有所下降。
2、Gitee 全域开发者工作时间分布
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →从数据中可以明显看出,Gitee 平台的开发者活跃时间更加符合东八区的作息规律。这种特征与 Gitee 作为中国本土代码托管平台的用户群体分布息息相关。由于 Gitee 的主要用户集中在中国及东亚地区,其开发者的活跃时间分布反映了该地区普遍的工作和生活节奏。
具体来看,开发者的工作时间高峰通常出现在 早晨9点至晚上8点之间,与东八区的标准工作时间基本重合。同时,在中午和晚餐时间段活跃度略有下降,这进一步说明开发者的工作习惯与东亚地区的日常作息保持一致。此外,与全球化平台(如 GitHub)相比,Gitee 数据中周末的开发者活跃度下降更为显著,这可能反映了中国开发者在周末更倾向于休息或从事非工作相关活动的文化特征。
3、除去机器人的全域开发者时间分布
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →在剔除机器人数据后,开发者的工作时间分布呈现出更加真实和自然的规律。数据显示,开发者的活跃时段主要集中在 6点至21点之间,这个时间区间内的活动量显著增加,并且分布更加均匀。这表明,在排除自动化行为的干扰后,开发者的工作习惯和实际活动轨迹更加清晰地反映出来。
这种分布特征与人类开发者的日常作息高度吻合,通常对应于早晨到晚间的工作时间段。这一规律说明,绝大多数开发者倾向于在一天的主要工作时段进行代码编写、协作以及开源项目的贡献,而在深夜和凌晨时间段的活跃度则明显下降。此外,工作时间的均匀分布可能表明,开发者的任务处理节奏更为平稳,避免了过度集中在某些特定时间点的爆发式行为。
7.2.2 项目工作时间分布
1、全球 GitHub 仓库 OpenRank 前四名工作时间分布
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →2、中国仓库 OpenRank 前四名工作时间分布
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →7.3 开发者角色分析
本部分基于 GitHub 用户在开源仓库中所触发的事件将 GitHub 用户分为探索者、参与者、贡献者、提交者(Committer)四个角色,四种角色定义如下表所示。
一般情况下,四种关系层层递进,结构如下图所示。基于所定义的角色体系,我们从角色数量、时间变化、开发者角色演化三个视角对 GitHub 全域项目中 OpenRank 排名前十的项目进行量化,即第二部分中的项目排名榜单。
7.3.1 2024 年各角色数量分布
结果表明:
7.3.2 2024 年各角色新增情况
角色新增的统计口径为:某用户在 2024 年之前不是 X 角色(例如贡献者或提交者角色),在 2024 年成为 此角色,则为 X 角色有效新增数。
例如:A 2021 年给 B 项目提交了 PR,但是从未参与 Code Review 工作。2023 年 A review 了 B 项目中的 PR,则称 A 为新增提交者。
详细角色新增情况如下图和下表所示。
1、新增探索者
2、新增参与者
3、新增贡献者
4、新增提交者
7.3.3 开发者演化视角
开发者演化过程定义为:一个开源社区中有多少角色转向其他角色。本报告中我们只度量某一角色转向更深层次角色的开发者。例如某用户 2023 年以前是参与者 ,到了 2023 年该用户提出了自己第一个 PR ,因此由参与者转变为贡献者。
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →7.4 机器人账号视角
机器人账号是经过人工标签和社区贡献的账号,目前共有1410个机器人账号,较去年新增了181个。其中2024年活跃的机器人账号有965个,其中GitHub平台有930个,Gitee平台有35个。我们分析了这些机器人参与过的仓库中的所有事件数,以此来研究机器人事件的变化。通过将机器人账号产生的事件与全部事件进行比较,可以看出机器人账号的重要性。通过不同事件类型的对比图和变化率,我们可以了解2024年机器人账号事件数量变化的原因。最后,通过机器人账号7x24小时活跃热力图,我们可以了解机器人账号的工作时间。
7.4.1 机器人账号事件变化
从图 7-8 可以看出,机器人账号事件的数量在过去几年中显著增长。尤其是从2020年开始,机器人事件的数量呈现出快速上升的趋势。相比之下,开发者参与的事件数量虽然也在增长,但增长幅度相对较小,变化趋势较为平稳。
具体来看,2016年至2024年间,机器人账号事件数量从接近零增长到超过4亿次,而全部事件数量从约1亿次增长到超过7亿次。机器人事件的增长速度明显快于总体事件的增长速度,这表明机器人账号在社区中的作用和影响力正在不断增强。
这种增长可能是由于机器人在自动化任务、代码审查、持续集成等方面的应用越来越广泛,从而减轻了开发者的负担,提高了工作效率。尽管开发者的参与数量变化不大,但机器人账号的快速增长弥补了这一点,确保了整体事件数量的持续上升。
2024年机器人账号事件数占全部事件数的43%,而开发者参与的事件数占57%。这一比例进一步强调了机器人账号在社区中的重要性。机器人账号不仅在数量上显著增长,而且在整体事件中的占比也越来越大,这表明机器人在社区中的角色越来越重要。
7.4.2 机器人账号事件变化原因分析
机器人账号在代码提交方面的活动显著增加表明开发者越来越依赖于自动化工具来提交代码。与此同时,PullRequestEvent 的数量在逐步减少,可能是由于自动化工具和流程的优化减少了对手动拉取请求的需求。PullRequestCommentEvent 和 IssueCommentEvent 的数量在持续上升,表明机器人账号在代码审查和问题管理方面的参与度增加。此外,其他事件类型(如 CreateEvent、DeleteEvent 等)的数量也有所增长,反映了机器人账号在项目管理和维护方面的多样化活动。
图 7-11 显示了2024年与2023年各个事件类型的变化率:
CommitCommentEvent 和 ForkEvent 显示出显著的下降,分别减少了90.2% 和 72.3%。
这些变化率表明,机器人账号在某些特定类型的事件中变得更加活跃,尤其是在处理问题(IssuesEvent)和代码提交(PushEvent)方面。同时,某些事件类型(如 CommitCommentEvent 和 ForkEvent)的减少可能表明这些任务更多地由开发者手动处理,或者这些任务的自动化需求较低。
7.4.3 机器人账号 7X24 小时活跃热力图
从24小时活跃热力图中可以看出,机器人账号的活动在一天中的不同时间段有明显的分布特点。以下是一些关键观察点:
这种活动模式表明,机器人账号在自动化任务中扮演着重要角色,尤其是在定时任务和持续集成等方面。通过在固定时间点执行任务,机器人可以有效地减轻开发者的负担,提高工作效率。
八. 商业开源洞察
8.1 商业开源的定义
商业开源是指企业在开源软件的基础上,通过提供增值服务、技术支持、定制化解决方案等方式实现商业化盈利的一种模式。商业开源是通过更多人的参与,减少软件的缺陷,丰富软件的功能,同时也避免了少数人在软件里留一些不正当的后门。企业通过开源的商业模式可以直接获得经济利润,开源软件最终还会反哺商业,让商业公司为用户提供更好的产品。它与传统开源的核心区别是传统开源主要是为了促进软件的自由使用、修改和分发,往往由社区驱动来推动技术进步。但商业开源虽然也遵循开源的原则,但主要目的还是为了盈利。
8.2 商业开源公司分析
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →Grafana Labs 的 OpenRank 排名第一,这主要得益于其核心产品 Grafana 的广泛应用和社区活跃度,在 2024 年,Grafana Labs 完成了一轮融资,估值达到 60 亿美元。HashiCorp 在开源领域具有重要地位,但其融资金额为 349.2 百万美元,相对较低。这可能是因为 HashiCorp 的商业模式和盈利方式与其他公司有所不同。它主要通过提供开源工具的企业级支持、服务和商业版本来实现商业化。
8.3 商业开源项目分析
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →Odoo 作为全球排名第一的免费开源 PLM 管理系统,其 OpenRank 最高,融资金额也较高,这可能是因为 Odoo 拥有强大的社区支持和活跃度,以及广泛的企业应用模块,使其在开源项目中具有很高的影响力和市场认可度。然而,尽管 Bun 在技术上受到认可,但其融资金额相对较低,这可能是因为项目仍处于早期阶段,商业模式尚未完全成熟或者市场对其商业潜力的评估还在观望中。随着以后项目的成熟和市场认可度的提升,预计 Oven 的融资金额将会增加,同时其在开源社区的影响力也可能会进一步扩大。
8.4 商业开源项目近五年 OpenRank 变化趋势
近五年商业开源项目的 OpenRank 总体呈增长趋势,2020 至 2023 年快速上升,这得益于开源生态的繁荣与企业支持;2023 至 2024 年增长放缓,可能因市场逐渐饱和、项目成熟度提高及竞争加剧所致。
8.5 商业开源公司近五年 OpenRank 变化趋势
HashiCorp 的 OpenRank 2020 年至 2023 年间保持稳步增长,达到峰值后在 2024 年出现小幅回落。
Grafana Labs增长显著,从 2020 年的较低排名逐步上升,2024 年基本追平 HashiCorp。
Vercel 增长明显,从 2020 年的中游排名逐步提升,2023 年达到峰值后略有回落。
GitHub 保持稳定增长,体现其作为开源生态核心平台的重要性。
Armory 表现波动较大,2020 年至 2021 年略有下降,但在 2022 年迅速反弹,2023 年达到高峰后快速下降。
8.6 案例分析
本节以飞致云为例,介绍企业的开源商业化实践案例。飞致云的开源商业化实践是借助开源杠杆,实现高效的“产品 & 商业”的协同创新,做出好的软件产品并不断把产品卖出去。飞致云的商业模式是基于开源的免费增值模式,该商业模式的成立需要同时解决两件事情:一是持续扩大免费安装基数,二是持续提升付费转化率。
飞致云的产品观是“好的软件是迭代出来的”。飞致云充分利用开源实现高效分发,获取大量反馈,并按月迭代发布产品。飞致云的商业观是 “Our products are bought, not sold”。 最终用户正在成为工具软件产品采购的关键决策者,飞致云实现了线上获客,销售标准产品,并通过强大的产品组合持续提升交叉销售率。这种“开源吸引用户-用户反馈促进迭代-迭代产品吸引更多用户-更多用户带来更多客户-更多收入带来更大研发投入”的循环,是飞致云商业模式能够真正形成飞轮效应的关键所在。
飞致云在开源商业化上的阶段性成果可以通过开源活跃度、开源影响力、付费企业数量和现金回款等四个数据得到验证。截止目前飞致云 OpenRank 开源活跃度位居中国企业第 10 名,全球第 47 名;OpenRank 开源影响力位居中国企业第 9 名,全球第 42 名;截止 2024 年底飞致云服务超过 3000 家企业客户,客户遍布金融、制造、能源、交通、医疗、通信、传媒、房地产、互联网、教育等各行各业;2024 年飞致云开源商业化产品的现金回款笔数 2511 笔,全年累计回款金额超过 1 亿元人民币。
九. 高校开源洞察
2024 开源之夏 OSPP 作为高校与开源社区深度互动的重要平台,在本年度取得了显著成果,有效促进了开源技术的发展与高校人才培养。而从首届 OSPP 开始,X-lab 开放实验室便深度参与其中,本年度便针对 OSPP 2024 年的相关数据进行如下数据分析。
9.1 OSPP 宏观分析
9.2 OSPP 年度,学生与高校相关分布情况分析
9.3 OSPP 年度贡献度情况分析
在上述统计数据的基础上,我们结合 OSPP 近两年全年的贡献度数据和社区 OpenRank 算法对各参与高校以及参与到各社区学生的贡献度进行了详细的分析。
9.3.1 高校贡献度
通过 OpenRank 算法计算得出的高校贡献度年度排行榜如图 9.4 和图 9.5 所示,其中图 9.4 展示了 OSPP 2024 中贡献最为突出的二十所高校,而图 9.5 则展示了 OSPP 2023 所对应的高校排行榜。
在 2024 年的排行榜中,西安邮电大学以 OpenRank 值 85.13 跃居第一,参与学生数目为 15 人,人均 OpenRank 为 5.68,不仅 OpenRank 值大幅提升,且参与学生数目也较为可观,其人均 OpenRank 也较高,说明该校在 OSPP 中的综合贡献度有显著提升。陇东学院以 OpenRank 值 61.37 位列第二,不过其参与学生数目仅为 1 人,人均 OpenRank 高达 61.37。这种情况是由于该校该名学生在特定项目中具备独特的技术优势或创新能力,能够独立完成具有高价值的项目任务。类似地,上海大学以 OpenRank 值 42.21 位列第三,其同样也只有两名学生参与活动。
而在 2023 年的排行榜中,前三名分别为华中科技大学、浙江大学和北京邮电大学。可以看出,这些高校在 OSPP 中的整体贡献度较高,而其中华中科技大学虽然参与学生数目不是最多,但人均 OpenRank 表现出色,使其拥有了最高的总 OpenRank 值。另一方面,复旦大学、陇东学院、武汉大学、成都信息工程大学等高校虽然在学生数量上并不占优,但因为个别学生的贡献度较高而使得最终的排名较高。
对比 2023 年和 2024 年的高校贡献度排行榜,我们从排名与贡献度等多个角度对榜单的变化情况进行了进一步分析。
首先在排名变化方面,显著上升的高校有西安邮电大学和陇东学院。前者从 2023 年的第六名上升到 2024 年的第一名,实现了巨大的跨越。这种排名的提升反映了该校在开源项目实践方面的快速发展和积极进取;而后者从 2023 年的第十二名上升到 2024 年的第二名,其排名上升幅度同样令人瞩目。该校在 2024 年虽然只有一名学生参与项目,但该学生取得了极高的贡献度。
9.3.2 学生贡献度
本节将对 OSPP 2023 和 2024 的学生贡献度排行榜数据及其变化情况展开详细分析。从参与的社区来看,学生参与的开源社区十分多样化。涵盖了诸如 Apache Hadoop、MatrixOne、Spring Cloud Alibaba 等不同类型的社区。这反映出 OSPP 项目覆盖了广泛的技术领域,为学生提供了在不同方向上进行开源实践的机会。具体的排行榜如图 9.6 与图 9.7 所示。
对比 2024 和 2023 年的学生贡献度排行榜,可以发现在2024 年的排行榜上,陇东学院、上海大学、西安财经大学等学校的学生进入了前列。这显示出在开源项目中,并非只有传统的优势高校学生能够取得高贡献度,一些相对不那么知名的高校学生如果有足够的能力和投入,也能在排行榜上崭露头角。在参与社区方面,今年 OSPP 的情况与 2023 年类似,学生参与的社区依旧多样。不过,在一些特定社区中,如 Spring Cloud Alibaba、MindSpore 等,学生的贡献度有显著提升,这可能与这些社区在 2024 年的项目需求、发展方向以及学生对相关技术的兴趣增长有关。另一方面,今年 OSPP 的贡献度集中程度有所变化,虽然仍有部分学生的 OpenRank 值远高于平均线,但整体的差距相较于 2023 年有缩小的趋势。这可能是由于随着 OSPP 项目的推广和发展,更多学生掌握了有效的开源项目参与方法,提高了自身的贡献度,使得高贡献度学生之间的竞争更加激烈。