wj23027

@wj23027

Joined on Jan 2, 2024

  • 一. 报告背景 延续自 2016 年初发布的《 2015 年中国开源社区参与调查报告》以来的传统,2023 年末,我们再次启动了中国开源社区的年度参与调查,致力于通过持续的开发者调查报告,以多维度方式呈现中国开源发展的整体状况。借助数据分析手段和调查报告等工具,我们成功绘制了一份关于 2023 年中国开源世界的地图。 本问卷篇对受访者的多个角色进行提问,旨在从各个维度深入了解社区的发展趋势。本问卷根据开源社区参与程度将受访者分为使用者、参与者、贡献者、维护者、生态运营几个角色。形成洋葱模型,层层递进。对于四个角色层级的定义如下: 使用者:使用过某一款或某几款开源产品的用户 参与者:与开源社区有互动行为的用户(例如与开源社区交流沟通、参与开源社区组织的活动等) 贡献者:对开源社区有实质性的贡献的用户(包括代码贡献和非代码贡献) 维护者:主要负责对开源社区日常运营的用户(包含项目 maintainer、PMC 成员等)
     Like  Bookmark
  • 此部分为报告主页的内容,可点击主页对应查看。 2024 中国开源年度报告 简介 开源社联合多家单位,纵横近十年对中国开源行业的综合性报告,每年发布一次 feature 开源社(单独一行展示) 描述: 开源社(英文名称为“KAIYUANSHE”)成立于 2014 年,是由志愿贡献于开源事业的个人志愿者,依 “贡献、共识、共治” 原则所组成的开源社区。开源社始终维持 “厂商中立、公益、非营利” 的理念,以 “立足中国、贡献全球,推动开源成为新时代的生活方式” 为愿景,以 “开源治理、国际接轨、社区发展、项目孵化” 为使命,旨在共创健康可持续发展的开源生态体系。 官网链接: https://kaiyuanshe.cn/
     Like  Bookmark
  • 定稿前的格式问题! 中文版(停止更新,问题可在 Github Issue 反馈) 主页内容 卷首语 问卷篇 数据篇 商业化篇 开源大事记
     Like  Bookmark
  • 目录汇总 问卷篇 一. 报告背景 二. 问卷结果预览 三. 问卷分析 3.1. 受访者特征 3.1.1 年龄、性别、学历、城市 3.1.2 所处行业、职业
     Like  Bookmark
  • 概述 2023 中国开源年度报告以深入全面的数据洞察为基础,共分为八大部分。第一部分总体宏观洞篇,通过对基础事件、活跃仓库、活跃用户、开源许可证和编程语言等方面的深入分析,揭示中国在全球开源生态中的全貌。第二部分 OpenRank 排行榜篇,提供了全球和中国各领域开源项目、企业、基金会、开发者以及协作机器人的排名,为业界提供全面系统的 OpenRank 指标信息服务。第三和第四部分为企业洞察篇和基金会洞察篇,通过演变图和趋势分析,呈现了全球和中国企业、基金会在开源领域中的演化。第五部分技术领域洞察篇,深入研究了各领域 Top10 榜单和项目变化情况,展示了前沿技术的发展方向和趋势。第六部分开源项目洞察篇,深入探讨了不同项目类型、领域和主题的多样性和创新方向。第七部分开发者洞察篇,则通过对开发者类型、工作时间分布、地区分布和机器人使用情况的分析,展现了开发者群体的多样性和工作特征。第八部分案例分析篇,通过一系列有趣的案例分析,从一个侧面让读者一窥中国开源生态的蓬勃发展。整体而言,数据篇通过丰富多彩的数据洞察与分析,勾勒出中国开源生态在 2023 年的全景图。 指标介绍 OpenRank OpenRank 指标是由 X-lab 开放实验室所研发,基于开源开发者-项目协作关系网络构建的协作网络指标,不仅能够很好的表征项目的整体发展状态、社区参与度,同时也引入了开源生态的要素,能够很好地将开源生态中位于关键协作位置的项目、人、组织等实体识别并展示出来。OpenRank 目前已经得到了工业界和学术界的广泛认同,被包括中国标准化研究院系列开源治理标准、信通院开源治理白皮书、开放原子开源基金会全球开源大屏、企业开源办公室治理工具箱等所广泛采纳。 关于该指标的定义请参考:
     Like  Bookmark
  • 一. 概述 在过去两年的开源年度报告商业化篇中,介绍了开源软件商业化成功的底层驱动因素、开源软件公司可能的商业化路径、开源项目投资人判断标准以及案例分享。去年,结合当时市场环境下的一些趋势与变革,探讨了国内的开源项目探索全球化市场过程与商业化发展的驱动因素、挑战及实现路径,引发了许多开源伙伴的热烈讨论。 2022-2023 年,人工智能领域迎来了预训练大模型技术的大爆发,引发了全社会的广泛关注,并且可预见在未来将持续加深对生活、工作的影响。不难发现,在这次人工智能技术迭代的浪潮中,开源生态也为技术发展起了极大的推动作用,并且有不少开源模型以及开源项目在积极寻求商业化。但开源模型与传统的开源软件又有着众多差异。在这样的时代背景下,人工智能开源项目与开源模型的商业化发展,成为了值得深入研究与讨论的话题。 在商业化过程中,包括开源软件和开源模型在内的开源项目的安全可控性是企业用户非常关注的考量因素之一。结合当下技术发展趋势,对开源软件的安全,开源模型的可控,开源商业许可证的分析是值得关注的话题。 资本方是促进开源市场发展的重要参与方。对于投资机构来讲,在对一个开源项目进行判断时往往会综合考虑以下几点:在产品开发阶段,重点要看企业是否拥有代码所有权和控制权,以及是否具备国际竞争力;社区运营阶段,主要看企业是否具备足够强的运营能力;在商业化探索阶段,市场匹配能力与商业模式的成熟度会成为主要关注点。 作为领域内最早关注并持续耕耘开源的机构,云启资本曾在早期成功发掘并投资了 PingCAP、Zilliz、Jina AI、RisingWave Lab、TabbyML 等开源企业,并持续参与共建开源生态。
     Like  Bookmark
  • 概述 中国开源年度报告的《开源大事记》篇,为什么会收录很多国际开源的新闻?因为在我们看来:这些都是中国的开源人需要关心的大事,也是正在或即将影响中国开源界的大事。 今年的开源大事记,可以说是来自各界的编辑志愿者们心尖上 2023 年的开源大事件。我们思考的大致脉络是: 由全球 “开源技术” 的颠覆式创新,如人工智能与机器学习等,为主线 加上地缘政治态势带来的全球冲突,直接或间接地影响了 “开源生态” 不问西东(或东升西变)的起伏变化 从而导致了从区域、法律、贸易、社区方方面面 “开源治理” 的范式转移 其中 “开源安全” 议题更是被视为重中之重 挑战带来机遇,更多挑战带来更多机遇,“开源商业化” 已经成为显学与主流。2023 年虽然艰难,但是全球(包含中国)仍有大批开源初创企业前仆后继
     Like 2 Bookmark
  • 今年的卷首语,我花了很大的“毅力”,才抑制了自己用 ChatGPT 帮助撰写的冲动,打算还是完全靠自己手写。这其实也是整个 2023 年的趋势之一:越来越多的工作,人们都开始尝试寻求 AI 的帮助。 AI & AIGC 除了已经不再开源的 OpenAI,在 2023 年诞生了无数热门的、开源的大模型;无数热门的、开源的基于 GPT 的应用;还有 AutoGPT、LangChain、CoT、RAG 这样的新名词和新项目层出不穷。在图像生成、语音生成、代码生成等一系列 AIGC 的领域,都给人一种一日千里,恍如隔世的感觉。 从 2020 年开始的每一年的开源年报,我们都会谈到“剧变”,如果 2020~2022 年的变化,是以世界风云变化为主的话,到了 2023 年,就真的已经在 IT 技术领域,在开源生态领域,掀起滔天巨浪了。 关于全域数据 今年的中国开源年度报告,本身也有一件大事发生。就是我们首次能够将 GitHub 的数据与 Gitee 的数据放在一起,进行通盘的比较与洞察,其中的一些发现可能会打破很多人对于中国开源活跃度与贡献度的“偏见”。而这样的数据扩展,我们今后还将不断延伸,使得我们的数据源,真正不负“全域”之名。
     Like  Bookmark
  • 麻烦大家定稿前注意以下格式问题~ 尤其需要注意 图表 以及 空格 问题 test aaaa aaa 1. 章节段落结构
     Like 1 Bookmark
  • 今年的卷首语,我花了很大的“毅力”,才抑制了自己用 ChatGPT 帮助撰写的冲动,打算还是完全靠自己手写。这其实也是整个 2023 年的趋势之一:越来越多的工作,人们都开始尝试寻求 AI 的帮助。 AI & AIGC 除了已经不再开源的 OpenAI,在 2023 年诞生了无数热门的、开源的大模型;无数热门的、开源的基于 GPT 的应用;还有 AutoGPT、LangChain、CoT、RAG 这样的新名词和新项目层出不穷。在图像生成、语音生成、代码生成等一系列 AIGC 的领域,都给人一种一日千里,恍如隔世的感觉。 从 2020 年开始的每一年的开源年报,我们都会谈到“剧变”,如果 2020~2022 年的变化,是以世界风云变化为主的话,到了 2023 年,就真的已经在 IT 技术领域,在开源生态领域,掀起滔天巨浪了。 关于全域数据 今年的中国开源年度报告,本身也有一件大事发生。就是我们首次能够将 GitHub 的数据与 Gitee 的数据放在一起,进行通盘的比较与洞察,其中的一些发现可能会打破很多人对于中国开源活跃度与贡献度的“偏见”。而这样的数据扩展,我们今后还将不断延伸,使得我们的数据源,真正不负“全域”之名。
     Like 2 Bookmark
  • 概述 2023 年中国开源年度报告以深入全面的数据洞察为基础,共分为八大部分。第一部分总体宏观洞篇,察通过对基础事件、活跃仓库、活跃用户、开源许可证和编程语言等方面的深入分析,揭示中国在全球开源生态中的全貌。第二部分 OpenRank 排行榜篇,提供了全球和中国各领域开源项目、企业、基金会、开发者以及协作机器人的排名,为业界提供全面系统的 OpenRank 指标信息服务。第三部分技术领域洞察篇,深入研究了各领域 Top10 榜单和项目变化趋势,展示了前沿技术的发展方向和趋势。第四和第五部分为企业洞察篇和基金会洞察篇,通过演变图和趋势分析,呈现了全球和中国企业、基金会在开源领域中的演化。第六部分开源项目洞察篇,深入探讨了不同项目类型、领域和主题的多样性和创新方向。第七部分开发者洞察篇,则通过对开发者类型、工作时间分布、地区分布和机器人使用情况的分析,展现了开发者群体的多样性和工作特征。第八部分案例分析篇,通过深入挖掘开源社区、企业和开发者的具体案例,总结了一系列有趣的数据现象,为读者提供了对开源生态的深刻洞见。整体而言,数据篇通过丰富多彩的数据洞察与分析,勾勒出中国开源生态在 2023 年的全景。 指标介绍 OpenRank OpenRank 指标是由 X-lab 开放实验室所研发,基于开源开发者-项目协作关系网络构建的协作网络指标,不仅能够很好的表征项目的整体发展状态、社区参与度,同时也引入了开源生态的要素,能够很好地将开源生态中位于关键协作位置的项目、人、组织等实体识别并展示出来。OpenRank 目前已经得到了工业界和学术界的广泛认同,被包括中国标准化研究院系列开源治理标准、信通院开源治理白皮书、开放原子开源基金会全球开源大屏、企业开源办公室治理工具箱等所广泛采纳。 关于该指标的定义请参考:
     Like 3 Bookmark
  • 一. 报告背景 延续自 2016 年初发布的《 2015 年中国开源社区参与调查报告》以来的传统,2023 年末,我们再次启动了中国开源社区的年度参与调查,致力于通过持续的开发者调查报告,以多维度方式呈现中国开源发展的整体状况。借助数据分析手段和调查报告等工具,我们成功绘制了一份关于 2023 年中国开源世界的地图。 本问卷篇对受访者的多个角色进行提问,旨在从各个维度深入了解社区的发展趋势。本问卷根据开源社区参与程度将受访者分为使用者、参与者、贡献者、维护者、生态运营几个角色。形成洋葱模型,层层递进。对于四个角色层级的定义如下: 使用者:使用过某一款或某几款开源产品的用户 参与者:与开源社区有互动行为的用户(例如与开源社区交流沟通、参与开源社区组织的活动等) 贡献者:对开源社区有实质性的贡献的用户(包括代码贡献和非代码贡献) 维护者:主要负责对开源社区日常运营的用户(包含项目 maintainer、PMC 成员等)
     Like 1 Bookmark
  • 七. 开发者洞察 7.1 开发者角色分析 本部分基于 GitHub 数据进行分析。我们基于GitHub用户在开源仓库中所触发的事件将GitHub用户分为探索者、参与者、开发者、维护者四个角色,四种角色定义为: 角色 定义 含义 探索者 对某一项目 star 项目的用户
     Like  Bookmark
  • openEuler 社区案例分析 在 2023 年,Gitee 数据首次融入 OpenDigger 社区,使得 Gitee 上的项目也参与到了 OpenRank 的计算中。在这一年,openEuler 社区以 16728 的 OpenRank 值超越 PaddlePaddle,成为仅次于 openHarmony 的中国第二大开源社区。 在 2023 年,openEuler 社区吸引了 3941 名开发者参与 Issue 或 PR 的协作讨论,其中有 1934 名贡献者成功为 openEuler 社区的仓库贡献并合入了至少一个 PR。尤其值得一提的是,openEuler 社区在 2023 年初发起了文档捉虫活动,并在社区文档官网中嵌入了与 Gitee 打通的交互式页面贡献机制。这一机制使得开发者在阅读文档时发现错误时,能够在官网上直接修改并一键发起 Gitee 轻量级 PR,无需跳转到 Gitee 平台或进行 Git 操作。这一创新的机制带来的数据变化令人瞩目,openeuler/docs 仓库在 2023 年合入了 7764 个 PR,其中 74% 的 PR 是通过官网页面直接提交的。这一机制的上线也显著提升了每月平均活跃贡献者数量(从 30 人提升到 80 人)和每月平均合入 PR 数量(从 116 个提升到 722 个)。 另一个值得关注的项目是 openeuler/mugen,作为 openEuler 社区的测试框架项目,该项目活跃度极高。在2023 年,有 138 位开发者参与到项目讨论和贡献中,其中 95 位开发者成功合入了PR。该项目在整个 openEuler 社区中的 OpenRank 排名第三,仅次于 openeuler/docs 文档仓库和 openeuler/kernel 内核仓库。优秀的测试框架为开发者提供了快速编写和运行测试用例的便利,可以帮助他们验证贡献代码的正确性和有效性,极大降低了后续贡献的流程成本。 综上所述,openEuler 社区之所以取得较高的 OpenRank 值,并非偶然。他们不仅为高频低门槛的文档贡献设计了几乎零流程成本的交互式贡献机制,还提供了优秀的测试框架,助力贡献者在贡献代码的同时快速验证其正确性。这些优秀的开发者体验优化是各个开源社区值得学习和推广的范例。 其他中国开发者贡献的顶级仓库列表
     Like  Bookmark
  • 四. 基金会洞察 本部分第一次从基金会这一组织维度,对开源生态的发展进行分析。由于 Linux Foundation 已经扩张成了一个超级基金会,旗下的子基金会作为独立一级标签和其他基金会做对比分析更有意义。 4.1 全球基金会 OpenRank 趋势分析 全球基金会 OpenRank 整体变化趋势 可以看到如下趋势: ASF 以其成熟稳定的节奏发展,今天仍然是很多企业发展全球化项目的首选 开放原子开源基金会,成立 3 年多以来发展迅速,旗下项目影响力总和超越 LF 旗下的各子基金,仅次于 ASF 排名第二
     Like  Bookmark
  • 二. OpenRank 排行榜 2.1 全球开源项目 OpenRank 排名 2.1 全球开源项目 OpenRank 排名(Top 20) 2.2 中国开源项目 OpenRank 排名 2.2 中国开源项目 OpenRank 排名(Top 20) 2.3 全球企业 OpenRank 排名
     Like  Bookmark
  • 一. 概述 在过去两年的开源年度报告商业化篇中,介绍了开源软件商业化成功的底层驱动因素、开源软件公司可能的商业化路径、开源项目投资人判断标准以及案例分享。去年,结合当时市场环境下的一些趋势与变革,探讨了国内的开源项目探索全球化市场过程中的驱动因素、挑战及实现路径,并深入探讨了开源项目商业化发展的驱动因素,引发了许多开源伙伴的热烈讨论。 2022-2023年,人工智能领域迎来了预训练大模型技术发展的大爆发,引发了全社会的广泛关注,并且可预见在未来将持续加深对生活、工作的影响。不难发现,在这次人工智能技术迭代的浪潮中,开源生态也为技术发展起了极大的推动作用,并且有不少开源模型,开源项目在积极寻求商业化。但开源模型与传统的开源软件又有着众多差异。为此,在这样的时代背景下,人工智能开源项目、开源模型的商业化发展,成为了值得深入研究与讨论的话题。 在商业化过程中,包括开源软件、开源模型在内的开源项目的安全可控性是企业用户非常关注的考量因素之一。结合当下技术发展趋势,对开源软件的安全,开源模型的可控,开源商业许可证的分析是值得关注的话题。 资本方是促进开源市场发展的重要参与方。对于投资机构来讲,在对一个开源项目进行判断时往往会综合考虑以下几点:在产品开发阶段,重点要看企业是否拥有代码所有权和控制权,以及是否具备国际竞争力;社区运营阶段,主要看企业是否具备足够强的运营能力;在商业化探索阶段,市场匹配能力与商业模式的成熟度会成为主要关注点。 作为领域内最早关注并持续耕耘开源的机构,云启资本曾在早期成功发掘并投资了PingCAP、Zilliz、Jina AI、RisingWave Lab、TabbyML等开源企业,并持续共建开源生态。为了进一步丰富报告内容,今年非常荣幸联合开源社举办了系列Meetup闭门讨论,和数十位行业嘉宾包括微软、谷歌、Apple、Meta、华为、百度等国内外大厂,斯坦福大学、上海交通大学、中科大、UCSD等高校研究机构,以及国内外大量第一线的创业者们(建议在现在基础上,再选一些人名进行实名感谢),共同围绕着开源商业化相关的AI infra的发展情况、开源大模型发展情况与数据安全进行深入探讨,部分精华交流收录进了本篇报告中。
     Like 1 Bookmark