“开源(open source)”这个词,指软件源代码被开放出来,其他用户可以在其基础上修改和学习。开源既造就了繁荣的互联网时代,又成为技术理想主义者的“乌托邦”。在开源的江湖,珠玉在前,后继四起,但百度从未缺席。
近日,权威科技媒体通过分析GitHub上的开源项目数据集GitHubArchive,得出2020和2019年度全球深度学习框架排名榜单,其中,百度飞桨PaddlePaddle均力压谷歌TensorFlow,紧随Facebook PyTorch之后,其抢眼的数据表现意味着在开发者积极贡献代码和项目、社区活跃、代码迭代速度上一直保持着强劲的竞争力,已经成为了国内第一、世界第二的深度学习开源框架,将国内开源的“终极理想”往前又推进了一步。
2020/2019年度全球开源深度学习框架活跃度排名榜单
如果GitHub开发者想要对开源项目贡献代码,需发起pull request把自己修改的代码合入分支主,如果pull request被合入,则表示代码被采用,成功完成一次开源贡献。因此,pull request的发起(open)数量是评估开发者积极贡献代码、项目和社区活跃最直观的指标,合入(merged)pull request是评估开源项目的代码迭代速度的一个极佳的权威性指标。
该媒体通过分析GitHub开源项目数据集GitHubArchive之中关于pull request的发起和合入数据,获得了2020和2019年度全球深度学习框架活跃度排名榜单,其中,百度飞桨的open数据由去年的2759次跃升到今年同期的3391次,比现阶段暂列第三的谷歌Tensorflow高出1000多次。飞桨的 merged数据由1924次跃升为2428次,力压暂居第一Pytorch的238次,比第三名Tensorflow高出近1000次,这也意味着“动静统一、软硬融合”的飞桨一直在致力于让深度学习技术的创新与应用更简单,其提供的AI底层技术也深受开发者欢迎。
GitHub 标星 47000+ 百度飞桨成为国产开源“流量担当”
百度飞桨于2016年9月正式宣布开源,这使得百度成为继谷歌、Facebook、IBM后第四家将AI技术开源的公司。作为国内AI开源的扛把子,百度飞桨集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体,并根据本土化特点将开源框架与应用层面做了更好的结合,旨在打造自主可控的人工智能操作系统,持续赋能广大开发者,这意味着个人开发者也可以利用飞桨提供的平台部署自己的深度学习模型。
经过 4 年的发展,飞桨在 GitHub 上已经有 62 个 Repositories,共收获 47000+ Star,成为国产开源项目的佼佼者。
(飞桨在 GitHub收获了超过47000个Star)
作为我国首个开源开放、功能完备的产业级深度学习平台,飞桨能够做到这样的地位,当然少不了要有自己独特的优势。总的来说,飞桨有以下 4 大领先技术。
首先,同时支持动态图和静态图的编程,能够兼顾易用性和效率。飞桨平台结合了动态图的易用性和静态图的高性能,使开发者可以兼顾两者的优势。第二,针对大规模的工业化场景,飞桨提供大规模分布式训练能力,在真正的工业场景应对自如。飞桨平台推出了支持万亿规模参数模型的实时更新能力和训练能力。第三,端到端的部署是应用深度学习的一个非常关键的环节,飞桨提供非常完备的支持各种硬件的端到端的部署能力,能够使得开发者推理、预测的过程足够顺畅。最后,飞桨还有大量在产业实践当中沉淀出来的模型,并提供官方的支持,能够保证开发者的应用效果是最佳的、真正可靠的。
更可贵的是,飞桨并没有满足当下国内深度学习领域“流量担当”地位,仍在持续进行优化升级。在前段时间举办的百度世界2020百度大脑分论坛上,飞桨实现了"动静统一、软硬融合"的更新:硬件上,飞桨目前已适配22种芯片型号,覆盖15家硬件厂商,对国产硬件的支持超过TensorFlow和PyTorch;软件上,动态图功能升级实现了动静态的结合,让用户更容易开发模型;全面升级的API体系,则对于开发者更加友好。
2020年9月,百度飞桨深度学习平台入选了2020服贸会 “科技创新服务示范案例”, 数据显示,飞桨当前支持140+个产业及开源算法,累计开发者230万,服务企业9万家,基于飞桨开源深度学习平台产生了31万个模型。在城市、工业、电力、通信等很多关乎国计民生的领域都有飞桨在发挥作用。
践行开源开放理念 百度飞桨在多领域助力应用落地
基于其简洁、灵活、快速的特性,百度飞桨推动了各个行业的深度学习应用,在液晶显示屏的检测、机器人安全巡检、遥感监测等领域发挥着不可代替的作用。拿液晶显示屏检测来说,精测电子应用飞桨开源深度学习框架开发后,基于其分类、检测、分割等多种功能模块,对具有缺陷的液晶屏幕检测的精度上有很大提升。
(百度飞桨全景图)
同时,飞桨还正在利用技术优势推动各个行业的深度学习应用,在液晶显示屏的检测、机器人安全巡检、遥感监测等领域发挥着不可代替的作用。
例如在消费类电子领域,OPPO在其多个业务线都上线了基于飞桨构建的大规模分布式推荐系统,覆盖全球3.5亿月活用户;工业安全领域,通过飞桨研发的输电线路通道隐患目标图像与视频智能检测系统,实现了输电线路通道隐患目标的自动化识别和预警;环境保护领域,飞桨支撑的无人机自主飞行+应用管理平台,可以对森林进行自主巡逻、火情监测、非法入侵、森林树木砍伐监测等功能……而这些只是百度飞桨深度学习平台产业实践的冰山一角。
(电网智能巡检方案上线以来已发现多起安全隐患,是飞桨的典型应用之一)
今年5月,百度发布了Paddle Quantum,这是建立在百度飞桨深度学习平台之上的开放源代码的机器学习工具包,它包括量子开发工具集,量子化学库以及一系列优化工具,可以帮助领域内的科研人员以及开发者在量子计算应用程序中训练和开发AI,也为相关领域的爱好者开发量子人工智能的应用提供了强有力的支撑。
在百度开源理念下,多领域的领先技术被开放出来,越来越多的开发者通过开源技术来构建业务,并且形成了应用繁荣、活力十足的社群。尤其是飞桨深度学习平台,既帮助开发者实现人工智能应用的落地,也在不断的反馈中迭代平台架构,促进自身技术升级,并更加贴合开发者的实际需求。
例如,有大学生借助飞桨,让人工智能来为野外摄像装置拍摄的海量图片进行筛选和标注,代替人工的繁琐和低效,大幅节约人力成本。这一产品将在今年年底交付,方便野保工作者轻松使用,为滇南地区包括滇金丝猴在内的生物多样性保护贡献了很大力量。
还有大学生借助飞桨来搭建深度学习模型,通过摄像头捕捉和识别聋哑人群的手语,再转化成语音。如此一来,人们可以流畅地与聋哑人交流,改善特殊人群的生存处境。该项目已在AI Studio人工智能学习与实训社区开源,以群策群力实现优化和落地。
在这些案例中,开源的飞桨成为链接开发者之间的“桥梁”,不仅让每一个人可以实现自己的理想,更可以通过这些公开项目,加速技术的演进与商业、社会议题的解决。社区的广泛参与,正是飞桨等开源项目的活力体现,在其上构建繁荣的生态,形成足够强大的产品竞争力。
构建开源开放生态 百度要打造人人可以实现理想的技术乌托邦
开源思路,既体现了百度的基因和能力,也表达出其开放的态度,助力更多企业和开发者实现自己的应用落地与业务升级转型。
以深度学习框架为例,百度飞桨具备了深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件,让所有人都可以在平台上部署自己的深度学习模型,并且具备简洁、灵活、快速的特性。
(飞桨深度学习开源开放平台全景图)
另一个典型的领域是自动驾驶。2017年11月,百度发布了全球首个自动驾驶开源项目——Apollo 自动驾驶开放平台,其自动驾驶软件可供任何人免费下载及修改使用。这意味着,许多企业都能通过Apollo平台结合车辆和硬件系统,快速搭建一套属于自己的完整的自动驾驶系统。
目前,百度 Apollo 平台已经汇聚了全球177家生态合作伙伴;在全球,有97个国家超过3.6万名开发者使用 Apollo 开源代码,开源代码数量超过56万,Apollo 自动驾驶平台已成为全球最强大、最开放、最活跃的自动驾驶平台。
(Apollo已经形成全球最强的自动驾驶生态)
此外,还有百度ECharts,这是当前流行、最强大的可视化库之一,它提供了直观,生动,可交互,可个性化定制的数据可视化图表。从2013年1.0版本发布至今,为用户提供了交互、多维度数据分析、数据自由刷选、多图表联动、渲染等丰富功能。目前,Apache ECharts (incubating) 在Github中的star数已经超过42k,每周npm下载量超过25万。
目前,百度已经构建起了全新的开源开放生态,主导了一千多个开源项目,聚拢了超过一万名社区贡献者,获得超过30万次GitHub Star(点赞或支持)。从人工智能基础底座深度学习平台,到语音、视觉、自然语言处理、知识图谱等通用AI能力,再到Apollo、DuerOS、智能小程序等开放平台,以及智能交通、智能家居、工业农业等场景化应用,百度开源的能力与技术已经在生活中广泛落地。
(百度开源开放生态)
除此之外,百度还深度参与国内外顶级开源基金会和组织。百度既是Apache 基金会、Linux 基金会以及云原生计算基金会的金牌会员,其旗下Echarts、Doris、Brpc等多个项目已经成为 Apache 基金会孵化项目,Baetyl、IME、EDL等项目入选了Linux,百度BFE更是成为云原生计算基金会中,第一个来自中国的网络方向沙箱项目。
同时,百度也在大力支持中国自主代码托管平台建设,以应对复杂国际形势下带来的封闭风险。2019年,百度战略投资了开源中国,这是中国最大的开源技术社区,旗下运营的Gitee代码托管平台是全球仅次于GitHub的代码托管平台,每日约增加5000名开发者、200家企业客户、1.7万代码仓库。在国际市场,开源中国已经可以和GitHub掰手腕,为中国开发者提供了自主稳定的保障。
百度创始人、董事长兼CEO李彦宏在百度世界2020大会上表示,“推动人工智能扎实渗透,行业要充分利用开源、开放平台,它在人工智能发展当中的作用会越来越受到重视。”百度CTO王海峰也认为,“一方面,开源创新可以加速技术的创新发展,不断拓展人类认知边界和技术边界;另一方面,所有开发者都可以基于开源开放的成果开发自己的项目、产品及业务,更便捷、高效、安全地推进技术创新与应用。”
可见,“开源”两个字已经深植百度的基因之中。也证明了,开源开放才是实现技术革新与产业演进的最佳途径。未来也需要更多像百度一样的企业,致力于开源开放,为企业、行业和广大开发者,打造共同繁荣的技术乌托邦。
电科技(www.diankeji.com)是一家专注于全球TMT行业的领先资讯媒体。
作为今日头条青云计划、百家号百+计划获得者,2019百度数码年度作者、百家号科技领域最具人气作者、2019搜狗科技文化作者、2021百家号季度影响力创作者,曾荣获2013搜狐最佳行业媒体人、2015中国新媒体创业大赛北京赛季军、 2015年度光芒体验大奖、2015中国新媒体创业大赛总决赛季军、2018百度动态年度实力红人等诸多大奖。
投稿、商务合作请联络微信公众号
声明:本站原创文章文字版权归电科技所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表电科技立场,图文版权归原作者所有。如有侵权,请联系我们删除。