从模型开源、到SDK开放,再到落地应用,百度开启视觉”软硬结合“时代

电科技辛雯09-16 17:14

9月15日,百度世界2020大会于线上正式召开,作为百度每年面向行业、媒体、合作伙伴和广大用户的最高级别的行业盛事。本次大会以“万物智能”为主题,吸引了众多行业专家、技术大咖、开发者及科技爱好者的关注。

本次大会中,百度不仅交出了一份份令人满意的人工智能最新产品、技术、落地成绩单,发布了多项AI革命性新品;更是向外界展示了一年来百度各个业务线所取得的巨大成果,例如百度移动生态、百度大脑最新技术产品获得巨大突破;百度智能云在城市、能源、工业制造等领域持续落地;小度发布“破圈战略”智能硬件新品;Apollo自动驾驶再取佳绩......

其中,计算机视觉作为AI技术的重要部分,在此次大会百度大脑分论坛上,也成为了百度重点分享的内容。百度视觉技术部总监丁二锐表示,伴随着云化概念的深入,硬件的计算能力从云到移动端、到边缘,算力以三个数量级的比例在下降。所以,百度重点建设并开源了模型小型化技术,在有限计算资源的情况下保持算法效果不降。同时,这次还向算法开发者开源了多个性能卓越的视觉模型,向应用开发者开放了多种视频生成SDK。

为模型“健康瘦身” PaddleSlim助力Slim系列模型发布

2019年,百度推出了PaddleSlim,提供量化、蒸馏、剪枝、网络结构搜索等压缩和设计策略,同时多种策略可快速配置组合使用,帮助深度学习开发者解决了设备上内存紧张、功耗限制、算力有限等难题。

对于业务用户来说,PaddleSlim提供完整的模型压缩和设计解决方案,目前已用于图像分类、检测、分割等各种类型的视觉场景。而对于模型压缩算法研究者或开发者来说,PaddleSlim提供各种压缩和设计策略的底层辅助接口,方便用户复现、调研和使用最新论文方法。

在此次分论坛上,丁二锐除了分享了PaddleSlim的强大能力之外,还为用户及开发者带来了一条重磅消息——Slim系列模型开源。目前,Slim系列模型不仅包括分类和检测等效果出众的基础模型,还包括业界最小的开源人脸识别和文字识别等模型。在人脸识别方向,Slim系列模型可以在效果不降的情况下,计算量只有其他开源模型的1/7。在文字识别上,最新的模型大小仅仅只有3.1M。

值得特别提及的是,CVPR的低功耗计算视觉比赛(CVPR2020 LOW-POWER COMPUTER VISION CHALLENGE)也刚刚宣布了结果,百度联合清华大学在竞争最激烈的Real-time Image Classification Using Pixel 4 CPU赛道中击败众多强劲对手取得冠军。本次发布的开源分类模型中就包含了此次比赛的冠军模型。

image.png

用技术赋予每个人独特形象 业界首发多个人物生成SDK 

除了在端边算法上的不断优化及模型压缩解决方案的不断完善,本次分论坛上,丁二锐还带来了百度AI视觉领域的全新产品:业界首发终端2D虚拟真人SDK、业界首发二次元人像转换SDK和业界首发端云一体虚拟形象构建及应用解决方案。

image.png

终端2D数字虚拟真人SDK,基于3D人脸建模、唇形预测、图像融合、GAN视频生成等技术,可实现基于5分钟视频素材的低成本形象建模,支持终端的实时对话视频生成及表情和肢体动作驱动。可以大大降低客户的购买及部署成本,同时解决网络依赖延迟的性能等问题;二次元人像转换SDK,基于人脸分割、关键点检测、GAN视频生成、模型压缩等技术,支持肤色自定义调节、人像多种风格切换;而虚拟卡通人端云一体方案,具备秒级的形象生成、并可通过视觉和语音驱动,可以赋予每个人独特形象。这些人物生成SDK,构成了全面的能力生态,可以为虚拟主播、智能化视频生产提供完善的解决方案。

端边硬件+场景算法+PaddleSlim,生活各个方面正经历“软+硬”时代

近年来,视觉技术已经广泛应用于各大领域,但要进一步普及,在成本控制、算法指标、持续服务和完整方案上,对厂商提出了更高的要求,目前软硬件相结合的产品服务成为主流趋势。

作为最早的视觉软硬一体化解决方案,百度大脑度目硬件将极具优势的算法模型通过嵌入式开发技术移植到端边产品上,打造了人脸应用套件、人脸抓拍机、AI镜头模组、视频分析盒四款民用软硬件产品。软硬结合一体化,实现算法与硬件的深度调优,配备预设应用,可直接部署应用及轻量级二次开发集成。

image.png

目前,度目依靠“端边硬件+场景算法+PaddleSlim”三位一体的强大能力,已经在承德市30家连锁商超进行商业分析等工作;中山市公安局镇级社区门禁系统也通过度目实现了智能化升级;包括广州某出租车营运系统的驾驶身份、行为识别。当PaddleSlim和其他视觉算法在硬件上结合时,也赋能了许多其他应用场景,小度在家的手势控制;好看视频APP的表情识别;国家电网智能巡检解决方案......从智慧分析、智慧社区,再到驾驶管理、产业赋能,百度大脑已经打造出一个特有的“软+硬”视觉时代,并时刻守护生活的每个角落。

可以看到,二十年的技术积淀,近十年的 AI布局,让百度AI前进的步伐越走越稳,也越来越快速敏捷。除了进一步开放AI能力,百度也在通过软硬一体化等方式,降低视觉各种技术的落地门槛,让AI技术得以延伸到更多行业场景,无论是安防、金融、交通,还是教育、酒店、零售、医院、公寓,助力开发者绕过算法与硬件的桎梏,将更多精力放在业务开发部署上,这为产业智能化的进程提供了前所未有的加速度。

电科技(www.diankeji.com)是一家专注于全球TMT行业的领先资讯媒体。

作为今日头条青云计划、百家号百+计划获得者,2019百度数码年度作者、百家号科技领域最具人气作者、2019搜狗科技文化作者、2021百家号季度影响力创作者,曾荣获2013搜狐最佳行业媒体人、2015中国新媒体创业大赛北京赛季军、 2015年度光芒体验大奖、2015中国新媒体创业大赛总决赛季军、2018百度动态年度实力红人等诸多大奖。

投稿、商务合作请联络微信公众号

声明:本站原创文章文字版权归电科技所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表电科技立场,图文版权归原作者所有。如有侵权,请联系我们删除。

//59087780b049bbb54ef4ba547ea51910