Google近日发布了全新的移动端3D识别方案Objectron,该方案可在2D图像中发现物体并通过AI模型估算其位置、方向和尺寸。Google表示,Objectron对机器人技术、自动驾驶汽车、图像检索和AR技术影响深远,例如,其可以帮助工厂车间的机器人实时规避障碍。
目前,跟踪3D对象是一个棘手的问题,尤其是在处理有限的计算资源时。由于缺乏数据以及物体的外观和形状的多样性,当仅有的可用图像为2D时,情况会变得更糟。
为此,Objectron研发团队开发了一种图片标记工具,该工具可以通过分屏视角显示2D视频帧,支持标记者使用分屏视图显示2D视频帧来标记对象的3D边界框(即矩形边框)。这些3D边界框将叠加在点云数据、摄像头画面和识别到的平面上。
标记者在3D视图中标记3D边界框后,可以在2D视频帧中进行验证,而对于静态图像,标记者只需在单个帧中标记目标对象即可。标记工具还使用AR session数据中的实际摄像头信息来确定该物体在所有帧中的位置。
为了补充现实世界中的数据以提高AI模型预测的准确性,Google研发团队开发了一种引擎,将虚拟对象放置到包含AR会话数据的场景中,这样就可以使用摄像机图像检测到的平面区以及预测的光线,来生成与场景匹配的光照在物理中的位置,从而产生高质量的合成数据。在验证测试中,综合数据的准确性提高了约10%。
电科技(www.diankeji.com)是一家专注于全球TMT行业的领先资讯媒体。
作为今日头条青云计划、百家号百+计划获得者,2019百度数码年度作者、百家号科技领域最具人气作者、2019搜狗科技文化作者、2021百家号季度影响力创作者,曾荣获2013搜狐最佳行业媒体人、2015中国新媒体创业大赛北京赛季军、 2015年度光芒体验大奖、2015中国新媒体创业大赛总决赛季军、2018百度动态年度实力红人等诸多大奖。
投稿、商务合作请联络微信公众号
声明:本站原创文章文字版权归电科技所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表电科技立场,图文版权归原作者所有。如有侵权,请联系我们删除。