Whispr平台有三个核心组件。第一个是Guide Builder,一个基于桌面的应用程序,用于将标准操作程序(SOP),清单,手册等从PDF和其他格式传输到Whispr系统。Whispr将这些文档转换为语音指导,然后通过专用移动应用程序为Android和iOS设备上的前线工作人员部署。
对于文本到语音(TTS)元素,Whispr使用Google的WaveNet合成语音,而其所有自动语音识别(ASR)都在设备上运行,这意味着服务不需要互联网。
虽然Whispr仍然处于萌芽阶段,但看到它的语音指导平台与基于视觉的技术(如增强现实眼镜)相结合将会很有趣。
第三个关键组件是数据。随着时间的推移,Whispr能够更好地理解所询问的问题,可以使用此数据来改进指导和流程。
此外,Whispr最终将推出应用程序编程接口(API),以便公司可以将其集成到自己的软件中。这感觉它可能是该技术的更好用例,特别是对于那些可能更倾向于将语音指导智能集成到他们自己的现有应用程序中的大公司。
我们已经看到微软如何使用远程协助等混合现实应用程序,让技术人员和专家远程查看前线工作人员可以看到的内容并帮助他们解决远程的问题。通过观察视觉数据和AI语音可以改善口头指导。此外,Whispr正在研发其用于“感官数据收集”的AR头显的测试版。
电科技(www.diankeji.com)是一家专注于全球TMT行业的领先资讯媒体。
作为今日头条青云计划、百家号百+计划获得者,2019百度数码年度作者、百家号科技领域最具人气作者、2019搜狗科技文化作者、2021百家号季度影响力创作者,曾荣获2013搜狐最佳行业媒体人、2015中国新媒体创业大赛北京赛季军、 2015年度光芒体验大奖、2015中国新媒体创业大赛总决赛季军、2018百度动态年度实力红人等诸多大奖。
投稿、商务合作请联络微信公众号
声明:本站原创文章文字版权归电科技所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表电科技立场,图文版权归原作者所有。如有侵权,请联系我们删除。