快讯
10月份销量锐减力帆仍没有回暖迹象
59分钟前
2019中国居民退休准备指数近两年来首降养老第三支柱亟待发展
1小时前
重审龚虹嘉21笔减持,深扒海康威视近年来信披
1小时前
「观察」不要说国内实体店日子难过德国实体店1/3也是空的
1小时前
刘敬灿:黄金明日如何做?下周思路提前知晓内附解套
1小时前
谋求高毛利,乳企激战低温鲜奶市场
1小时前
华为发布网络安全立场声明:用事实为自己辩护从未有过严重安全漏洞
1小时前
受汽车业务拖累本田营收/利润双降
1小时前
每股41欧元照明专家欧司朗即将被出售
1小时前
1个半月5家企业IPO被卡新股市场风向有变?
1小时前
快来看加拿大政府招聘广告全是表情符号!
1小时前
青年汽车正式破产,一场“喝水就能跑”的造车闹剧结束
1小时前
年内第二大周解禁潮来袭!规模突破1500亿上海银行中国人保领衔
1小时前
独立解密佳作《Babaisyou》将在2020年推出关卡编辑器
1小时前
《使命召唤现代战争》大逃杀模式泄露通过1V1逃离集中营
1小时前
BendStudio总监谈《往日不再》续作可能性希望注入更多生机
2小时前
ECONAMIQ开发新型发动机技术可减少燃耗高达20%
2小时前
瑞幸咖啡突然火了!一天暴涨25%,市值突破400亿
2小时前
上月只卖掉29辆传统车创始人曾是重庆首富投资足球17年曾疾呼赌球是最大毒瘤
2小时前
后起之秀“突围”:浙造器械致力高端医疗器械国产化
2小时前
“老”菜场“新”故事:拥抱互联网升级“智慧菜市”
2小时前
销售额增长703%,匹克如何靠新品战略打赢“双11”?
2小时前
当我们说5G元年的时候,体育产业发生了这些事|反脆弱系列④
2小时前
两张榜单透露浙江民企“高质量”发展“新坐标”
2小时前
世界首富易主!彭博社称比尔·盖茨反超贝佐斯登顶
2小时前
不到两年关店超200家7天连锁酒店怎么了?
3小时前
花旗Q3持仓:加仓艾尔建、脸书等偏好金融、医疗及IT股
3小时前

语音定制功能实测:AI正在让用户“离不开”地图APP

曾响铃 2019-09-23 14:23:06

本文经授权转自公众号:科技向令说(xiangling0815),作者:曾响铃

你可能已经习惯了“前方路口左转”这样的地图语音由一个标准的女声,或者某明星的声音发出。

但是,百度地图最近推出的一个功能“语音定制”可能要颠覆你的认知了:指挥路痴的你怎么走,或者与你进行日常交互,或者告诉你景点信息、好吃好玩的声音,可能是你自己的或者是你想要的某种声音!

过去几年,百度地图陆续推出以AI为依托的杀手级应用功能,例如能够识别复杂语音需求的“全语音操控”,用户只需要随心所欲用嘴说出自己要去哪、干什么,地图就能够自动甄选目的地并导航。

现在,每个人都可以有属于自己的地图定制化语音包,AI再一次让百度地图惊艳。而作为行业观察者,响铃和身边的同事、家人、朋友要以用户的身份,去看看这个百度内部代号为“百雀灵”的语音定制项目落地后究竟能带给我们什么样的体验和感受。

语音定制后,百度地图这下把“个性化”玩到了底

由于有了全语音操控能力,在进入“语音定制”功能这件事上,百度地图也充分利用了语音技术的优势,除了通过手动点击地图首页的“出行助手”后进入“语音定制”,我们在打开APP后,只需要唤醒“小度小度”后说出“录制我的语音”也能进入功能界面。

微信图片_20190923140938.jpg

(喊“小度小度”开启语音包录制)

语音合成技术是一套复杂的技术体系,这里不多谈。仅从我们普通用户的使用而言,简单来说,我们能接触到的主要有三个阶段:提供语音素材、等待后台合成、最终上手使用,每一个阶段都关乎体验是否足够良好。

过去地图界也有类似的语音合成技术,但由于技术并不足够成熟,仅限于商用级别的明星、KOL个案声音录制,毕竟,每一个声音都需要花费大量时间到专用的录音棚采集声音素材,长时间的合成运算也需要等上很长的时间(往往以月为单位)。

如果给我们普通用户的个性化语音定制也是这么一套流程,定制也就失去了用户体验的意义。

现在,实际体验下来,百度地图的语音定制已经解决这个商用技术走向“民用”的问题。

先看声音素材采集阶段。

实测只要找一个相对安静的环境,不管是较少人声的办公室还是无人的会议室,跟着百度地图的指引念出20句不超过15字的素材,采集就能顺利完成。这个过程中,用户还可以选择不同的风格的引导语句跟读,例如卡通素材、影视台词等。

百度地图原本让所有人用一套句子应当也可以,但它没有这么做,可见即便素材采集已经足够简单,用户体验的细节还是不放过。

微信图片_20190923140943.jpg

(公司同事纷纷录制属于自己的声音)

录制完成后,进入等待期。百度地图官方宣布用户大约需要等待20分钟,来进行云端的个性化语音合成。这个速度相对于过去以月为单位的合成速度,已经呈现了几何级提升。

但是,实际APP体验时,用户的等待时间往往只有15分钟:

微信图片_20190923140947.jpg

(实测等待时间普遍为15分钟)

15分钟后,经过简单的设置,选择自己的语音包作为APP默认语音包,百度地图各类导航、交互、资讯介绍全部变成用户自己的声音,以后甚至借助百度地图的景区播报功能,可以自己当自己的导游!

为了当场测验语音效果,响铃设置了离办公室不远的星巴克作为目的地,驾车由百度地图进行导航,

微信图片_20190923140950.jpg

(个人导航语音包实测中)

实话实说,最终的个性化语音包与真人的拟合程度并没有达到100%、一模一样的水平,但直观上,八到九成的相似度肯定有,随机邀请写字楼的朋友去“喝咖啡”,这位朋友被惊讶到,“怎么会是你的声音”,冲击感十分强烈。

这样的拟合程度,仅从技术角度看,在简便的素材采集和极短的合成时间下已经非常高。

总体而言,自己和身边的百度地图用户体验下来,最大的感受是“个性化”做到了极致。

过去我们老谈APP产品的个性化,但说实话这种个性化都是“一群一群”的,地图APP给我们划定了一个个明星包,大家“选择”自己喜欢的,个性化程度比过去的一成不变要好很多。

但是,随着我们用户的个性化需求越来越强,这种“聚类”型的个性化已经难以满足需要。从语音包到语音定制,AI语音合成让个性化真正变成字面意义,每一个人都开始拥有真正属于自己的“一个一个”的个性化体验和服务。

你的APP体验,只有你才会有,这才是把个性化玩到了底。

AI+地图玩到这个程度,大家终于不再有选择困难症了

选择困难症是移动互联网信息爆炸、产品爆炸、功能爆炸时代每一个手机前的用户常常犯的毛病,不知道用谁,有时候这个APP好,有时候又觉得那个产品不错,结果手机里装塞满了各种舍不得卸载又不怎么用的APP,常常报警提醒我们要清理手机了。

语音定制功能的推出,是百度地图AI+地图玩法的深入,彻底的个性化后,不讲其他行业大道理,起码用户的选择困难症可能不会再犯了。

实际体验下来,理由有三:

1、彻底的个性化就是用户粘度的最好来源

用户之所以会选择困难,原因无非在于产品或功能的同质化,或者即便有差异化的地方,也不足以支撑用户足够忠诚于某款产品。

一个显而易见的事实是,不少用户手机里往往装了好几个地图APP,在过去,使用哪个产是没有偏好或者说偏好不强的,有时候用这个有时候用那个。

但是,语音定制可能改变这一状况。直观的使用感受就是,当语音包的声音变成自己的声音时,对APP的心态会发生变化,不再纠结选择谁,而是自然而然去打开那个“有只属于自己声音”的APP,这并不是猎奇或尝鲜,而是某种归属感所带动。

我们常常谈论的用户粘度,不就是需要这样的与用户心智上的连接么?

2、外部情感的依从,推动了对APP的使用习惯

此次百度地图推出语音定制,不仅仅有成年人录制声音的模式,还专门针对童声发音不清晰、不流畅等情况进行了优化,如果我们愿意,可以让孩子的声音为日常地图交互增添色彩。

发布会现场,百度地图事业部总经理李莹表示一上线就给其女儿录制了专属语音包,并设置为默认。可以说,此时的李莹既是百度地图的主要负责人,也可以代表一个有孩子的普通用户。

微信图片_20190923140955.jpg

(百度地图事业部总经理李莹)

而响铃的同事黄女士,以普通用户的身份也第一时间录制了其4岁可爱女儿的声音,并设置为默认语音包,按她的话说,“(对这个新功能的)第一感觉是感动”。

微信图片_20190923140957.jpg

(黄女士正在引导女儿跟读语音采集素材句子)

把现代人最重视的孩子纳入到产品体验当中来,许多APP产品未必想不到,但是,通过AI能力的巧妙应用,这种体验就顺势变成了我们用户的某种情感依从。

不只是孩子,还有现任女朋友、男朋友(如果你想的话,前任也不是不可以)、暗恋的人……地图APP里有那些你珍视的人的声音,你还会犯选择困难症吗?

某种程度上,借助AI技术优质,百度地图成功把用户的外部情感依从,转化到了产品内部的使用粘性。

3、技术,永远让产品更丰富、更有趣、更能突破旧有限制

实测随着此次语音定制一同上线的,还有一套带有某种社交属性和内容平台属性的分享系统,我们认为虽然官方的宣传着墨不多,但这套系统更值得玩味。

一方面,我们用户录制的个人语音包可以直接分享给亲朋好友,在熟人社交环境下可以相互分享“声音”——异地的恋人怕是要感动不已。

另一方面,百度地图上某些“人气”的语音包,还有可能获得官方推荐,成为地图产品里的“好声音”,而这已经超出地图产品的范畴,带有某种内容创作式的平台属性——虽然百度地图未必这么想,但从用户角度看,客观上就是如此。

一个声线优美的女生,或者声音温暖磁性的男生,某一天或都有了仅通过声音质量创作内容、表现自己的可能,或者,也来个语音包界的“网红”?

轻互动、轻社交、轻内容……相信更多人不会再纠结日常要使用哪个地图APP了。

更好的AI,理应让更多人分享

能够给到我们普通用户美好体验的技术,背后一定是经过了长久的磨砺。用户看到的永远只是技术冰山露出来的一角,底下是无数时间和实践的积累。

语音定制同样如此,它背后是百度独创的“说话人”韵律迁移技术Meitron,按百度语音首席架构师贾磊的说法,能够实现“发音人音色转换,多情感朗读和韵律风格迁移”,简而言之,即从各个方面完全学习发音人说话,做到合成后的语音与真人语音在各个方向贴近,让人分不出。

微信图片_20190923141001.jpg

(百度语音首席架构师贾磊)

事实上,早前央视公益节目《等着我》与百度合作,利用有限的素材合成已经过世老排长声音发出的句子,让苦寻他多年的老战士现场感动落泪,就是Meitron所实现。

更进一步看,Meitron背后还有百度语音方面的一系列体系化AI能力,它作为语音合成的一个分支,本身也是百度语音的重要技术成果之一。

从百度AI,到百度语音,到Meitron,到语音定制,一环扣一环,最终个性化的语音合成定制门槛大大降低,普通用户更加直接地触摸到AI、感知到AI。

我们不必再把AI视为高高在上的存在,它就是我们身边的技术。百度地图的语音定制内部代号是“百雀灵”,这样来看是希望所有用户都定制出自己的语音包,个性化语音合成的定制门槛大大降低,每一个人,都可以做一只拥有专属声音的“雀”。

这样的语音定制可以、也应当应用到更多需要语音交互的产品上,让那些非地图场景下的用户也能有类似的美好体验,共同触摸AI。百度地图是第一个带来美好技术体验的产品,相信后面还会有更多百度系的产品用上这样的个性化语音定制。拭目以待吧。

特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)


相关文章

正在加载......