编者按
Rokid是一家专注人机交互技术研究和人工智能软硬件产品开发的科技创新型企业,产品涵盖智能家庭机器人、智能音箱、增强现实(AR)眼镜,以及人工智能应用与服务。作为国内较早涉足AI领域的创业企业,Rokid一直把用户体验放在首位,同时也用一款款科技感十足的产品教育着用户,让人工智能产品和新的人机交互方式走进每个人的生活当中。
将乐趣融入产品
时间正值立秋节气,连续的高温让整个杭城被笼罩在一片热潮之中。闷热的午后,我走进了坐落于西溪湿地南部的Rokid大楼内,此时几个年轻人坐在咖啡桌前,正满脸笑容地讨论着一些让人似懂非懂的问题,中间还夹杂了大量的术语。坐在一旁的Rokid副总裁向文杰告诉我,Rokid一直崇尚“玩乐”精神,即使是在工作当中也一样,这个咖啡厅里听到最多的一定是爽朗的笑声。抛开繁重的工作,Rokid希望每个员工都可以有“玩乐”的精神,这也是Rokid一贯的企业价值观。向文杰表示,玩乐是一个人的本性,Rokid想让员工在一种放松的环境下工作,最终把这种自由的想法融入产品当中,带到用户手里。
说到玩乐就不得不提到前段时间Rokid的发布会“Rokid Jungle”。为什么给发布会取一个这么“野性”的名字呢?Rokid创始人Misa曾说过:“就像人类发展的每个阶段,都有一片黑森林。而人工智能这个领域,是人类有史以来,最大的黑森林,我们所选择的这条路,就像在jungle里行走,没人知道正确的方向在哪。也许会半路倒下,也许会突然走出一片天地。”正是带着这样的探索精神,Rokid近期发布的两款便携式产品Rokid Me和AR眼镜,通过随身携带的AI产品,更好地把AI所具备的能力展现在生活中的每一个场景里,用最棒的交互方式推动用户发现乐趣,找到一种社会模式下本真的自由活法,就正如你在丛林中发现了最值钱的宝物一样,没有人会拒绝这种体验感。
智能音箱 语音技术落地智能家居的直观展现
寻宝之路少不了一张藏宝图,而用户感受人工智能带来的方便和快捷就需要交互技术的帮助。随着时代的发展,人们开始关注语音识别技术,更多的观点认为语音识别是人机交互的下一个入口,而作为当前语音识别最好的智能家居场景,智能音箱得到了众多青睐,各大公司纷纷发布了自己的智能音箱产品。
Rokid就是最早一批把AI技术落地的公司,早在2014年Rokid便研发出了第一代智能音箱产品。向文杰一直认为要把好的技术展现给用户,落地到产品当中去,是必然要迈出的一步,“如果自己不干,怎么会知道未来技术的发展方向在哪呢?”,这是他对于语音交互技术的理解。当然也只有在自己做好的前提下,才能更好地帮助行业伙伴发展。在向文杰看来,AI需要结合用户的数据和喜好,才能不断往前发展,不然只会原地踏步。智能家居是目前语音交互技术应用最广泛的领域,其中拥有大量的信息数据,可以很直观地反馈用户的体验感受,帮助企业探索未来软硬结合的盈利模式。而作为入口级的产品,智能音箱的用户体验就显得尤为关键。
Rokid Me就是在这样的想法中诞生的。Rokid希望用一个设计感强、品位高、有质感的产品让用户记住,智能音箱不仅仅只有低价模式,也会有成熟的科技感产品。Rokid始终坚信用户最终得到的是体验,而并非产品,做好自然、舒适的体验比什么都关键。而对于Rokid来说,这种体验不仅限于智能音箱,还可以延展到包括:儿童故事机、智能电视、智能家居等以语音交互为核心的产品领域。
赋能行业 平台化布局开阔视野
目前音箱行业中许多企业缺乏语音技术支持,把AI产品化的能力相对较低。而Rokid可以提供一整套的产品、技术、方案和体系,解决这一类的困境。如果说内容是身体的话,那么Rokid想帮大家把音箱的大脑做好,降低行业门槛,让更多优质的内容可以进入到用户的视野当中去,“通俗地说,就是给行业赋能嘛。”向文杰补充道。
他还指出未来的智能音箱有两个发展方向:一种是偏互联网的玩法,降低音箱价格,把产品“送”出去,以此来完善自身的业务链条;另一种则是把产品平台化,“散”出去,提升用户体验,让用户离不开智能音箱。Rokid不同于行业内的音响产品制造者,早早就组建起几十人的博士团队,目标就是要做行业解决方案的赋能者。
谈到这里,向文杰充满自信地说到,Rokid也要建构属于自己的OS,它就像安卓,把产品平台化,所有接入的音箱企业都会共用这个平台,平台还会拥有一个开放允许多边自定义接入的操作系统。过往,Rokid做智能音箱,用语音识别来做人机交互,实现的是人与单个硬件之间的交互,而未来人工智能与物联网的发展趋势是人与多硬件之间的交互,这就需要OS这样的操作系统来实现。
不过,对于Rokid这样的创业公司来说,这是一个非常大的工程。因此Rokid把首要目标设定为找到有一个有效且能集力的边界——在Rokid现有框架之下,OS是在解决方案+芯片之上的一个全面整合方案,针对想要进入Ai平台的厂商而言,Rokid所能提供的不光是解决方法,不光是芯片,还有算法,还有操作系统与技术标准,甚至是已经整合完毕的内容资源,在一整套的标准+技术+芯片+解决方案+内容资源的赋能之下,任何一个厂商都可以通过Rokid的平台,自行定制出于属于自己的AI产品。
AI与智能音箱已成风口,赛道拥挤,即将爆发的前夜,Rokid又凭借4年领跑的积累转身成为业内少有的能供包括前端、ASR、NLP、TTS 在内的完整全链路语音解决方案提供商,站在价值链的上游为整个行业赋能。
AI芯片 助力AI产业发展的关键一环
做AI就一定绕不开芯片,众所周知,Rokid AI芯片主要聚焦于语音交互领域。语音芯片前景广泛,在教育、电视、医疗方面都会有体现,并且随着技术门槛和成本门槛的降低,芯片功能还会变强,具备一定的加速性,在IoT的垂直细分行业得到广泛应用,语音智能化将得到普及。
有了AI芯片以后,输出方案、产品、技术就包含在一块芯片内了。在向文杰看来,未来的芯片会越来越趋向于行业定制,通用芯片价值会越来越小,“芯片是会跟着行业成长的”。目前,Rokid的芯片从整个系统出发,定制出性能高、价格低的芯片,在行业内极具优势。在未来,Rokid AI芯片会和AR更紧密的结合在一起。并且通过这样的方式,会把行业推向更固定、成熟的模式。AI芯片最大的优势在于,通过高集成度,可以把所有涉及到的技术都整合在内,帮助企业来实现交互,包括云端服务的一整套方案。Rokid走的路线是让芯片的性能越来越高,成本越来越低,让更多的合作伙伴使用AI芯片,帮助行业更好地发展。Rokid希望在有限容量内,尽可能提高性能,同时从缩减供应链成本的角度压低价格,从而形成竞争力。
放眼未来 AI技术成熟指日可待
我们对于语音技术发展过程中的定义一直有一个误区:其实语音并不是带来功能上的改变,而是在交互方式上。举一个简单的例子,手机是人机交互过程中的一个里程碑,它定义了产品随身化的特点,但是手机并没有完全把PC淘汰掉。在未来,人工智能也会越来越普及,它将具备离散化、碎片化的场景式功能,但是人工智能也不会完全淘汰掉手机,而是将更多的功能与手机结合在一起,代替触摸的方式来完成一系列的操作,把语音交互放在人机交互的首要位置。在AI技术实现精准、智能化以后,手机可以接收指令一步到位,高效搞定任何一件琐事。向文杰认为,到未来一定是在云端会有统一的智能系统,我们称之为若琪,它能听懂你讲的话,也可以把你的设备打通,把指令传给设备,带来互动。这样一来,交互的难度降低,交互的速度变快,用户的体验变好。同时云端有大量数据,配合AI技术,产生个人推荐,精准定义每个人的自由生活方式。而且未来的交互都是低成本的,就如同手机这样,具有广泛的普及性和教育性。在此基础上,语音的价值会越来越大,到了那个时候再进行家居控制就会觉得特别的爽。AR也会是未来的趋势之一,AR和语音两者在未来会结合,产生出更多的形态进一步降低行业门槛,帮助AI像互联网一样快速普及。
互联网企业入场也加速了AI的成熟。在目前的环境下,没有哪个公司可以单独覆盖掉所有的IoT领域,整个生态千变万化,基于不同的诉求,需要不同的做法。Rokid 此前携手阿里云共同推出全栈语音开放平台,为业界提供一站式语音解决方案和开发者平台,面向全行业开放语音识别、语音合成、语义理解、声纹识别、麦克风阵列、信号分析处理等多项技术。作为国内最早涉足 AI 领域的创业者,Rokid希望通过开放自己所有的经验,为后来者提供更多的借鉴,为全行业赋能。
采访手记
走出Rokid大楼,天空中已经下起了淅淅沥沥的雨水,给八月的火热杭城带来了些许凉意。面对国内井喷式爆发的AI市场,Rokid似乎也以一种极其“冷静”的态度泰然处之。区别于行业内一些初创企业的“奔放式”玩法,Rokid更加看重产品给用户带来的体验,想方设法把技术做到最好,加速人工智能落地智能家居场景当中,迈出走向未来的重要一步。我们也十分期待Rokid会发布更多有趣、好玩的AI产品。