#神灯搜索#百度神灯搜索涉及哪些技术?

Issac 科技 2015-04-02 2485 0 世说新词

“神灯搜索太黑科技了,很想立刻感受一下”。不过也有网友猜测,手机百度选择在愚人节这天发布“神灯搜索”视频,“会不会是愚人节玩笑?”小编并非专业的科技人员,不知道手机百度“神灯搜索”这段看起来很科幻的视频是不是已经可以实现。而手机百度方面也并未对外透露这款产品到底是已经在研发中,还是仅仅是一个愚人节的小玩笑。不过,随着科技的进步,未来的移动搜索肯定会往更直观、更智能、更具互动性去进化,从这段视频所引发的网友讨论来看,大家似乎已经迫不及待地等着那一天的尽早到来了呢。

  #神灯搜索#百度神灯搜索涉及哪些技术? 科技 热图1

  4月1日,手机百度推出一款名叫“神灯搜索”的功能,需要使用手机百度搭配“百度神灯”智能扩展配件来使用。用户可以通过“摩擦摩擦”百度神灯的边框启动该功能,然后利用语音进行智能搜索,搜索结果会以全息投影的形式呈现出来,并支持用户进行多轮语音交互、支持用户通过手指触摸对影像进行放大、缩小等操作。

  当天,手机百度在爱奇艺、腾讯视频等网站都上传了“神灯搜索”宣传视频,视频中演示了手机百度疑似即将推出“神灯搜索”新功能。

  小编想问,“神灯搜索”到底能不能实现、离我们还有多远了?

  “神灯搜索”都涉及了哪些技术?

  启动“神灯搜索”,需要用手摩擦“百度神灯”的边框,这个没什么技术障碍,很多智能手机现在都支持熄屏状态下的手势唤醒等操作,加个感应器的事儿而已;然后是语音搜索,这个虽然现在已经实现了,但是要实现后续的多轮对话,一方面需要更加出色的语音智能交互技术,另一方面也需要背后人工智能技术的强力支持;最后,还需要全息投影技术的支持以及在全息投影上进行操作的虚拟触控技术。

  既然摩擦唤醒不是个难事儿,我们就来看看语音智能交互、人工智能、全息投影以及虚拟触控技术的进展。探讨一下如果真要做“神灯搜索”的话,还有哪些技术需要提升。

  #神灯搜索#百度神灯搜索涉及哪些技术? 科技 热图2

  识别率不断提升,语音智能交互初具规模

  不同于大家熟悉的siri等语音产品,视频中“神灯搜索”和用户的语音智能交互过程让人印象深刻,而这些部分功能的实现需要依托于语音识别和人工智能这两个领域的进步。目前,谷歌、苹果、百度、科大讯飞等国内外企业都在语音识别领域发力,并取得了突破性进展。

  既然“神灯搜索”是百度可能推出的功能,我们就来看看百度目前在语音技术方面的进展。类似视频中演示的语音交互,其实包含了语音识别、语义理解和语音合成几个方面的技术,依托百度自然语言处理(NLP)及机器学习领域的经验,百度在语义理解方面的技术实力毋庸置疑;而近期,百度在语音识别率方面也取得了较大的突破。根据媒体的报道,百度首席科学家吴恩达曾透露,通过使用神经元系统以及数据燃料,百度人工智能帮语音识别提高了准确性,百度语音识别可以很好地处理背景噪音,使手机离得比较远也能很好地识别用户讲出的话。

  权威测试结果显示,在噪音环境中,百度Deep Speech系统的出错率要比谷歌语音识别引擎,微软必应以及苹果的语音系统低10%以上。这对类似神灯搜索这样的依托语音智能交互的功能来说意义非常重大。

  #神灯搜索#百度神灯搜索涉及哪些技术? 科技 热图3

  人工智能离你我很近

  百度神灯搜索还有一个亮点是“懂你”。当人们想订电影票时,通过“百度神灯”唤醒“神灯搜索”,语音搜索“最近什么电影好看啊”,手机百度就会立即投出近期热映的“帕丁顿熊”全息影像,并可以播放预告片,基于用户数据进行影院、场次、座位的智能推荐,简捷地完成在线选座。要像“神灯搜索”一样做到“有求必应“,背后的人工智能技术是关键。

  人工智能技术从去年开始再次得到了前所未有的关注,Eron Musk和霍金的“人工智能恶魔论”在学术界和产业界引发了激烈争论;资本对这个方向也是趋之若鹜。公开数据显示,截止到2004年,有超过20亿美元的风险投资流入到基于认知技术研究的产品和服务里,超过100家的相关公司被互联网巨头收购。谷歌、百度、Facebook和IBM四家科技公司在人工智能领域强势布局,并将这些技术应用到具体的产品和服务中,让人们真正感受到了人工智能带来的优势。

  例如谷歌去年初收购DeepMind公司后推出了新的模拟神经网络,能够模仿人类大脑的工作记忆原理,拥有更加强大的归纳整理和联想演绎等逻辑处理能力,从而带来更快的任务处理速度,还可以通过训练去自行处理任务。Facebook则利用人工智能算法分析用户在Facebook的全部行为,从而为用户挑选出其感兴趣的内容。IBM推出了新版“沃森”,并开放了Watson平台,开始与纽约基因中心开展合作,将人工智能用于医疗领域。

  国内企业中,百度在该领域深挖已久,去年刚刚正式对外公布了“百度大脑”。百度大脑通过深度学习来模拟人类大脑的神经元,参数规模达到百亿级别,这是世界上最大规模的深度神经网络,目前已具备2-3岁儿童智力水平。今年初,百度对外公布了其基于人工智能深度学习等技术打造的“对象识别方法和装置”专利技术,这项专利技术可以保证“神灯搜索”里所提及的多轮语音交互的实现。

  #神灯搜索#百度神灯搜索涉及哪些技术? 科技 热图4

  全息投影其实屡见不鲜,虚拟触控才是真正难点

  在“神灯搜索”功能里,“百度神灯”智能硬件可以投射出各类的全息投影。事实上,尽管全息投影看上去才刚刚为我们所了解,比如今年春晚上李宇春所表演的节目《蜀绣》就里用了该技术,但其实全息投影技术早在1947年就由英国物理学家盖伯发明出来了,而在我们的邻国日本,虚拟歌星初音未来早就考全息投影技术成了全民偶像。所以说,要实现全息投影其实并不难,可能存在的难点在于如何在不使用多余附件的情况下,既保证投影的效果,又让投射装置可以小型化到一个手机套的大小。

  “神灯搜索”在视频中还可以让用户实现对全息投影进行虚拟触控,之前曾经在极客圈子里小范围风靡过的Magic Cube激光键盘跟这个有些类似,用户只需要对着投射出来的影像就可以完成相应的交互。但像“神灯搜索”视频里演示的那种交互,基本上只在钢铁侠托尼·史塔克的办公室里见过,离真正走进我们日常的生活还有些远。

  #神灯搜索#百度神灯搜索涉及哪些技术? 科技 热图5

  眼下最实际的问题可能是电池

  说完了上面那几个高科技、高大上的技术,最后我们还是得提一句电池技术,全息投影要想达到一定的亮度和体积,需要的投射功率会很大,这就对电池有很高的要求,基于现阶段手机上常用的锂聚合物电池技术,要想支撑那种程度的交互,看起来并不乐观。所以,眼下最棘手的问题或许并不是那些技术到底发展到什么程度了,而是那些技术真正到了成熟可用的那一天的时候,电池技术是否也能随之跟上。

  所以,总体来看,手机百度的这个“神灯搜索”并不是遥不可及的目标,但要想达到视频里所演示的那种程度,路其实还是挺长的。

AD: 超级福利等你来下载

阿里云