技术大变革时代模式识别技术走向前台
7月份,CSDN TUP活动曾经举行过主题为“次世代人机交互接口及运用开发”的活动,分别展现了新兴交互技术如语音识别、脑波接口和体感技术的运用与实践,受到技术人员的欢迎。
作为人机交互领域的关键技术之一,模式识别是指通过计算机用数学技术方法来研究模式的自动处理和判读。随着云计算和移动互联的兴起,模式识别技术也取得了更大的发展契机。
这个在普通开发者看起来比较“偏学术”的技术领域,越来越多的被用于解决当前的实际问题。
9月10日下午,在中国科学院计算技术研究所一层报告厅,来自腾讯和研究院的三位研究员,分享了两大互联巨头在模式识别与云计算、新型终端结合所带来的实践心得。尽管是在中秋假期,外面还飘着小雨,仍有近 百人参加,现场互动也非常热烈。
当模式识别遇上云计算
腾讯研究院人机交互中心模式识别组研究员刘海龙的演讲主题是“模式识别云服务”,根据他的解释,所谓模式识别的云服务,就是指以云端计算的方式,为终端提供所需的识别服务,终端只负责采集输入数据和接收识别结果,而其他一些模式识别的步骤,包括特征提取和分类等都交给云端来完成。从模式识别技术发展的需要看,它也要从传统的单机应用走向络运用,并和云端的海量数据结合,才能更好的发挥作用。
模式识别的云服务不仅具有云计算的普遍优点,如按需服务、资源利用率高,冗余可靠性好、可扩展性强等等。而且针对模式识别任务来说,云服务还有更重要的一些好处 :云服务可以解决模式识别任务对大量的训练样本的需求问题。离线积累这些样本常常是困难的。而且样本标签又可以通过用户在终端所做出的交互操作来得到。这样就可以用来锤炼辨认算法,持续改善其性能。
此外,云端提供了终端不具备的计算和存储能力。特别是移动终端。很多模式识别任务中的数据存储于云端。比如图象搜索,人脸识别的运用,这就很自然的需要辨认的云服务。
而且刘海龙泄漏,之前腾讯研究院在向其业务部门提供模式识别技术支持的时候,往往是以算法库的形式,不利于久长延续的在技术上积累改进。今后将从单纯提供算法库转向提供云服务。
新一代移动平台下的模式识别应用
腾讯研究院人机交互中心模式识别组项目负责人陈波认为,移动无线互联带来的是信息沟通的革命,已俨然成为人们各种感知器官的延伸。移动终端将成为人机交互和模式识别技术的主要战场,云计算和不断增强的终端能力让复杂的模式识别运算成为可能,而基于模式、不断增加的移动运用将改良移动运用体验。
通过手写、手势和语音等多个方向,模式识别目前最成熟的应用在于改善移动终端的输入体验,陈波介绍并展现了腾讯的技术进展,例如腾讯的手写辨认技术去年就已用在了PC端、和, 平台的输入法上,目前的识别率在工整样本上能到达99%,在一般的自由书写样本上能到达95%。
即将上线的云语音服务支持中英文混合输入,在中文中夹着简单的英文都可以正确的辨认出来。识别率在经常使用的聊测试集上可以到达字识别率80%。
中秋节后,将在AppStore发布的慧眼是腾讯模式识别技术的集中体现,这款应用可以让你的变成成熟的图像扫描仪,具有文字辨认即时拍照翻译、人脸认证解锁、解读二维码、条形码和商品logo等。
陈波还着重讲解了增强现实技术,移动增强现实系统可实时跟踪在真实场景中的位置及姿态,并根据这些信息计算出虚拟物体在摄像机中的坐标,实现虚拟物体画面与真实场景画面精准匹配,在博物馆导游、地图、购物指南、工业设计、炫彩游戏、新一代的广告模式等在移动互联应用领域的广阔的发展前景。
模式识别在数字家庭文娱上的应用
视察当前几大科技巨头的动作,数字家庭娱乐已是兵家必争之地。无论是在用户接入端(IPTV机顶盒),或者节目发送和共享端(电视台/视频站),还是在用户移动端(),都不断出现出新的技术和运用。
盛大创新院多媒体主题院研究员路香菊博士在会上分享了模式识别相关技术在数字家庭文娱中的应用,包括KINECT技术在游戏运用中的手势识别及人脸识别技术,社交电视中用到的人脸/台标辨认、语音识别、视频广告辨认等。
路香菊表示,数字家庭领域中互动电视是最近兴起的新概念,以Google TV和雅虎TV为代表,其中雅虎TV通过和、大厂商合作,打造了自己的应用开放平台,正向着行业统一标准迈进。模式识别在视频中最重要的运用当属视频检索了,和广告和电子商务的结合都具有极高的应用前景,值得关注的相干应用有Snappy TV、Shazam、IntoNow等。
路香菊用了较多的时间来介绍体感输入装备Kinect,Kinect是微软游戏机XBOX 60的外设,以增强XBOX 60的人机互动能力。目前已初步显现出在新一代数字家庭文娱中最好装备的潜质。微软还赋予它很好的扩展性,Kinect fub lab是微软夏天新推出的互动文娱体验,其中有多种游戏可供选择,比如 kinect me 是把自己变成虚拟化人物,也就是avatar kinect中的自己。Build a buddy 是把现实中一个毛绒玩具虚拟化为 D玩偶,它可以受你控制,完成动作。
3场演讲之余,活动留出了论坛环节和充足的互动时间,从现场交流了解到,开发者最为关注这些模式识别的技术可否开放给业界调用,正如腾讯腾讯研究院人机交互中心模式识别组项目负责人陈波在演讲中提到的,成熟并平台化的基础技术支持将给运用层提供了无穷的创新和发展空间,模式识别技术也是如此。
甲型流感好医治么
甲型流感好治疗吗
咽喉疼流鼻血怎么办
小孩健脾怎么调理小孩口臭
薏芽健脾凝胶怎么样