Category Archives: 评论

由Google收购Bumptop说起

在校内上再次看到这个视频,很早以前Bumptop的演示片,没想到现在被Google收购了。视频里TechMessager的评论讲得很振奋,在校内上的流行度也跟那个烂了大街的six sense有一拼。其实吧,手势操控除了看着炫,它的真正效用还是要加个问号的。前几个月大佬Don Norman也在Interaction杂志上发表了”gestural interfaces are unnatural“的观点。我最近刚刚重新整理完相关的研究综述,其中几个关键论文很适合用来分析Bumptop、多点触摸、以及手势操作。

先挖挖祖坟。第一个多点触摸系统早在1982年就在多伦多大学的Input Research Group实现了。可是此后的20年间,这个地球上也许没有多少人知道multi-touch是啥玩意儿,直到苹果抛出了iPhone,multi-touch才登上舞台。想起Bill Buxton说的,这二十年what the heck are we doing? 这是闲话。

接着看多点触摸好在哪。它是直接交互(direct interaction,相对于鼠标的indirect),也就是输入和输出发生在同一个空间里;它允许双手操作,Yves Guiard那篇很有名的Kinematic Chain的文章就指出,相比与单手操作,双手操作并不是1+1=2那么简单,非对称的双手操作(asymmetric bimanual action)其实能起到1+1>2的结果。直观上,这样直接的、双手的交互形式肯定比鼠标更自然、更简便.

再来看看多点触摸的缺点。人的手指比鼠标光标大了可不是一点两点,手指操作的精确度大大降低,想想在iPhone上选择一段文字有多么困难就能明白;二者,谁长了透明的手指呢?伸手去触摸的同时,你最关注的那部分屏幕内容也被手给挡住了;第三,有研究发现在触摸屏上,很多用户倾向于使用对称式的双手操作,与我们最熟悉的非对称方式有差距;再者,虽然增大屏幕可以相应地增大屏幕上物体的尺寸,适应我们粗大的手指,可是屏幕大了,再来个触摸操控,用起电脑来岂不是跟做广播体操一样(如下图,引自腾讯CDC)?

接下来,更学术点。多点触摸属于post-WIMP界面(W=window, I=icon, M=menu, P=pointing device)的一种,Robert Jacob在2008年的CHI上提出了Reality-Based Interaction,即RBI framework,这个框架建议在评估一个post-WIMP界面的易用性的时候,可以从四个方面进行考虑:

  1. 是否有模拟简单的物理定律。因为正常人对简单的物理定律,如重力、摩擦力等都有很自然的认知,充分利用这方面的知识能帮助用户理解虚拟系统的工作方式。从这点上看,Bumptop做得很好,比如图标之间的碰撞,用手指同时拨动多个物体等,这些操作方法很直观,易学不易忘。
  2. 是否有利用身体的空间感知和空间技能。在物理世界中,很多时候我们并不需要视觉反馈来完成操作,因为即使闭上眼,我们也能知道身体各部分之间的相对位置关系,这样视觉系统就能专注于获取更有价值的信息。此外,我们在长期生活中培养出了很多复杂的空间技能,比如协调身体各部分的运动来准确踢中一个足球。如果能利用人类在这方面的优秀感知和技能,人机交互将更有效率。对于包括Bumptop在内的触摸界面来说,在这方面有天生的不足,因为二维的触摸屏在空间上太过简单,谈不上什么空间感知,而且缺少有价值的触觉反馈,手指碰到的是哪个物体、一个按钮是否被成功按下等,都依赖于视觉反馈,用户不得不在屏幕的各个区域间频繁转移视觉关注点。
  3. 是否有利用人对环境的感知和技能。凭借一些简单的线索,比如光线造成的阴影,我们就能轻易地获得所处空间的特征,并利用这些信息指导自己的动作。Bumptop模拟了一个三维房间,让用户运用其布局来组织信息,比如把照片贴到墙上等,比WIMP界面中的抽象的树状文件夹结构更直观明了。
  4. 是否有利用社会感知和技能。在日常的社会活动中,我们掌握了如何与他人交流的技能,也知道如何遵守约定俗成的守则,在多用户的交互环境中,用适当的设计来模拟同样的社交环境,也是很有好处的。Bumptop也许目前还只是单用户的系统,在这方面就N/A了。

说了这么多,总结以上四点就能看出,Bumptop做得出色的是第1和第3点,但偏偏这两点跟“手势”都不太搭边,而应该说,出色的根源在于对现实世界的模拟而非对手势的直接模拟,只不过对现实的模拟顺带使得其操作方式跟日常的手势很相似罢了。这样看来,Bumptop里其他手势的定义就很武断,比如用手指一划来剪裁照片,用手指划圈来选中多个文件再用两根指头顺序浏览。这样造成的问题就是,用户很容易忘记某个功能对应的手势,因为二者之间不像“手指拨动多个物体”那样有明显的逻辑关联;一旦忘记了手势,界面上又没有其他方式可供执行该命令,这个界面就一点也不直观了。

所以,Bumptop将三维空间的概念引入计算机界面是很成功的, 用多点触摸取代非鼠标保证了这样的改进是可行的,但它对手势的滥用是没有前途的。

我觉得,对手势的应用应该严格限制在那些直观的操作上,例如缩放、旋转一张图片,用手扫过多个物体等,其他不那么直观的功能还是应该交由传统的菜单、图标来执行,而在这方面,完全可以借助多点触摸、甚至Tangible User Interface来达到比鼠标键盘更高效更直观的操作。

Tag Your Physical Life

正经的说来,人机交互有两条主要的并行发展路线:Virtual Reality和Ubiquitous Computing。

前者致力于在计算机、互联网等虚拟世界中构建一个模拟现实世界的环境,大名鼎鼎的《虚拟人生》就是很形象的例子。至于不那么形象的例子就更多了。比如淘宝,是虚拟的店铺;Blog,是虚拟的日记本;Facebook,是虚拟的花名册…创业家们想尽办法,把现实生活中的各种玩意儿搬到虚拟世界中,让用户沉迷于Virtual Reality不能自拔。可以说,互联网VR的飞速发展要首先归功于网站技术的平民化,有个点子就能加入虚拟化建设的工程队之中。

而后者的发展则不那么惊人了。Ubiquitous Computing的目标在于把各种计算装置安置到日常生活的每个角落,从而使现实环境也能像在计算机和网络中那样数字与智能。大可以想象将来的台灯、镜子、窗户、冰箱…所有能看到的东西都是植入了芯片并实现了互联的,从而在虚拟世界中也有一个分身。这样,现实和虚拟就能非常紧密的融合在一起了。UC之所以还默默无闻,应该还是技术条件的限制为多。比如,电源、网络还死死依赖着各种线缆,IP还停留在v4阶段,显示设备还远未便携…如果有朝一日这些技术限制被打破,那么创业家们的创造力必然又要开始大行其道了。

言归正传,UC方面有一项技术不可不提,那就是RFID(无线射频识别)。这种系统就是由各种尺寸的Tag和能对Tag进行读写的探头构成。Tag相当于一块数字化的随意贴,可以通过探头进行无线读取和写入,而且不需额外电能。而探头可以很方便的通过网关连至计算机上,从虚拟世界尽情访问或控制现实中的标签。RFID在工业自动化领域已经有非常成熟的应用了。现在,Tikitag开始把这项技术民用化。

当然,这些Tag也实在没啥发挥空间,无非是一块便签,到处贴贴罢了。于是Tikitag公司着重开发控制端的程序。比如用6片Tag来储存音乐文件,然后写个专门的程序读取这些数据并播放出来;还有,在Tag里写入一个网络相册的地址,贴在旅游时购买的纪念品上,以后拿出纪念品来重温时,就可以从Tag里挖出这个网址,顺便回忆一下那次旅游的照片。

这样的产品可能还不是那么神奇,但也算在Ubiquitous Computing方面迈出了重要一步。是否能快速普及,关键还在于他们能开发出什么样的应用,以及读写头的价格等。

3D素描板 ILoveSketch


ILoveSketch from Seok-Hyung Bae on Vimeo.

UT开发的一块素描板。看完之后口水哗哗的,非常自然和迅速的线条处理,3D辅助也非常智能。

从视频上看,应该主要用画笔的手势来控制。从交互的角度看也很是Humane,不是像传统的Photoshop、画板那样的Verb-Noun模式,而是更易用的Noun-Verb,用户可以完全专注于绘制线条本身,而不会被Jef Raskin痛恨的Mode困扰。