Rabbit R1: 几乎无法评测 [译]

介绍

这就是 Rabbit R1,它是一个装在盒子里的 AI,可以说是时代的象征。这个设备和 Humane AI Pin 有许多相似之处,不论是好是坏。不过,它也有两个所谓的独特之处,这些特点使它与 Humane AI Pin 区别开来。不管怎样,我们需要讨论一下这个问题。如果你觉得听起来熟悉,随时打断我,看看这个。

盒子里的 AI

这是一个装在盒子里的虚拟助手。但这是一个不同的盒子。这个不是可以佩戴的设备。你需要像手机一样随身携带它。我说它的大小大约和一叠便签差不多,可能吗?不过这是由 Teenage Engineering 设计的轻质塑料立方体。现在,人们对 Teenage Engineering 的热情很高。它很醒目,你从一英里外就能清楚地看出它是什么。这个设备非常易于辨认。

设备的右侧有一个按钮。你按住它并向它提问。然后,与它的投影仪不同,这里实际上有一个内置的屏幕。与内置的蜂窝网络不同,它有一个 SIM 卡托盘,就在那个 USB Type-C 充电口旁边。我觉得它似乎确实把所有的请求都发送到云端,但我必须说,它回答问题比 Humane AI Pin 要快得多。这门槛是很低,但它相对稳定,它的回答速度始终更快。

月球离地球有多远?地球与月球之间的平均距离约为 384,400 公里。你可以通过蓝牙连接耳机,或者像我一样将内置扬声器的音量调至最大。但它也会在屏幕上显示你的答案,就在这个跳跃的兔子下方,以及电池电量显示的下方。事实上,它总是显示这个跳跃的兔子。这就是你知道它正在运行的方式。你只需轻按一下按钮,就能让它进入休眠状态,如果你不操作,它也会在几秒钟后自动进入休眠状态,再次轻按按钮,就能唤醒它。然后你就会看到那只兔子在那里等待你的操作。

要进入设置,你不需要按任何按钮,也不需要在屏幕上做任何手势。你只需要像操作魔术画板一样摇晃它。只要你这样做,然后就可以使用滚轮进行上下滚动,使用按钮进行选择。这就是你如何在用户界面中进行操作。它还有两样功能是滚动轮和可旋转的摄像头。

滚轮是用于在用户界面中进行导航的,而不是通过触摸屏幕...我马上就会解释为什么这是奇怪的,但是 AI 助手是多模式的,你可以使用视觉功能来回答有关它所看到的内容的问题。我们以前见过这种情况。使用这个设备,你需要双击开启,然后长按并询问,例如"这是什么类型的植物?"作为一名正在测试这个设备的评测人,我有时候会像 DJ Khaled 的那段视频一样,不停地指着东西问,"这是什么?""那是什么?"我甚至试过把它对准电脑屏幕上一封很长的电子邮件,然后让它给我做个摘要,它能立刻读出内容并给我一个摘要。它对文章也能做同样的事情。这一点我觉得非常酷。但是,说到底,这就是一个盒子里的人工智能,最拿手的就是回答问题。

同样很糟糕

然而,这个设备在很多方面也做得不好,而且这个清单听起来可能会让你感到眼熟。比如,电池寿命就和 Humane AI Pin 一样糟糕。它内置了一个一千毫安时的电池,电池性能非常差。你可能觉得带着另一个设备和手机一起出去已经够麻烦了,但是当这个设备就静静地放在你面前,你就能明显看到电池电量在消耗,而且大约四个小时就耗尽了。这就意味着你一天要给它充电好几次,而且早上醒来的时候它还是没电。

它真的让人感到很累。这个微小的电池从 0% 充满到 100% 需要 45 分钟,而且实际上还缺少我认为应该具备的很多基本功能,例如无法设置闹钟、无法设定计时器、无法录制视频、无法拍照、无法发送邮件,它甚至没有内置的日历功能。总之,我想让它完成的很多事情,它都做不到。

作为一个 AI 助手,它有时候会"产生幻觉",即错误地回答某些问题,而且还表现得非常自信。我常常测试它一些我已经知道答案的问题,然后它给出的答案却是错误的,这种情况经常发生。这也是这类设备的一个缺点。

这个设备是由 Teenage Engineering 设计的,他们非常注重这一点。这就是为什么它是这么鲜艳的橙色。我觉得这是一个故意设计得很古怪又很友好的设备。他们真的很钟爱他们的模拟控制设计,尤其是这个滚轮。这个滚轮稍微突出在后部,看起来挺酷。但是,如果滚轮太敏感,放在桌子上稍微一碰就会滚动。所以他们降低了滚轮的敏感度,导致现在滚动起来非常慢。比如,在设置中你需要滚动很多次才能到下一行,这让人觉得很惊讶。然后这里没有任何触摸反馈来帮助你感觉滚动的情况。

没关系,你可以适应这个。你通过按钮进行选择。但你也会发现,这个设备上没有任何返回键。所以,要返回上级,你每次都必须滚回到最上面。这也很烦人。

然后,调整亮度或音量,你实际上需要两只手。你只需要进入亮度设置,然后用一只手按住按钮,再用另一只手滚动滚轮来调整亮度。是的,你不能只用一只手来做这个。但这个方法是管用的。你可以学习它,你可以说,这是一个有点古怪的用户界面。但我觉得如果这是一个触摸屏,很多问题都可以解决。如果我告诉你这是一个触摸屏,他们基本不会让你用它做任何事情,比如通过菜单应该会更容易,如果我可以直接点选我想要的话。没错,返回到长长的滚动后会更容易,如果我可以直接翻滚回到列表顶部,然后按返回键。但你不能做这个。你只能在终端模式下使用触摸屏进行打字。

因此,在启用了终端模式后,可以将其横置使用。键盘会弹出,你可以通过键入问题获取文字答案,这是个很好的设计。我个人觉得这是一个有趣的特色功能。但是,为什么我们不能用触摸屏做任何其他事情呢?是因为他们不想让它看起来太像智能手机吗?可能吧。有可能。

那么,这个设备存在的意义是什么?如果它与另一款设备如此相似,那么它存在的意义又是什么?那个设备也糟糕透了。我们在这里讨论什么呢?

价格 $200

实际上,他们希望有两点能让这款设备与其他设备区别开来,至少按照他们的联合创始人 Jesse 的话来说。但我不认为我会说这是我迄今为止评论过的最糟糕的设备。这个标准并不高。

但好吧,这两点就是价格和那个大行为模型。当然,人们很容易嘲笑那款 Humane Pin 设备,因为它的价格和手机一样高。它售价为七百美元,每月还需要支付二十四美元的订阅费用,否则就会变得无用。这真的太疯狂了。

所以,这款设备的价格是两百美元,不需要订阅费用。所以,这个设备确实有所不同,但你也可以看出这确实是一款两百美元的设备啊。首先,你需要一张独立的 SIM 卡才能让它在蜂窝网络上运行。所以,虽然 Rabbit 设备运行并不需要额外的订阅费用,但你仍然需要每月付费以在 Wi-Fi 之外使用数据。

然后,拆箱体验非常简洁。它装在一个纸板盒子里,里面有一个看起来像磁带的塑料容器,也可以当作支架使用。但除此之外,什么都没有。没有充电器,没有 USB-C 线,没有贴纸,没有纸质使用说明书,什么都没有。

然后 R1 设备本身就是塑料制成的。这并不是说它的质量不好。没有弯曲或发出嘎吱声,但它确实是塑料的。相机非常基础,扬声器非常便宜。里面是一款低端的 MediaTek 芯片,同样的芯片也在售价 150 美元的 Moto G8 Power Light 中。电池容量几乎没有,也没有快速充电或无线充电的功能。

它只有一种颜色,就是这种极其鲜亮的橙色,简直饱和度爆表。我并不是在开玩笑。你在这个 YouTube 视频里看到的颜色,就算是我进行色彩校正后的效果,也无法完全展现出它在现实中的饱和度。要拍出它的真实颜色真的很难,因为手机相机无法把饱和度调得足够高,以真实地呈现它在现实生活中的颜色。这是你一生中见过的最亮眼的橙色,我向你保证。

现在,如果你想要的东西比霓虹橙色更低调一点,我们的赞助商 dbrand 可以帮你解决。我手上这个就是黑色迷彩的,现在橙色部分就像是更显眼的点缀,看起来非常酷。有趣的是,dbrand 在 R1 发布前就与 Rabbit 合作,确保这个设备的屏幕保护贴也能在发布日当天买到。这其中也包括我自己的那个。如果你想看看 R1 的屏幕保护贴或者贴纸,你可以点击下面的链接。

说到屏幕,这是一个 2.9 英寸的 TFT 屏幕,没有自动亮度调节功能。就像你所了解的那样,就像那个 Humane AI Pin 一样,这个设备也没有任何应用程序。

大行为模型(Large Action Model)

但他们希望将其与其他设备区别开来的一点是,他们打造的所谓的"大动作模型"。大语言模型实际上就是我们日常使用的语言,这些词语。所以这是一种 AI,它能理解并处理我们的自然语言,然后用词语来进行反馈,这就是我们与它交互的方式。大动作模型则是接收并处理我们的词语,然后将其转化为动作。这就是理论上的设想。

所以基本上,它会根据你的指令,像人类一样去使用应用程序。重要的是,这与 API(应用程序接口)不同。通常,公司可能会与其他公司合作,通过 API 将他们的服务集成到一起。但 API 可能因为过于限制性,不能提供全部功能,或者其他原因,而不被采用。我的意思是,有很多很好的理由让他们不想依赖 API。因此,这种做法就像人类使用应用程序一样,直接用鼠标和键盘操作。可以将其视为一种虚拟智能体。

说实话,我觉得这个想法非常好,真的非常好。大语言模型已经通过大量数据训练,可以像人类一样回答我们,有的表现得非常逼真。理论上,大动作模型应该能像人一样使用这些应用程序和服务,从 Spotify 到 Twitter,再到你的银行应用等等。它已经能够准确识别像播放按钮或购买按钮这样的主要 UI 元素。如果有足够的训练数据,它的表现可能会非常出色。有足够的训练数据,它的表现可能会非常出色。但目前,这些模型还缺乏大量的训练数据。

目前为止,他们已经推出了四个应用,你可以登录他们的在线平台"兔子洞"并启用所有应用程序。他们是 Spotify、Uber、DoorDash 和 MidJourney。这个"兔子"可以使用这四个应用程序并通过屏幕上的 UI 进行操作,正如我们所设想的那样。所以它会播放 Spotify 的歌曲,就像我能请求一首歌,它会尝试播放正确的歌曲,并且在触摸屏上显示你需要的任何信息以确认或调整你正在执行的操作。

但即使现在,勉强能用。例如,我已经遇到过它播放错误歌曲的问题。我也注意到其他人已经在使用 DoorDash 应用时遇到了一些问题,出现错误,这更让人感到挫败。我无法想象如果 Uber 应用出现错误会有多么令人沮丧。看起来大动作模型确实需要更多的训练数据。这只是这四个初始应用的情况。

现在,"兔子"声称他们已经训练了八百个不同的应用,但他们还没有为它们建立用户界面。所以这些应用还没有在"兔子"上可用。这个项目还在进行中。他们理论上也开始研究一种被称为生成 UI 的东西,即能识别出应用程序的类型并为其构建用户界面。这样,"兔子"就无需进行这些工作了。但这还是理论上的想法,也在发展路线图上,仍在进行中。

然后,如果你有其他应用或服务希望"兔子"能够执行,比如一些工作相关的任务或者你发明的一些特别小众的内容。他们提到了一个叫做"教学模式",基本上就是让这个机器人通过观察你在鼠标和键盘上的操作,来学习你希望它做的事情。然后它从你的操作中学习,以后就能够重复你的操作,这个功能很棒。可是你可能已经预见到接下来会怎么样了。现在的情况是,"教学模式"还不可用。这是他们还在研究和完善的功能。所以说,可能得等到今年晚些时候了。

所以目前这个设备并没有这些功能,只有我们一开始讨论过的那四款半成品的应用。我们在这里要做什么呢?

我们在这里要做什么呢?

我会尽量避免把这变成一场抱怨,但我觉得我们至少需要承认,很多科技公司的开发方式有些本末倒置,他们发布的产品如此不完善,以至于评测起来都有些困难。以前,公司会先做出产品,再投放市场。而现在,公司会先投放市场,再交付半成品,然后通过迭代改进。希望经过足够的更新,产品终于能够达到我们刚开始销售的时候承诺的标准。而这个中间的产品完善阶段就像是一团糟。

这在各种类型的产品中都有发生。我们在游戏中也看到了这样的情况,大型工作室会发布半成品的游戏,然后说这只是个测试版,以后还会有更新。但是与此同时,这是一款全价的 AAA 级游戏,却存在着许多无法接受的错误和问题。

车辆发布时也出现了类似情况,它们以半成品状态交付,你根本无法使用你付费购买的许多功能。这些功能最终会在软件更新中推出。你知道,智能手机,我们已经看到这种情况好多年了,但现在每次智能手机发布都至少有一个主要功能被宣布。但这个功能要到年底才会推出。如今,这些基于人工智能的产品正处于这个糟糕趋势的顶峰,你一开始得到的东西,几乎是无法使用的,与所有承诺的功能和可能实现的功能相比几乎无法使用。然而你却需要在一开始就支付全额价格,这真是令人难以置信。

这不仅令最初以全价购买的消费者感到失望,也让评测这些产品变得困难。你如何评测一个产品,它承诺的版本在三年后可能会一鸣惊人。但现在交付的版本却糟糕透了。你该如何把这些点连起来?你是否应该把这些点连起来?你应该给他们留一些怀疑的余地吗?我不知道。我们究竟在做什么?

未来展望

我的意思是,从一方面来看,科技产品的改善是好的,随着时间的推移,这些产品会逐渐改善和提升。你买的东西明天可能会更好。这听起来非常棒。过去并没有这种情况。这真的很美好。但另一方面,却有一些尚未完成的产品被交付出来。我只觉得,在变好之前,情况可能会变得更糟。

因此,我个人非常期待一个超级个性化的人工智能助手,它可以做到人类助手能做的一切。这是我的梦想,我希望它能实现。我对这些不同的公司从不同的角度研究它感到很感兴趣,希望我们最终能达到那个目标。但这显然需要花费大量的时间和精力进行技术开发,同时还需要大量的数据。就像我之前在 Humane Pin 评测中说过的:"我相信,一个好的助手需要了解你的全部,无论是人类助手还是虚拟助手。"它需要知道你的喜好、你的位置、你正在做什么、你喜欢做什么,以及每一件小事情。这就需要大量的数据。

所以对于这个"兔子"。我想这就是他们努力将价格压到极低的原因。因为这些产品的推销都非常困难,因为你在赌博这个产品在未来可能会变成什么样子。但是对于 Pin,你需要花费 700 美元,外加每月 24 美元的服务费,期望它有一天能实现预期的目标。这可是一大笔钱。而对于这个可爱的小东西,200 美元就显得是一个更容易接受的投资,是一种更容易下定决心去冒一次险的选择。而如果几年后它变得非常出色,那你就会觉得这个投资是值得的。你知道,那些 800 个应用中也许有一些是非常有用的,或者,即使你已经有一部智能手机,也许教学模式让它只需要按一下按钮就能做到你以前从未想到的事情。那么它可能会非常值得。

整个情况让我想起了特斯拉开始出售配备有全套自动驾驶功能的汽车时的情况,它们因为其他原因而受到了欢迎。那是一辆拥有良好续航能力和充电网络的优秀电动汽车。然后人们开始进行自动驾驶功能的测试版测试。特斯拉开始收集数百万英里和大量小时的数据,来了解它在真实世界中的运行情况。所有这些数据都在帮助他们的系统学习,让他们在制作最佳自动驾驶软件的过程中有了先机。

我相信"兔子"很想利用自身的价格优势,尽量让更多的产品走入现实世界,进入用户的手中,从而开始进行测试,对其进行训练,让它在各种任务中表现得更出色。但是,"兔子"的问题是它缺乏让人们立刻购买的理由。这就像是个"鸡和蛋"的问题。

如果你想听我的建议,你之前已经听过了,购买产品应以其现状为准,而非未来的承诺。而在这个领域,这是最难做到的,也是最难记住的,因为它的承诺太诱人了。但这还是我的建议。我们还未看到像谷歌、苹果这样的大公司在这个领域会有何动作,也许今年会有。

所以,让我们拭目以待吧!感谢你的观看,下次见,再见!