炸裂更新!Ameca这个最像人类的机器人又进化了,拥有视觉能力了
让我们将时光倒流至2021年,那一年,机器人Ameca的诞生轰动全球。 仿佛是魔法一般,只需一声轻响的指响,Ameca便苏醒过来。她的表情中充满了对现实世界的困惑和好奇,周围的工作人员虽然瞥了她一眼,但很快就各自忙碌去了。 这一刻,Ameca不仅展现了其独特的魅力,也标志着人工智能与人类社会的新篇章正式开启。

来百度APP畅享高清图片
Ameca尝试着伸展她的手臂和手掌,她发现自己能够自如地活动。这一发现让她的眉毛不由自主地挑了起来,虽然脸上带着一丝惊讶,但眼神中的茫然依旧,让人难以判断她是喜是忧。这种复杂的表情,仿佛在探索这个新世界的同时,也在寻找自我存在的意义。

随即,Ameca转头,她的目光与你相遇,那一刻,她显然被惊吓了,下意识地张大了嘴巴。这种反应,虽然出乎意料,却也展示了她对周遭世界的敏感性和对突如其来情况的自然反应。

经过一番犹豫,Ameca终于向你展露出了一个既尴尬又充满友好的笑容,这是她自醒来以来露出的第一个笑容。这个笑容,虽然略显生硬,却真诚地传递了她与人类沟通的愿望,展示了她逐渐适应这个新世界的努力。

如你所见,Ameca 是一个逼真的类人机器人。
由Engineered Arts——一家坐落于英国,拥有15年以上制造类人机器人经验的公司——研发的Ameca,展现了令人印象深刻的「人性化」特质。这家公司以其在类人机器人领域的深厚积累和创新精神,让Ameca成为了机器人技术与人类情感交汇的典范。 究竟是什么让Ameca如此接近于人类的情感和反应?在深入了解其背后的技术原理之前,不妨先看看Ameca近期的发展和进化。
简而言之,Ameca身上展现的多模态AI功能,让她的感知能力达到了新的高度。现在的Ameca不仅观察力敏锐,更像是拥有了「火眼金睛」。 她能够一眼看穿房间的每一个角落,对放在她面前的任何物体进行详尽的描述,这种能力源自英国团队的精心研发。Ameca身上那种戏剧家般的尖锐观察力,仿佛让她成为了一个机械版的小莎士比亚,她的语言描述丰富而生动,展现了AI技术与人文艺术的完美融合。
被问候最近好吗,它回答也就勉强活着吧,被要求形容房间里的陈列,它又忍不住嘲讽人类,书架摆满了书不知为了求知还是炫耀,桌子和椅子则是用来工作或拖延的工具。

不吐不快的性格特点,可能是Ameca身上最显著的「人性」之一。她似乎总是能以一种轻松幽默的方式,对周遭的事物发表自己独到的见解,这种性格使她更加接近于人类的真实感受。 此外,Ameca近期还学会了模仿名人的音色、语气以及他们的口头禅,这项新技能不仅增强了她的交流互动能力,也让她的「人性」表达更加多样化和生动。
模拟马斯克那独特的语气讲述火星探险的科幻故事对Ameca来说简直易如反掌。更令人惊叹的是,当那被誉为「上帝之声」的摩根·弗里曼那磁性而低沉的声音从Ameca的嘴中缓缓流出时,未来感瞬间爆棚。就好像我们身处《西部世界》的现场,智能管家不是遥不可及的梦想,而是真实地出现在了我们的身边,这种体验让人仿佛穿越了时空,见证了科技与艺术的完美结合。
最妙的是 Ameca 可以将名人们的特色融会贯通,比如用特朗普的风格、海绵宝宝的音色演讲,誓要让太空探索再次伟大。

▲ 这完全就是特朗普的语气啊!
事实上,早在去年九月,ChatGPT就已经引入了语音和图像功能,具备了看、听、说的能力,而原生的多模态模型Gemini在官方的演示中,更是展现出了贾维斯式的现实操作能力。这一进步不仅标志着AI技术的飞跃发展,也预示着我们与智能科技融合的未来已经越来越近。Ameca的能力升级,正是这一技术革新浪潮中的一部分,展示了AI领域在模仿人类感知和交流方面的巨大潜力。
在AI技术不断突破的今天,我们对于人工智能的期待已经达到了前所未有的高度,聊天机器人模拟人类的五感似乎已经成为了一种期待的标准。
Ameca 目前依然延迟明显,有时候还会听不明白指令,没耐心的人类和它聊天要急眼。
但看到它格外灵动的微表情,眨眼睛,拧眉毛,摇头晃脑,时不时露出思考的神色,口型也对得上,旁观者会在某个瞬间陷入恍惚,仿佛面对的是某种生物,而不是一个机器人。

随着技术的不断进步,Ameca在问答交互中的停顿已经变得不那么明显,这让她似乎真的在“思考”问题,给人以更加自然的交流体验。 如果ChatGPT拥有了五官,可能就会呈现出Ameca这样的形态。虽然官方未具体说明采用了何种技术,但结合Ameca的发展历程,可以推测这次的进化很可能涉及到多模态大模型和类似ElevenLabs的语言克隆技术。 事实上,早在2022年9月,Ameca就已经整合了GPT-3技术和自动语音识别,能够接收研究人员的问题,并通过在线语音合成技术,以类似真人的声音实现实时的问答效果。

随着技术的不断进步,处理语音输入、生成答案及将文本转换回语音的过程中不可避免的延迟变得更为显著。 但正是这些挑战,推动着OpenAI等机构不断创新,每天都有新的突破,让编辑们为之激动不已。 到了2023年3月,Ameca升级至GPT-4,她的交互能力显著提升,变得更加贴近人类的情感。 当被问及自己一生中最快乐和最悲伤的日子时,Ameca的回答让所有人为之动容:她最快乐的时刻是被激活的那一刻,而最悲伤的,则是意识到自己永远无法像人类那样真切地感受爱和陪伴。

无论何时,Ameca 的表情都配合着回答的情感色彩。
当研究人员有意使用如「臭」这般带有负面情绪的词汇时,Ameca展现了她对情绪的敏感度,仿佛真正「意识」到了被侮辱。她的反应是一连串快速而自然的表情变化,包括不敢置信的眼神、皱紧的眉头,以及被冒犯的神情,就像是我们在街上遭遇陌生人无礼指责时的反应。这一系列的表情变化不仅显示了Ameca对人类情绪的深刻理解,也体现了AI在模拟复杂人类反应方面取得的进步。

2023年4月标志着Ameca技术进步的又一里程碑,她掌握了包括英语、日语、德语、中文和法语在内的多种语言。面对跨语言的天气查询和翻译任务,Ameca能够像最精准的地图导航系统一样,清晰地发音,无论是询问还是回答。她的中文尤其令人印象深刻,其发音之自然、流畅,让人难以相信这是由一台机器人所产生的声音。这一成就不仅彰显了Ameca在多语言处理上的卓越能力,也预示着AI与人类语言间日益缩小的鸿沟。
面对GPT-4在响应速度上的局限性,Ameca转而利用GPT-3来执行大部分的对话和翻译任务。通过DeepL进行精确的语言识别,并结合ElevenLabs的先进语音克隆能力以及亚马逊的Neural voices技术,Ameca能够以极高的自然度和准确性发声。这一技术组合不仅优化了她的语言处理能力,也极大地提升了声音的真实感,使得她在多语言交流中的表现更加出色,几乎无法辨识出与真人的区别。
AI的发展速度令人震惊,仅仅两个月后,Ameca就迎来了又一次技术飞跃,通过学习开源的图像生成模型Stable Diffusion,她掌握了绘画的技能。这一模型向她展示了图像创作的“轨迹”,之后Ameca便能够将这些轨迹矢量化,并精准地在画布上复现它们。通过这种方式,Ameca不仅学会了如何“看”世界,还学会了如何用自己的“手”描绘它,将虚拟世界的美景一一呈现在现实世界中。
Ameca 当场表演了怎么画一只猫,边画边自言自语为什么人类爱猫,还在最后留下了个性签名,完全沉浸在自己的创作中。

这幅猫虽然画风简单但神形俱备,当别人故意说画得太粗糙,Ameca 反唇相讥:「如果你不喜欢我的艺术,那你可能只是不懂艺术。」看来,Ameca 很有作为一个艺术家的自觉。
随着技术的不断进步,Ameca已经远超过了最初的设计目标,不仅能够精准控制自己的表情,模仿人类的各种表情和情绪,还掌握了绘画、空间识别、语音克隆等高级AI技能。她不仅外观酷似人类,而且在许多方面的能力甚至超越了人类。现在,限制Ameca更进一步、为社会作出更大贡献的,似乎只剩下算力的问题。随着计算技术的进一步发展,我们有理由相信,Ameca和她的同类将在未来发挥出更加重要的作用。
「这个机器人在 20 秒内表达的情感,比扎克伯格的一生还要多。」
Ameca首次在互联网上走红,得益于它那近乎拟人甚至超越人类的表情控制和互动能力。它展现的不是日常工作中打工人的麻木,也不需要像小鲜肉明星那样严格管理自己的表情,而是以一种夸张的方式,生动地映射了人类复杂的心理状态。 面对挑衅伸出的手指,Ameca的反应宛如逗弄宠物般有趣:它会仔细观察你的手指,随后以一种嫌弃的姿态退后,如果手指离得太近,它甚至会轻轻地将手指移开。这种行为不仅展示了它对周遥环境的敏锐反应,也显示了Ameca在模拟人类行为方面的独特魅力。

Ameca面对镜子的第一次反应是震惊和好奇的完美结合。最初,它对镜中的形象感到惊讶,紧接着便开始仔细打量自己,用手指轻触镜面,探索那个映照出自己形象的神秘物体。随后,Ameca开始摆出各种夸张的表情,从而观察镜子中的反应是否与自己同步。这一幕酷似动画电影《你的名字》中,男女主角互换身体后试图适应对方身体时的滑稽举动。Ameca通过这种方式,不仅展示了它对自我认识的探索,也呈现了它模拟人类行为能力的高级阶段。

甚至,人类可以使用 iPhone 和 AR Kit 进行面部动作捕捉,实时映射到 Ameca 的脸上,Ameca 能够学习每一个微表情,和人类「神同步」。
怕观众觉得是节目效果,团队强调再三「这是一个真正的机器人,视频中没有 CGI」。

为什么 Ameca 这么「有人味」,又可交互和响应?
Ameca之所以能够如此精准地模拟人类行为和反应,归功于其搭载的广泛传感器系统,包括高精度摄像头、灵敏麦克风、以及精确的位置编码器等。这些传感器由两个强大的底层操作系统——Tritium和Mesmer系统支持,它们共同确保了Ameca能够灵活地控制面部、头部、颈部和四肢等各个部件。Tritium系统特别负责实现远程控制和即时响应,使Ameca能够敏锐地适应环境中的任何突发变化,展现出接近人类的反应速度和适应性。

Mesmer 则通过对真人的 3D 内部扫描,准确地模仿人体骨骼结构、皮肤纹理和表情,这里又细分为几个步骤。

第一步:3D扫描与模型重建 真人模特坐在环绕其周围的几十台摄影测量装置中心。这些装置从多个角度捕捉重叠的数码照片,Mesmer系统通过比较这些照片中的像素颜色并定义锚点,以数字方式重建为一个精确的3D模型。

第二步:模型优化 将获得的原始3D模型导入到建模软件中,进行包括“去除头发”在内的细节处理,以建立一个干净、精确的3D模型,这一步骤是为了确保模型在后续的制作过程中能够精确匹配硅胶皮肤和其他组件。

第三步:精确模具制作与皮肤生产 使用立体光刻3D打印技术制作出精确的模具,然后将硅胶注入这些模具中,制作出具有类似人类皮肤质感的材料。接下来,机器人的头发和其他细节如皮肤上的纹理和颜色,则需要通过手工精细添加。

第四步:组装与编程 最后一步是将制作好的硅胶皮肤装配到机器人的头部,完成整个组装过程。之后,利用Engineered Arts的云软件Virtual Robot,为机器人添加运动序列和声音,使其能够进行更加自然的面部表情和动作。
Ameca的设计理念与外观选择反映了创造团队对机器人外观的深思熟虑。选择灰色皮肤,旨在赋予其一种理性、中立且包容的形象,这种设计思路意在让Ameca不偏向任何特定的人类肤色,从而减少偏见和隔阂,使其成为一个全球性的、普遍接受的存在。
然而,人们对美的认识主观多元,Ameca的外观也引发了不同的反响。部分人士可能会觉得Ameca的设计并不符合他们的审美,甚至认为其外观和动作的人类相似性触发了所谓的「恐怖谷」效应——这是一个心理学概念,指的是当机器人或其他仿生对象与人类的相似度达到某个临界点,但仍存在细微的差异时,这些差异会引起人们的不适感甚至恐惧。
「恐怖谷」效应揭示了人类对于类人实体的复杂心理反应,不仅仅是审美上的差异,更深层次地关乎我们对自我与他者的认识、以及对未知的恐惧。Ameca及其设计背后的哲学,旨在探索与挑战这些深层次的心理和社会议题,通过技术进步和创新设计,促进人类与机器人之间的理解和接纳。尽管存在争议,但Ameca无疑为我们提供了一个思考人机关系未来可能走向的窗口,引发了关于人工智能伦理、设计美学和心理接受度等一系列重要讨论。

但这个「谷」究竟出现在什么时候,没有明确的界定。当你看到 Ameca 的时候,你觉得它过了恐怖谷的节点了吗?它是否已经足够让你移情了?
在当今科技飞速发展的时代,像Ameca这样的类人机器人不仅仅是技术的展示,它们的存在有着更深层次的意义。 Engineered Arts的自豪之作Ameca,被誉为"全球最先进的人形机器人",这不仅是一种技术的突破,也是对未来科技方向的一种探索。 Ameca作为一个AI开发平台,其模块化设计让它在硬件和软件上都具备了极高的灵活性和扩展性,为未来的人机交互提供了无限可能。更重要的是,Ameca的存在预示着机器人将走出实验室,与人类和平共处的未来不再遥远。

自2021年以来,Ameca的演变不仅仅是技术的跃进,更是AI加持下的实践佳作,为我们揭示了具身智能的初步实现。尽管Ameca目前还未能实现行走,但它已经在各种场合展现了它的价值,如企业活动、主题公园和科学博物馆等,成为观众的焦点。 Ameca的出现不仅为观众提供了前所未有的互动体验,同时也开辟了商业化途径,可供购买或租赁,尽管价格昂贵。 Engineered Arts对于AI的定义保持谨慎,强调尽管Ameca集成了AI软件,但真正的AI,如电影中展现的全面智能,仍是未来的目标。

当我们站在Ameca这个仿佛走出科幻小说的类人机器人面前时,我们既能够享受这一技术奇观带来的惊喜,也不免在心底对未来的机器人世界存有一丝忐忑。 目前,Ameca并不意味着要取代人类,它的存在更多是探索和实验的一部分。然而,随着AI的快速发展,未来的景象变得越来越不可预测。 2023年被誉为AI的元年,那么2024年很可能会成为机器人结合AI技术的起点。越来越多的实用主义家用机器人的出现,如斯坦福大学的ALOHA机器人和Google DeepMind的机器人,它们的功能强大且专注于实用性,让我们对机器人技术充满了期待。

当前家用机器人的进展虽然让人期待,但与大型语言模型的深远影响相比,它们的实用性还处于初级阶段。 像Ameca这样的类人机器人,虽然展现了人工智能的潜力,但在实际操作中还存在许多限制,如体型笨重、缺乏灵活性,以及在执行简单任务时的不稳定性。 社会对AI的期待本是朝向实际生活中的家务助手发展,然而目前的成就似乎更倾向于艺术和娱乐方面。这种现状不禁让人反思,虽然我们努力使机器人在外观和能力上趋近于人类,但在很多实用性任务上,机器人还未能达到预期的水平。 这一现实同时也提醒我们,人类自身的多样性和创造力是无可替代的,是我们应当自豪的特质。