详解电影《阿丽塔》里的CG特效 普通大众怎么玩?
来源:科技日报
狂战士的身体、精致的五官、灵动的眼神,还有与真人无异的动作和表情,在这个万物开始萌芽的季节里,著名导演詹姆斯·卡梅隆用计算机动画(CG)打造的电影《阿丽塔:战斗天使》(以下简称《阿丽塔》)中的女主阿丽塔也开始燃爆电影界,在无数热爱暴力美学的人们心里扎根发芽。
为打造出心中完美的“战斗天使”,卡梅隆这次启用了全球顶尖特效公司维塔工作室,并将电影制作中的“动作捕捉”升级到“表演捕捉”。
那么,什么是“动作捕捉”及“表演捕捉”?CG特效在我们日常生活中有着哪些体现?CG技术在新时期是否会与AI有着更多技术方面的融合?
真人表演乃CG必需?
“《阿丽塔》运用了‘表演捕捉’技术,并在人物形象上将效果发挥到了电影界有史以来的巅峰。这项技术对CG人物的构建堪称颠覆性影响。”杭州相芯科技有限公司(以下简称相芯科技)市场总监秦飞表示。
他指出,在构建CG人物时,应用的传统技术为“动作捕捉”。人或动物等真实演员穿着专业的设备,在膝盖等运动的关键部位设置追踪器,通过捕捉这些点在空间中的位置,来还原真实演员的动作。另一方面,多个摄像机也会从多个角度同步捕捉动作,将这些动作渲染至相应的虚拟形象身上。除阿凡达外,其他运用该技术的著名角色还包括《猩球崛起》中的猩猩之王凯撒、《指环王》系列中的古鲁姆等。
“表演捕捉,就是在传统的‘动作捕捉’的基础上,增加了‘表情捕捉’。”秦飞进一步解释,真实演员表演时要“全副武装”,脸上也做好密密麻麻的特征点标记,再戴上特制头盔。表演时,多台摄像机多角度进行同步拍摄,将捕捉到的数据和制作好的虚拟人物骨骼、皮肤等交融在一起,形成角色的CG模型。
秦飞从专业的角度还原了《阿丽塔》主角的拍摄过程,首先让阿丽塔扮演者罗莎佩戴设备按照剧情演一遍,电脑会捕捉到表情和动作的基本数据;再让罗莎做一项“压力测试”,测试出肌肉在最大拉伸情况下的极值数据,作为阿丽塔这个CG人物表达各种情绪时动态的算法基础;最后通过人为调整,使阿丽塔不仅在动作、表情上更像人,连瞳孔的细微变化也更接近于真实。相传有一场“阿丽塔吃橘子被酸到”的戏,特效公司共做了2000多种动态效果供导演挑选。
与普通表演不同,进行“表演捕捉”时演员要穿戴密密麻麻的连线设备、承受较大的心理压力,面对着绿幕,甚至很多镜头都是无实物表演。那么,能否不借助真人表演来呈现CG人物的动作和表情呢?
“目前来说,要达到阿丽塔那样的级别,真人表演是必须的。现有技术虽然可以不需要真人驱动就让虚拟人物动起来,但电影还要虚拟人物从整体形象到表情、动作、肢体等都像人,并在不同的场景中有不同的反应,这涉及到大量的数据积累及算法优化。”秦飞强调。
普通大众也能玩CG特效?
如此诱人的特效只能在电影院里欣赏吗?
“电影是工业级的应用,非常讲究精准化,阿丽塔之所以能如此引人关注,是因为她跨过了‘恐怖谷效应’,让虚拟人物无限接近于真人,这需要技术、算法、设备的持续优化升级,并投入大量的人力、物力和时间成本。”秦飞表示,电影《阿丽塔》专属的特效制作团队就超过800人,渲染电影启用了3万台电脑,渲染总时长达到4.32亿小时,制作成本1.7亿美元,合计耗资11.5亿人民币。
“但是,既然有‘工业级’技术,自然也有‘民用级’技术。所谓‘民用级’,追求的就是让普通大众也能玩转CG特效。”秦飞告诉记者,去年底,相芯科技与浙江大学合作成立了“智能图形计算联合实验室”,就是旨在进一步打破传统图形软件只有专业用户才能使用的技术壁垒,让更多普通人也能体验好莱坞特效。
“聚焦于人脸的CG特效,其核心技术包括人脸检测、人脸跟踪、人脸重建、深度学习、表情动画等。用普通手机拍摄或输入一张照片,就能生成相应的虚拟形象,并可实时驱动这一虚拟形象。目前,基于这些技术,我们已经拥有了美颜美型、智能贴纸、情绪识别、背景分割、3D动画表情Animoji等一系列成熟的产品,应用于短视频、直播、社交、游戏、智能家居、广告营销、新零售、医疗、在线教育等各个领域。”秦飞说。
“3D动画表情其实就是《阿丽塔》表情捕捉的简化版,通过检测人的眼睛、鼻子、嘴巴等特征,用麦兜、佩奇等将用户的表情展现出来。”秦飞表示,智能美颜也是CG特效的一种,技术原理也是通过捕捉用户脸上的特征点在线条、颜色上进行修改。
人脸AI建模怎样“炼成”?
随着技术的日益成熟,CG的应用将会越来越广。在AI热潮不断攀升的今天,CG是否也会上升到另一个高度?
“电影层面,《阿丽塔》的出现可能会引发更多电影人、特效公司投入到这个领域,而要不断升级特效,与AI融合是必不可少的。”在秦飞看来,AI是机器对人类的学习和理解,CG则将AI学习和理解的东西再还原出来,两者相辅相成、相互成就。
“在民用层面,AI与CG的结合也必不可少,至于是否会快速发展,能否在更多领域得到广泛应用,还要看市场的需求有多大以及是否有更多的人才、资本等涌入其中,不断优化技术的应用。”秦飞说。
早在2000年初,相芯科技的创始团队就开始从事这方面的研究,并发表了多项与脸部建模相关的技术,目前已经服务了400多家国内外客户。
脸部AI建模究竟是怎样炼成的?“为了让民众在日常生活中有着更便捷的体验,我们的脸部建模技术只依赖于最简单的输入:单张照片,通过目前主流的深度学习技术,可全自动生成人脸的完整三维模型。”秦飞表示。
可想而知,二维上升为三维的过程必然困难重重。“三维物体的重建与二维的视觉分析任务有着较大差异。”秦飞指出,三维重建相较于二维图片的特征物理分析、识别,还有空间位置的数据需求和表达,这对于深度神经网络提出了新的要求;其次,视觉分析任务侧重点在于“分析”,而三维建模的侧重点在于“展现”,两者的最终目标有较大的差异,需要针对性地设计具体算法;最后,AI算法非常依赖于数据,但三维数据的获取难度远远大于图片数据:二维照片互联网上数以亿计,但是三维雕塑的数字模型却很难找到。
如何解决这些问题?相芯科技的研究团队采用深度传感器采集了很多人的多视角图像,通过几何处理得到了这些人的三维人脸模型,并配合适当的拟合优化策略将这些数据扩充到了更大的范围和尺度;设计了一系列神经网络架构,科学表达上述复杂三维数据,有了“骨架”和积累的数据“血肉”,就可以做到全自动生成三维人脸。
“为了适配民用技术的特点,我们在‘展现’上进一步作出突破,提出‘风格化数字形象’技术,可以从单张照片生成有本人特征,同时又有某种艺术风格的三维形象。想象一下,冰雪奇缘里的公主风格加上用户本身的形象特征,是不是就可以圆了用户在真实生活中不能实现的公主梦。”秦飞说。(吕苏娟 实习记者 于紫月)