解码希加加“元宇宙走秀”:用AI让数字人“降本增效”
作者|西西弗
今年的中国国际时装周,有一场走秀格外亮眼。
安踏牵手百度AI数字人希加加,以“重新想象运动”为主题,呈现了一个“时尚元宇宙”的虚拟舞台。
希加加等多位数字人,穿着安踏具有先锋设计理念的服装,出现在运动场、雪地、戈壁、太空等多个场景。国家队的装备科技,叠加一系列未来感的设计,将安踏探索、创新、先锋的理念充分呈现了出来。
这场秀好评如潮:“绝妙的设计,前沿的技术,安踏引领时尚潮流!”
明知道是数字人,但逼真的服装展示效果,还是吸引了不少观众在评论区提问:“模特身上的衣服,在哪里能买到?”
这场“元宇宙走秀”给时尚行业带来了诸多想象,也让更多人感受到了百度AI数字人+虚拟场景+品牌IP的可能性。
就在9月26日,百度智能云即将发布数字人SaaS新品,不仅可以“一键生成数字人”,还可以让直接通过AI驱动数字人。
这意味着,数字人的内容生产、直播活动、甚至是IP打造必备的换妆、换发型等操作,正式由几十万上百万的费用量级,直接降低到了一年几万元,并且可以由客户自行操作,自主生成。
此外,百度智能云还将针对电商直播、品牌营销、互动娱乐等多个领域量身打造数字人解决方案。
毫无疑问,百度正在加速各行各业向数字化转型的步伐,并在数字人、元宇宙等创新领域,带来更多变革。
早在2021年,马斯克带火的一双虚拟球鞋就以15000美金的价格出售;更早之前,名为“彩虹”(Iridesscence)的数字时装,曾在美国纽约以9500美元的高价成交。
在国内的服装巨头中,安踏是在数字化领域探索最深的企业之一。但将时装周的走秀交给数字人,安踏之前也从未尝试过。
也许你会好奇,市面上这么多数字人IP,安踏为什么选择与希加加合作?
首先,安踏希望合作的数字人科技感与时尚感兼具,希加加是百度集团推出的AI数字人,可以进行AI思维创作,实现AI剪辑、AI作画、AI作曲等,还曾以主持人等不同身份出席音乐节、艺术展。
更重要的,百度智能云首次提供了布料实时解算等相关技术能力的输出。
在虚拟走秀的视频中,希加加的衣服和闪光鞋子在不同的光线条件,都能保持布料的清晰度,不管她做任何动作,身上的服装的褶皱都相当自然,没有任何僵硬感。
这一技术有两个核心点,一是模拟面料在物理环境中,根据受到物理惯性、摩擦力、风吹物理层面的表现力;二是计算服装和数字人身体碰撞的效果,由计算机自动生成服装动画,大幅降低生产成本。
百度数字人与机器人业务负责人李士岩表示:“通过AI的加持,数字人服装的生产周期由原来的一个半月缩短到了一个星期,每秒生产成本从万元级降到千元级。”
目前,百度联合生态伙伴凌迪,已经可以在上万款布料中结合数字人做出逼真的动画渲染效果。李士岩表示:“如果满分是10分,我们的逼真程度可以到9分或者9.5分。”
当数字人与服装行业深度融合,未来或许从服装生产,到服装售卖,可以实现全流程的数字化。
“一个数字化的服装,可以直接穿到超写实数字主播的身上进行售卖,节约打样的成本,库存的成本。”李士岩说:“更重要的是,由于服装被数字化,主播也被数字化,场地也被数字化,它在人货场的效果上,完全可以超越现实世界物理条件的束缚。我们可以去火星上走秀,可以去空间站上开一场别开生面的虚拟服装带货,开辟一个新的增量市场。”
数字人制作SaaS化:百度智能云推“数字明星运营”“数字人直播”2大平台
目前,国内的数字人产业链面临多个行业瓶颈,一是数字人不高清,不智能,交互体验差;二是价格较高,流程复杂,中小公司很难掌控。
以目前超写实明星数字人为例,定制费用可能达到几十甚至上百万。
想做出数字人,必须先找做模型的公司,做完模型要找做绑定的公司,做完绑定找做动力学的公司,然后还需要找语音公司、AI视觉公司,最后找软件公司工程师做集成。
为此,百度智能云力推“数字人SaaS化”的方案。据透露,他们即将发布两款saas化方案:数字明星运营平台SaaS版、数字人直播平台2.0。
“一定要做到下载安装即用,使用者不用太多技能,会用Windows、会用Word就能够使用这个产品。”李士岩表示:“点一下鼠标,就可以生成超写实的数字人。”
所谓“超写实数字人”,与低写实数字人的本质区别在于,整个面部的驱动、自然度、面部上百块肌肉都可以驱动,无限接近真人。
通过百度智能云曦灵平台,数字人从建模周期或者建模质量上,都较传统方式有了质的飞跃。
“我们提供6大数字人的形象风格,只要选中了一个风格再点一键鼠标,就会随机生成符合你挑选这种风格的超写实数字人。”
根据官方介绍,百度智能云已经服务几十家客户,包括今年冬奥会为央视新闻做的提供实时播报AI手语主播,央视网的虚拟主播小C,以及与国家航天局合作做的火星车数字人祝融号等。
百度智能云曦灵下设多个子平台,去年7月推出数字明星运营平台、今年3月推出的AI手语平台、今年7月推出数字人直播平台,每一个平台都面向不同的客群、行业的痛点,精准聚合特定的功能模块,让数字人更好的匹配各类需求。
本次,更是全新升级了两大平台:“数字明星运营平台saas版”、“数字人直播平台2.0”。
在“数字明星运营平台saas版”,用户可以自己打造超写实的3D数字明星,通过用高端定制、极速定制、人像优选三种模式打造IP,节省成本与时间。
用户还可以使用AI能力让数字人表演同款短视频,而丰富的动作库、背景库,也能持续满足视频创作的需求,用户甚至可以制作周边衍生品,将数字资产上链、铸造NFT。
在“数字人直播平台2.0版本”,用户可实现超写实数字人24小时纯AI直播,随意切换妆发、服装、场景。
9月26日,百度智能云还将在杭州的发布会上正式推出面向服装行业的解决方案,并提供免费试用的机会。
据悉,这套产品的收费模式有按年、按季度、按月付费等多种方式,也会根据合作模式和销量,提供有梯度的价格,一年的使用成本仅为几万元。
“我们曾接触过一个全球做假发TOP3的商家,他们非常需要超写实数字人。”李士岩表示。
像美妆、假发等需要超高精度数字人做实时展现的商品,由于技术限制,现在大多数直播平台都不能通过数字人售卖,而这是我们极其看好的市场和赛道。
超高精度数字人诞生之后,通过数字化形式来售卖,不仅仅是帮商家节省成本,数字化形式可玩的东西更多,表现力、塑造力更强。
根据百度智能云现在客户反馈,即便是普通一场直播,商家需要直播间搭建成本、专业的运营团队,主播月薪、以及场地租用费等,加起来每年大概15万起。但按照曦灵的软件可以降低数字人30%甚至50%左右的成本。
在数字人行业有这样的观点,对一个数字人的技术评价需要从4个维度展开:1、静态的真实性;2、动态的表现力;3、多模交互能力;4、能否低成本高质量。
用智能的方式创造数字人,这是百度智能云在数字人领域一直以来的坚持,也是核心优势所在。
在百度智能云曦灵平台,从数字人IP的生成,到后续运营,都有大量AI能力的加持。这既提升了数字人的质量,又大幅降低了数字人的开发和运营成本。
首先,静态的真实性已毋庸讳言,百度智能云的曦灵平台可以直接提供6大数字人的形象风格,脸型、发型、服装、妆容等都可以由客户自主调节。
其次,动态的表现力上,曦灵内置的“顶配级”超高清数字人,采用Smile Talk 表情可控算法、4D扫描机器学习方案、Smart Rig绑定控制系统,使得数字人口型合成准确率达到98.5%,并且可以通过模拟真人说话时肌肉动态还原口型变化,以及超自然的动作、表情、口型为直播增添“真情实感”。
传统的数字人驱动技术,是通过惯性捕捉和光学捕捉。其中,惯性捕捉的设备成本在万元左右,光学捕捉的硬件成本在几十万左右。今年7月底,百度发布的方案中,只需要利用一个摄像头,就能做到数字人动作+面部捕捉一体化。
李士岩称,即将推出的2.0版本,水平已经接近了几万块惯性动作捕捉设备的效果。
通过智能动作数据精修技术,百度智能云能够完全做到由动作数据直输4K、60帧的超写实视频内容,只需要一次性的资产投入,可以接近服务器成本生产超写实的视频内容,原来以每秒万元来计的动画,现在以极低成本,在内容生产的效率上遥遥领先。
第三,在多模交互方面,百度更是拥有行业领先地位。
多模交互的核心底层技术,其实是自然语言处理。这一领域是百度的传统强项,已经连续几年都获得了国际国内NLP比赛评分的冠军。无论是百度的对话平台,或者是基于百亿级训练数据开发的大模型,都是行业内领先地位。相应的技术已被集成到百度相应的平台和产品当中。
在直播中,百度数字人配置了业界领先的深度学习技术合成的TTS语言(支持情感语音),不仅可以精确模仿真人主播的语言强调,拥有超自然呈现的面部表情和肢体动作,能完成媲美真人的口语播报和情绪识别等功能。
而在前三个技术都能做到领先的基础上,孵化IP的成本势必大幅度降低。
与此同时,百度还与多家公司携手,共同搭建一个数字人服务的系统性生态。
在与合作伙伴的分工方面,百度智能云将聚焦如何自动化生产超写实数字人和超写实数字人的渲染技术攻坚,而诸如服装、直播带货场景等周边资产的建模技术,百度将通过生态内公司进行技术攻关,最后再和百度核心数字人技术做好联调和优化,从而产出高质量的视频内容。
在可见的未来,不仅仅时尚领域,数字人+虚拟场景+品牌IP的输出也会越来越多。