虚拟数字人产业链,从基础软硬件到AI平台!

Xsens动作捕捉 2023-05-11 3454

电子发烧友网报道(文/李弯弯)从产业链来看,虚拟数字人从上到下可以分为基础层、平台层和应用层。基础层为虚拟数字人提供基础软硬件支撑,硬件包括显示设备、光学器件、传感器、芯片等,基础软件包括建模软件、渲染引擎。

虚拟数字人产业链,从基础软硬件到AI平台!  第1张


显示设备是数字人的载体,包括手机、电视、投影、LED显示等2D显示设备,及裸眼立体、AR、VR等3D显示设备。光学器件用于视觉传感器、用户显示器的制作;传感器用于数字人原始数据及用户数据的采集。芯片用于传感器数据预处理和数字人模型渲染、AI计算。


建模软件能够对虚拟数字人的人体、衣物进行三维建模。渲染引擎能够对灯光、毛发、衣物等进行渲染,主流引擎包括Unity 公司的Unity 3D、Epic Games公司的Unreal Engine等。


平台层包括软硬件系统、生产技术服务平台、AI 能力平台,为虚拟数字人的制作及开发提供技术能力。建模系统和动作捕捉系统通过产业链上游的传感器、光学器件等硬件获取真人/实物的各类信息,利用软件算法实现对人物的建模、动作的重现。


渲染平台用于模型的云端渲染。解决方案平台基于自身技术能力为广大客户提供数字人解决方案。AI能力平台提供计算机视觉、智能语音、自然语言处理技术能力。


虚拟数字人基础层和平台层都有哪些公司呢?虚拟数字人依赖显示设备存在,很多虚拟人都要通过手机、电脑或者智慧大屏等设备才能显示。


未来虚拟人必然与3D数字内容相结合,这对显示设备也有新的要求,比如VR设备,VR技术利用计算器模拟产生一个三维空间的虚拟世界,用户通过佩戴3D设备与虚拟环境交互作用,可获得视觉、听觉、触觉等感官模拟,让用户如身临其境。


新型3D显示设备,现在虚拟数字人现有的硬件设备尚未发展成熟,可以裸眼观看的、多视点的新型3D显示设备可能会是未来虚拟数字人产业发展的主要方向。


据外媒此前报道,国外Looking Glass这款产品,利用了视差原理,类似于我们小时候在格尺上经常看到的光栅动画,换个角度就会看到不同的图像。开发者编写了一种算法,将2D图像实时转换成50个不同水平观测角度的图像,再通过一块特制的多层合成厚玻璃进行分光、过滤,相当于每一层显示不同的角度,最终呈现可以裸眼观察的三维图像,视点可达到50°,这种技术目前被称为“光场全息”。

虚拟数字人产业链,从基础软硬件到AI平台!  第2张


在国内,也有一家专业从事光场全息显示技术的企业——臻像科技,自研了一款光场全息高清显示设备。通过新型的光学结构可以实现100°超广角、8K超清显示,用户在多视角下观看物体的不同立体面,还原物体在现实世界的真实遮挡关系。


其中臻像65寸光场全息显示屏是目前世界范围内,能兼具超大视角和超多视点两大特点的领先产品,对比上述提到的Looking glass视角更大。同时,臻像的产品在广告传媒、教学展示、智慧医疗、智慧城市等多个行业领域已经落地应用。


凌云光是一家聚焦机器视觉业务,可配置视觉系统、智能视觉装备与核心视觉器件的供应商,在光学成像、视觉软件与算法、核心视觉部件等领域有20余年的技术积累。


在虚拟数字人领域,凌云光将视觉技术与影视工业化经验相结合,针对数字人制作流程,建模、动画、渲染合成等关键环节,利用3D光场建模、运动捕捉、虚拟拍摄方案来解决大约30%的人工处理量。


中科深智,一家AI+XR影像内容生产技术研发商,聚焦全栈式实时动画和虚拟直播技术,为客户实现虚实影像合成、虚拟数字人机交互服务。致力于打造扩展现实(XR)世界的驱动引擎,推进真实世界和虚拟世界的互动融合,并为客户提供包括算法、硬件、软件、数字资产在内的全栈式解决方案。自主研发了实时动画技术和智能拍摄技术。


商汤科技,一家人工智能软件平台提供商,涵盖感知智能、决策智能、智能内容生成和智能内容增强等关键技术领域,同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。商汤打造的新型人工智能基础设施——SenseCore商汤AI大装置,打通算力、算法和平台。


在数字人领域,商汤科技围绕拟人化和自动化两大维度,持续进行与数字人相关的AI技术和算法的研发与投入,其中商汤科技视觉相关的算法模型累计超过30000个;在语音语义理解方面,商汤科技自研并具备了包括语音识别、语义理解、语音合成等多项技术能力。


目前,商汤以原创的多模态交互、深度学习和全栈式AIGC(AI Generated Content)技术,构建了智能化生成、智能化驱动、智能化交互三大引擎,打造了一站式AI数字人生产流水线。

The End