虚拟数字人产业链，从基础软硬件到AI平台！

Xsens动作捕捉 2023-05-11 3454

电子发烧友网报道（文/李弯弯）从产业链来看，虚拟数字人从上到下可以分为基础层、平台层和应用层。基础层为虚拟数字人提供基础软硬件支撑，硬件包括显示设备、光学器件、传感器、芯片等，基础软件包括建模软件、渲染引擎。

显示设备是数字人的载体，包括手机、电视、投影、LED显示等2D显示设备，及裸眼立体、AR、VR等3D显示设备。光学器件用于视觉传感器、用户显示器的制作；传感器用于数字人原始数据及用户数据的采集。芯片用于传感器数据预处理和数字人模型渲染、AI计算。

建模软件能够对虚拟数字人的人体、衣物进行三维建模。渲染引擎能够对灯光、毛发、衣物等进行渲染，主流引擎包括Unity 公司的Unity 3D、Epic Games公司的Unreal Engine等。

平台层包括软硬件系统、生产技术服务平台、AI 能力平台，为虚拟数字人的制作及开发提供技术能力。建模系统和动作捕捉系统通过产业链上游的传感器、光学器件等硬件获取真人/实物的各类信息，利用软件算法实现对人物的建模、动作的重现。

渲染平台用于模型的云端渲染。解决方案平台基于自身技术能力为广大客户提供数字人解决方案。AI能力平台提供计算机视觉、智能语音、自然语言处理技术能力。

虚拟数字人基础层和平台层都有哪些公司呢？虚拟数字人依赖显示设备存在，很多虚拟人都要通过手机、电脑或者智慧大屏等设备才能显示。

未来虚拟人必然与3D数字内容相结合，这对显示设备也有新的要求，比如VR设备，VR技术利用计算器模拟产生一个三维空间的虚拟世界，用户通过佩戴3D设备与虚拟环境交互作用，可获得视觉、听觉、触觉等感官模拟，让用户如身临其境。

新型3D显示设备，现在虚拟数字人现有的硬件设备尚未发展成熟，可以裸眼观看的、多视点的新型3D显示设备可能会是未来虚拟数字人产业发展的主要方向。

据外媒此前报道，国外Looking Glass这款产品，利用了视差原理，类似于我们小时候在格尺上经常看到的光栅动画，换个角度就会看到不同的图像。开发者编写了一种算法，将2D图像实时转换成50个不同水平观测角度的图像，再通过一块特制的多层合成厚玻璃进行分光、过滤，相当于每一层显示不同的角度，最终呈现可以裸眼观察的三维图像，视点可达到50°，这种技术目前被称为“光场全息”。

在国内，也有一家专业从事光场全息显示技术的企业——臻像科技，自研了一款光场全息高清显示设备。通过新型的光学结构可以实现100°超广角、8K超清显示，用户在多视角下观看物体的不同立体面，还原物体在现实世界的真实遮挡关系。

其中臻像65寸光场全息显示屏是目前世界范围内，能兼具超大视角和超多视点两大特点的领先产品，对比上述提到的Looking glass视角更大。同时，臻像的产品在广告传媒、教学展示、智慧医疗、智慧城市等多个行业领域已经落地应用。

凌云光是一家聚焦机器视觉业务，可配置视觉系统、智能视觉装备与核心视觉器件的供应商，在光学成像、视觉软件与算法、核心视觉部件等领域有20余年的技术积累。

在虚拟数字人领域，凌云光将视觉技术与影视工业化经验相结合，针对数字人制作流程，建模、动画、渲染合成等关键环节，利用3D光场建模、运动捕捉、虚拟拍摄方案来解决大约30%的人工处理量。

中科深智，一家AI+XR影像内容生产技术研发商，聚焦全栈式实时动画和虚拟直播技术，为客户实现虚实影像合成、虚拟数字人机交互服务。致力于打造扩展现实（XR）世界的驱动引擎，推进真实世界和虚拟世界的互动融合，并为客户提供包括算法、硬件、软件、数字资产在内的全栈式解决方案。自主研发了实时动画技术和智能拍摄技术。

商汤科技，一家人工智能软件平台提供商，涵盖感知智能、决策智能、智能内容生成和智能内容增强等关键技术领域，同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。商汤打造的新型人工智能基础设施——SenseCore商汤AI大装置，打通算力、算法和平台。

在数字人领域，商汤科技围绕拟人化和自动化两大维度，持续进行与数字人相关的AI技术和算法的研发与投入，其中商汤科技视觉相关的算法模型累计超过30000个；在语音语义理解方面，商汤科技自研并具备了包括语音识别、语义理解、语音合成等多项技术能力。

目前，商汤以原创的多模态交互、深度学习和全栈式AIGC(AI Generated Content)技术，构建了智能化生成、智能化驱动、智能化交互三大引擎，打造了一站式AI数字人生产流水线。

The End

标签：博主很懒，并没有设置标签

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

行业新闻

相关文章