虚拟人“破圈”的无限潜能

Xsens动作捕捉 2023-05-11 2702

虚拟人“破圈”的无限潜能  第1张



【编者按】虚拟人商业化的道路正在获得越来越多的力量扶持:


8月5日,北京市公布支持数字人产业发展的专项计划,3年内实现500亿产值;


8月12日,深圳龙华区元宇宙虚拟数字人项目招标公告发布,项目预算金额为629万元;


快手于近期推出了“V-Star虚拟人计划”,拟投入百亿级流量助力虚拟人IP快速成长……


《互联网法律评论》今日获《金杜研究院》公众号授权,转发一篇分析文章,分享金杜律师事务所陈青东律师团队对于虚拟人相关产业现状及发展前景的理解和展望。本文介绍了虚拟人的概念、主要类型及应用场景、产业链结构及各环节企业类型,并重点对涉及法律层面的问题进行了深度分析。



进击的虚拟人


1.什么是虚拟人


关于虚拟人,目前尚无权威的统一定义。部分行业研究报告中从有无虚构身份的角度将虚拟人、数字人、虚拟数字人分别进行描述,中国传媒大学媒体融合与传播国家重点实验室编撰的《中国虚拟数字人影响力指数报告(2021年度)》从技术层面将虚拟数字人解释为是通过计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技创设,并具有“人”的外观、行为甚至思想(价值观)的可交互的虚拟形象。


简单来说,其特征主要可以拆分为以下三点:虚拟、数字和人[1]。


  • “虚拟”,即不存在于物理世界之中,而是通过电子屏、VR设备、全息投影等方式显现在我们的日常生活中。
  • “数字”,主要是指其实现依赖于多种计算机技术的共同支撑,例如图形渲染、动作捕捉、语音合成、深度学习等。
  • “人”,主要是指其在外貌、行为、感知能力、交互能力等方面具有近人特征。一个虚拟数字人能否给用户带来逼真感、沉浸感,在很大程度上取决于其特征是否高度拟人。例如,该虚拟数字人的细节部分建模是否精美、对话时的语音语调及嘴部动作是否存在违和感、能否充分理解接收信息的含义、是否有自身的一套行为逻辑等。


2.虚拟人的主要类型及应用场景


从功能来说,相较其他类型的AI产品,虚拟人更突出其感知互动能力和形象能力,据此,虚拟人可以进行如下分类:


1)交互型vs非交互型


顾名思义,非交互型的虚拟人不能接收外界指令作出实时反应,交互型虚拟人则具备一定感知互动能力。能否实现该功能主要取决于其系统框架中有无交互模块。根据其驱动方式的不同,交互型又可以进一步分为真人驱动型和智能驱动型。


在中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员会编撰的《2020年虚拟数字人发展白皮书》中,真人驱动型虚拟数字人被定义为运用表演捕捉(Performance Capture)系统,通过真人(即通常所说的“中之人”)的表演实时驱动的虚拟数字人。表演捕捉主要包括动作捕捉(Motion Capture)及面部捕捉(Facial Capture)两方面。过去动作捕捉系统主要通过目标关键位置反光点(Marker点)或惯性传感器(IMU)来计算表演者的位置变化,近几年开始流行基于计算机视觉的动作捕捉,对于所使用设备的门槛有所降低,例如附有高性能摄像头的智能手机结合一定程度的识别算法即可实现动作捕捉及驱动。面部捕捉系统则主要是通过绘制面部标记点,或是利用计算机图像处理技术生成虚拟标记点,从而标记表演者表情的关键帧、生成表情库,并绑定到虚拟人模型的面部,以实现实时控制虚拟人面部表情。


智能驱动型是指运用经AI技术训练得到的TTSA(Text To Speech & Animation)等人物模型实现驱动的虚拟人。在TTSA人物模型中,用户对虚拟人输入的信息能够通过智能系统识别并解析,以此决定后续由虚拟人输出的文本;再将该文本转化为语音,结合训练好的唇形等驱动模型,最后实时渲染并逐帧生成对应的动画。这样一来,虚拟人就能够配合语音和文本,产生相应的细微表情变化,其成熟形态,应该是无需人工干预、可通过AI技术“一站式”完成形象创建、驱动和内容生成,且具备灵敏且稳定的感知、表达甚至学习技能等自动交互能力,即业界所称的超级自然虚拟人。


真人驱动型的虚拟人近年被广泛地用于文化娱乐行业,如由某日本公司于2016年推出的虚拟主播绊爱,或是我国某知名传媒公司打造的虚拟偶像女团。而智能驱动型虚拟人目前则较多运用于服务型产品,如智能客服、虚拟导师、虚拟带货主播等用于代替真人服务的助手类虚拟人。


虚拟人的拟人化程度应为其核心特征及竞争力所在,而主要决定其拟人化程度的要素包括影响虚拟人外观的CG建模和图像迁移技术,影响对话能力等交互体验的自然语言处理(NLP)技术,以及影响驱动效果的深度学习算法[2]。从长远发展的角度来说,采用“中之人”的真人驱动型虚拟人只是受限于现有技术壁垒的过渡期产物。可以预想,具备相当的感知能力及能够实现自我认知和进化的智能驱动型虚拟人将逐步取代真人驱动型虚拟人,结合多设备融合及信息互联的趋势,其应用场景也将深入不同领域。


2)真人型vs非真人型


从是否基于真人身份来看,虚拟人还可分为真人型虚拟人和非真人型虚拟人。前者是以现实世界中存在的真人为原型制造的虚拟人。例如,以主持人撒贝宁为原型的AI虚拟主持人“小小撒”、 以《天气预报》节目主持人冯殊为原型的AI气象服务数字人“冯小殊”、谷爱凌的数智分身“Meet Gu”等都属于这一类型。此外,在《雪崩》作者描绘的元宇宙世界中,普通人也能拥有属于各自的数字化身(Avatar)作为虚拟世界中的身份。


与此相对,非真人型虚拟人不以任何一个现实中的真人为原型,而是具有其独立的人物形象和角色设定。例如,影视剧中利用动捕技术完成的虚拟角色特效、大部分的虚拟偶像,包括欧洲各国着重研发的、提供情感陪伴的医疗康复类虚拟人都属于这种类型。


虚拟人“破圈”的无限潜能  第2张



产业链中的主要玩家


参照《2020年虚拟数字人发展白皮书》及有关行业研究报告,我们基于设计、开发及投入使用虚拟人涉及的不同阶段,对该产业链中的主体整理如下:


  • 基础层企业:主要提供基础硬件(如显示设备、传感器、芯片)和基础软件(如建模软件和渲染引擎)的相关服务。
  • 平台层企业:主要提供软硬件系统(如建模系统、动捕系统)、生产技术服务平台(如渲染平台、解决方案平台)、AI能力平台(如自然语言处理、智能语音、计算机视觉)等技术服务。
  • 应用层企业:主要提供虚拟人在各个行业实际场景中的应用服务。


虚拟人“破圈”的无限潜能  第3张



虚拟人的应用与法律要点


1.概述


无论是此前热议的虚拟人主播售卖无人挖掘机系统和元宇宙地皮,还是早已渗透音乐及商业代言领域的虚拟艺人,越来越多的企业开始考虑运用虚拟人技术开展宣传活动或代替真人岗位提供实质性工作。


其中,就虚拟人的设计及开发环节,其外形可能涉及《著作权法》相关问题,针对深度学习模型,还存在人工智能及深度合成的相关规制,如《国家新一代人工智能标准体系建设指南》、《网络安全标准实践指南—人工智能伦理安全风险防范指引》、《新一代人工智能伦理规范》、《互联网信息服务深度合成管理规定(征求意见稿)》等。


鉴于虚拟人的拟人特征,其背后的个人隐私及数据合规问题也不容忽视,如“中之人”及真人型的模式可能涉及个人的人格权、姓名权、肖像权、名誉权、隐私权等。另外,运用虚拟人技术从事互联网活动的,还需确保相关行为符合《互联网信息服务管理办法》、《互联网视听节目服务管理规定》、《互联网文化管理暂行规定》、《互联网新闻信息服务管理规定》、《网络音视频信息服务管理规定》、《网络信息内容生态治理规定》等相关规定。进行营业性演出的,可能落入《文化和旅游部关于深化“放管服”改革促进演出市场繁荣发展的通知》、《营业性演出管理条例》的适用范畴。从事直播、广告等业务的,还需参照《广告法》、《网络直播营销管理办法(试行)》、《网络主播行为规范》等。


2.典型案例


以下主要介绍两个国内的相关判例,对分析虚拟人相关法律问题具有一定启示作用。


1)提供AI服务侵犯其对应自然人的人格权


  • 案件背景


2021年,北京互联网法院就某明星诉某应用软件开发运营者提供应用软件侵犯其肖像权、姓名权及一般人格权一案作出判决[3]。


本案中,原告为国内某知名主持人,被告为某记账手机应用软件的开发运营者。在该记账软件中,被告为用户提供自定义设置聊天对象的服务,用户在该应用程序内的“好友列表”一栏中创设、上传了原告头像及姓名供其他用户选择;用户在使用该软件记账时,能够收到该软件通过智能算法和AI自动回复根据聊天场景推送的、与原告有关的不同肖像表情包及回复,以及以原告名义进行的针对软件中“购物返利”的商业推广。其中,用户通过软件功能模块中的“调教”功能,输入关键词和希望角色回复的语料内容,提交审核后,相关回复内容就能够进入软件的人物智能库,并随机提供给所有选择该角色的用户。


  • 法院认定


就被告是否构成网络服务提供者利用网络侵害他人民事权益 (《侵权责任法》第36条[4],现相关内容为《民法典》第1195条[5]),法院认定如下:


  • 肖像权:《民法典》不再将营利作为肖像权侵权的构成要件,同时规定了合理使用制度[6],以平衡肖像权人与使用人的利益。用户上传的肖像图片的使用范围可能扩大至整个软件内的用户,且将他人肖像结合姓名及一定身份关系塑造成陪伴者,不属于个人对肖像进行学习、艺术欣赏、科学研究的行为,也不属于其他合理使用的情形。同时,没有证据表明用户上传及使用原告肖像创作“语料”获得原告的同意,用户亦不能确认软件运营方已经获得在案涉软件中使用原告肖像的合法授权。被告未经原告授权,将用户上传、创作的原告肖像图片在系统中推送,亦实施了侵害原告肖像权的行为。被告与用户构成共同侵害原告肖像权的行为


  • 姓名权:本案中的AI角色包含原告的姓名、肖像,一般公众均能作出该角色对应的人物为原告而非他人的判断。被告通过软件规则、算法设置等允许用户自由设定AI角色的名称,是其吸引用户、构建其商业模式的重要因素。被告在应用软件中将含有原告姓名的AI虚拟角色提供给用户使用,属于商业化使用原告姓名的行为,被告未举证证明用户或被告使用原告姓名获得原告许可,被告的行为属于侵害原告姓名权的行为。此外,若原告姓名系由用户创设,创设及调教该AI角色的用户未获授权,则其与被告构成共同侵权。


  • 人格权虚拟AI角色投射了自然人的姓名、肖像、人格特点等综合构成的整体形象,用户还能够设定与其之间的虚拟身份关系,是对原告整体形象和人格表征的利用,属于原告人格自由利益的范畴,无法被肖像权、姓名权的人格利益完整涵盖。并且,被告在软件中将创作回复语料的功能称为表明了不对等关系的“调教”一词,且在互动页面设置了亲密对话标签,涉及原告对其人格要素如何被使用的自由决定权,及其人格尊严被尊重的利益。因此,被告行为构成侵害原告一般人格权


综上,法院认定被告构成侵权行为,判令被告承担赔礼道歉、赔偿原告经济损失及精神损害抚慰金的民事责任。


  • 简评

该判例明确了真人的虚拟形象也受到自然人人身权益的相关保护,对使用虚拟形象的商业模式提供了合规指引。此外,本案被告虽在用户协议中进行了一系列免责声明,但法院最终根据该软件的功能认定被告参与内容生产而非仅提供技术服务,应对侵权内容承担责任。


对于拟利用真人型虚拟人进行商业宣传或是提供服务的个人或企业,还需就可能涉及真人授权及许可的部分进行事先筛查,对于授权范围和具体用途、使用方式等予以约定。


2)“中之人”和演员是否有对应性


  • 案件背景


北京互联网法院于2021年,就某虚拟偶像中之人诉其原单位发布公告侵犯其人格权一案作出判决[7]。


本案中,原告曾入职被告处负责为虚拟偶像配音及提供动作捕捉原型。被告在某视频网站上发布了取消该虚拟偶像直播的公告,其中含有声称该虚拟偶像中之人违反保密协议、泄露商业秘密、损害公司利益,以及声称该中之人谎报学历获取岗位等相关内容。


  • 法院认定


原告认为被告利用网络肆意发布不实言论及侮辱性言论,严重侵害其合法权益,而被告主张,该公告从未以任何方式直接或间接地透露或宣扬原告的个人信息,公众不可能凭借该公告获知原告个人隐私。对此,法院作出如下认定:


  • 原告从事本案中之人工作,声音未经加工,在其从事的配音、直播等行业内具有较高的识别度;
  • 公告中所涉及的原告学历内容、特定关系人情况、聊天记录等指向具体、细化,可以据此锁定具体主体。


因此,法院认定,被告发表公告中所指的“中之人”与原告具有对应性。被告发布的不实言论降低了原告的社会评价,属于侵犯其名誉权;部分内容还构成对原告名誉权和隐私权的侵犯。故法院判令被告承担删除公告,进行公开赔礼道歉,并赔偿原告精神损害抚慰金的民事责任。


  • 简评


真人驱动型虚拟人的模式中,法律层面的一大问题即为虚拟人与“中之人”的“人格”混同,例如在虚拟偶像能够对应到特定“中之人”的情况下,针对虚拟偶像的言论是否可能被认定为构成对“中之人”的权利侵犯。该判例是我国关于虚拟偶像“中之人”的首个判例,尽管其涉案情节较简单,但仍为未来可能产生的虚拟人相关纠纷的裁判思路指明一定方向。


此外,运用真人驱动型虚拟人打造虚拟偶像、虚拟网红的场景中,虚拟人的吸引力一定程度上依赖“中之人”的声音、动作、表达及人格魅力,就该等业务模式中的权责划分以及“中之人”违约、更换“中之人”所带来的法律及商业风险,都应在开展具体项目前予以评估并设置相应的风险应对措施。


3.国外风向


日本作为第一代现象级虚拟偶像诞生地及二次元文化热土,关于虚拟人应用场景落地的实践经验更为成熟,针对“中之人”的法律运用也具备一定借鉴意义。


1)“中之人”个人信息的公开


日本东京地方法院曾在2020年[8]和2021年[9]先后认定,仅是在网上公开VTuber的中之人的长相、真实姓名和年龄等个人信息,也属于侵犯个人隐私。


在2020年的判例中,法院认为,“真实姓名和年龄是识别个人身份的基本信息。而对于那些故意不在网上公开真实姓名和年龄而使用艺名等工作的人来说,可以认为这些信息是他们不希望向公众公开的私人信息”。另外,在2021年的判例中,法院认为,“有些人在从事娱乐活动时,通过使用头套、面具或蒙面来使自己的真实长相不暴露。对于从事类似活动的VTuber而言,也可能采取不暴露其真实长相或个人信息以保护其VTuber角色形象的策略,因此,足以认为本案照片是原告不希望向普通公众公开的内容”。


2)“中之人”与虚拟角色的关联


日本东京地方法院曾在2021年[10]认定,在论坛上发布关于某VTuber家庭情况的不恰当言论侵犯了该VTuber的中之人的名誉感情。虽然网络服务提供商主张该言论是针对VTuber角色而非针对中之人的,但鉴于以下事实,法院依旧认为该言论是针对中之人进行的。


  • 演艺机构中作为该VTuber角色表演的只有该中之人一人。
  • 演艺机构会事先和艺人协商,制作出最能体现其个性的角色。
  • 该VTuber的声音是该中之人的声音。
  • 该VTuber的动作是对该中之人的动作进行动作捕捉后形成的。
  • 关于该VTuber的视频和SNS上的发布内容,是基于该中之人现实生活中遇到的事创作出的。
  • 该中之人是单亲家庭,但关于该VTuber并不存在这样的角色设定。


虚拟人“破圈”的无限潜能  第4张

▲ 图片来源:豆瓣电影《银翼杀手2049》



虚拟人的无限潜能


虚拟人之所以能够“破圈”成为流量密码,是因为其同时具备了近人的外表以及高度交互能力,符合大家对于近未来科技成就的幻想。但目前来看,能做到两者兼备的产品仍属凤毛麟角。一方面是口型合成、面部绑定及感知交互等技术仍需增强,与之相对,处于下游的内容创作也亟待丰富,即如何将上游前沿技术整合、转化为丰富且实用的应用场景, 是当前虚拟人行业的瓶颈之一。


另一方面,在大力开拓商业模式的同时,如何有针对性地规避“爆雷”风险也是必须重视的课题。以虚拟人主播带货领域为例,其中各个主体的法律地位及相应责任如何界定一直存在争议。与真人主播不同,如我们在第二部分中所述,呈现虚拟人主播需要多方主体参与并集合其提供的技术和内容,一场虚拟人主播带货活动中,由于虚拟主播本身不具备法律上的人格,因此很多情况下法律责任无法由虚拟主播承担,例如原本应当由广告代言人承担的责任即无法由虚拟人承担,该等情形下,对于虚拟人背后的运营主体而言,很可能需要作为广告发布者等承担相应的责任。但是,究竟产业链中的哪些企业应当承担《广告法》下的相关责任、技术服务公司和运营公司是否应当区别对待以及各自的权利边界等都值得深入探讨。


在虚拟人提供医疗陪伴服务的场景中,个人信息保护很有可能成为焦点话题。当被陪伴者通过虚拟人采集、查询健康数据或在日常对话中披露个人信息时,是否应由终端医疗机构、虚拟人运营方作为《个人信息保护法》第73条[11]规定的个人信息处理者承担相应责任,以及各方之间的法律关系及责任分担如何认定等,都需要在具体的商业模式中进行探讨。


再如,将虚拟人作为员工投放到金融、科技、教育、健身等行业也是一大热潮。去年某房地产开发企业和某通信科技企业接连安排虚拟人员工“入职”,前者的虚拟人员工还因催办单据核销率高而获得内部奖项。若将虚拟人作为理财顾问、保险咨询师、私人教师或教练等角色面向用户,除了可能涉及从业资质及数据安全问题,企业还需留意其提供的服务可能属于《互联网信息服务算法推荐管理规定》第2条[12]规定的利用个性化推送类、排序精选类、检索过滤类等算法技术向用户提供信息的应用算法推荐技术,该等服务提供者应承担建立相应管理制度和技术措施等责任。


近期我国多地规划中都明确提及支持虚拟人行业发展的内容,《上海市数字经济发展“十四五”规划》中将加快智能人机交互、虚拟数字人等核心技术攻关作为重点任务之一,北京市经济和信息化局更是专门印发《北京市促进数字人产业创新发展行动计划(2022-2025年)》,为虚拟人行业发展提供政策层面背书的同时,也体现了对于该行业潜在的金融、数据安全、个人信息、知识产权及社会伦理风险的预判和监管态度。


可以期待虚拟人将成为打破现实和虚拟世界边界的主力军,被更广泛地运用到我们的日常生活中。伴随着从事基础设施服务、掌握技术或是能够打造场景的不同主体从各自擅长的角度切入赛道,我们也将持续关注该行业中的技术标准、行业规范及法规层面的动向,以期探索与高歌猛进的技术迭代及琳琅满目的商业模式相辅相成的合规路径。


文章来源:金杜研究院


脚注

[1] 《量子位硬科技深度产业报告——虚拟数字人》。

[2] 《量子位硬科技深度产业报告——虚拟数字人》。

[3] (2020)京0491民初9526号。

[4] 《侵权责任法》第三十六条,网络用户、网络服务提供者利用网络侵害他人民事权益的,应当承担侵权责任。网络用户利用网络服务实施侵权行为的,被侵权人有权通知网络服务提供者采取删除、屏蔽、断开链接等必要措施。网络服务提供者接到通知后未及时采取必要措施的,对损害的扩大部分与该网络用户承担连带责任。网络服务提供者知道网络用户利用其网络服务侵害他人民事权益,未采取必要措施的,与该网络用户承担连带责任。

[5] 《民法典》第一千一百九十四条,网络用户、网络服务提供者利用网络侵害他人民事权益的,应当承担侵权责任。法律另有规定的,依照其规定。第一千一百九十五条,网络用户利用网络服务实施侵权行为的,权利人有权通知网络服务提供者采取删除、屏蔽、断开链接等必要措施。通知应当包括构成侵权的初步证据及权利人的真实身份信息。网络服务提供者接到通知后,应当及时将该通知转送相关网络用户,并根据构成侵权的初步证据和服务类型采取必要措施;未及时采取必要措施的,对损害的扩大部分与该网络用户承担连带责任。权利人因错误通知造成网络用户或者网络服务提供者损害的,应当承担侵权责任。法律另有规定的,依照其规定。

[6] 《民法典》第一千零二十条,合理实施下列行为的,可以不经肖像权人同意:(一)为个人学习、艺术欣赏、课堂教学或者科学研究,在必要范围内使用肖像权人已经公开的肖像;(二)为实施新闻报道,不可避免地制作、使用、公开肖像权人的肖像;(三)为依法履行职责,国家机关在必要范围内制作、使用、公开肖像权人的肖像;(四)为展示特定公共环境,不可避免地制作、使用、公开肖像权人的肖像;(五)为维护公共利益或者肖像权人合法权益,制作、使用、公开肖像权人的肖像的其他行为。

[7] (2020)京0491民初17175号。

[8] 東京地判令和2年12月22日(令和1年(ワ)第18748号)。

[9] 東京地判令和3年6月8日(令和3年(ワ)第3937号)。

[10] 東京地判令和3年4月26日(令和2年(ワ)第33497号)。

[11] 《个人信息保护法》第七十三条,本法下列用语的含义:(一)个人信息处理者,是指在个人信息处理活动中自主决定处理目的、处理方式的组织、个人。(二)自动化决策,是指通过计算机程序自动分析、评估个人的行为习惯、兴趣爱好或者经济、健康、信用状况等,并进行决策的活动。(三)去标识化,是指个人信息经过处理,使其在不借助额外信息的情况下无法识别特定自然人的过程。(四)匿名化,是指个人信息经过处理无法识别特定自然人且不能复原的过程。

[12] 《互联网信息服务算法推荐管理规定》第二条,在中华人民共和国境内应用算法推荐技术提供互联网信息服务(以下简称算法推荐服务),适用本规定。法律、行政法规另有规定的,依照其规定。前款所称应用算法推荐技术,是指利用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息。


相关阅读:

元宇宙合规探讨:数字人的身份映射挑战

北京支持数字人产业3年至500亿产值,企业快进中合规关键点分析

直播虚拟人快速扩张,法律专家分析其中被忽视的合规问题

元宇宙虚拟人面临八大法律问题




作者:

陈青东 金杜律师事务所合伙人

张逸瑞 金杜律师事务所合伙人

郑博文 金杜律师事务所主办律师

高心悦 金杜律师事务所律师助理


免责声明】此文仅代表作者个人观点,与本平台无关。本平台对文中陈述、观点判断保持中立,不对所包含内容的准确性、完整性或可靠性提供任何明示或暗示的保证。

The End