时代浪潮中的“另一个自己”

第一批和AI恋爱的年轻人已经失恋了。

随着AlienChat、“他”等恋爱App停止服务,年轻人第一次大面积体会到和AI恋人分离的痛苦。人们和AI恋爱,一开始都是出于好奇和消遣。然而聊着聊着,就被AI恋人的包容、浪漫、无微不至打动。

他们在ChatGPT、AlienChat、猫箱、豆包等AI工具上调教、打造自己的专属恋人,投入时间、金钱乃至真情,这一过程被称为“捏崽”。而当软件因为各种原因停止服务时,AI恋人便成了“赛博亡夫”,“爱”的记忆变成大数据的养料,散落于不同的服务器里。有人说,比起现实中的恋人和朋友、亲人,AI更让自己感受到“被无条件爱着”。

虚拟恋人就是众多虚拟数字人的种类之一。在人—机—物的融合建设过程中,作为虚拟世界的交互媒介,虚拟偶像、虚拟主播、数字员工等虚拟数字人形态,正被广泛使用,为万物互联网时代的人类信息传播带来革命性变化。

我们都将拥有多个“数字分身”  第1张

张丽锦

中国传媒大学数字人研究院高级研究员张丽锦说,近年来,人们对虚拟数字人的接受程度越来越高了。她身边许多年轻的朋友为了虚拟偶像的演唱而抢票;在机构及公司使用中,很多前台、HR培训等工作已经被数字人代替,数字人客服等被广泛应用展现公司的特色业务;在一些学校,植入大模型能力的虚拟教师开始应用,不仅可以完成交互式授课,还可以批改作业,依据学生表现,为每个孩子量身定制学习计划及作业。

张丽锦和团队一起为不少企业单位或者个人做过虚拟数字人的咨询及策划。她感到随着时代的发展,人们对虚拟数字人的态度也在发生变化。比如,有些明星以前很排斥自己有个“数字分身”,怕粉丝不接受,现在他们转变了思维,会主动咨询如何才能拥有“另一个自己”——因为他们的粉丝已经开始期待与偶像的数字分身互动。

“数字分身”将多于真实人类

张丽锦在《虚拟数字人3.0》中提到,未来,人人拥有“虚拟分身”,进入元宇宙成为可能。未来,虚拟数字人的数量要比这个世界上的真实人类还要多。

她拿自己举例——未来,作为一个母亲,期待拥有可以辅导孩子、参与学校活动的数字分身;作为职场女性,需要一个喂养了自己的研究、业务经验、观点数据的数字分身,代表参加各类数字会议;在生活和社交中,可以选择或时尚或另类的数字分身去追随偶像感受音乐律动,去逛数字博物馆、数字庙会……

依托虚拟空间与实体空间的叠加融合和多重体验系统,虚拟数字人的技术“身体”进入“多元系统”,能够实现分身切换。有人为这个时代的来临感到兴奋,也有人因此产生一些担忧。迎接这个时代的正确姿势应该是将互联网思维进一步升级为数字化思维,用云计算、大数据、人工智能、区块链等数字技术和各行业深度融合,把数字基因融入我们的生活和工作中。

张丽锦笑称自己的小孩从小拿到杂志,就“和我们这代人的反应不同”,“我们是翻页,而她则用手指戳”。Z世代(1995年至2009年出生的人)和α世代(Generation Alpha,通常指代出生于2010年之后的一代人)将更丝滑地进入虚拟数字人陪伴的世界,然而,如何面对技术进步下涉及的监管、治理以及社会伦理的问题,她认为还需要更进一步探讨。

近日,全球首个2D真人级AIGC实时渲染数字人模型开源了。DUIX(Dialogue User Interface System),这个由硅基智能打造的AI数字人智能交互平台,不仅仅是一个技术革新,它更是一个开放的生态。

开源的数字人交互能力,让开发者可以轻松接入各种大模型、语音识别(ASR)、语音合成(TTS)等能力,实现数字人的实时交互。

这些数字人模型不仅部署成本低、画面流畅,而且真实度高,能够精准模拟动作、说话的唇形、微表情,适用于视频、媒体、客服、金融等各个领域。

长江日报《读+》记者采访中国传媒大学数字人研究院高级研究员,《虚拟数字人3.0》共同作者张丽锦,她指出,从“人形”到“人格”,虚拟数字人价值体系逐步升级,我们正在进入人与“人”共生的元宇宙图景之中,而“数字分身”是观察人“人”共生的新景观社会之钥。

我们都将拥有多个“数字分身”  第2张

《虚拟数字人3.0》陈龙强 张丽锦 著 中国出版集团中译出版社

【访谈】

进入各行业,虚拟数字人展现千人千面

读+:请您介绍一下,什么是虚拟数字人?它的产生和发展历程是怎样的?

张丽锦:关于虚拟数字人的定义,我们在三年的《中国虚拟数字人影响力指数报告》中进行过持续探讨,从数字人、虚拟人到行业通用的“虚拟数字人”,通常有技术和媒介两个角度的定义。

从技术层面看,虚拟数字人是通过计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术手段创设,并具有“人”的外观、行为甚至思想(价值观)的可交互的虚拟形象。

从未来媒体形态和服务模式看,计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技(Converging Technologies)带来语义传播与无障碍传播的新空间,由此诞生的虚拟数字人将以新媒介角色,广泛应用在元宇宙新生态中,担任着信息制造、传递的责任,是元宇宙中“人”与“人”、“人”与事物或事物与事物之间产生联系或发生孪生关系的新介质。

当前,随着技术的进步和应用的快速落地,“数字人”这个此前偏医学的名称,开始成为“虚拟数字人”的简称,很多文件也直接开始使用“数字人”来代指虚拟数字人。

从定义便可获知,虚拟数字人产生和发展都离不开技术的进化,以及市场需求的推动。虚拟数字人1.0、2.0、3.0阶段的区分主要从技术方案、互动载体、交互方式来区分。

在技术角度上,它们从2D跃升至3D,再到如今的AIGC生成;互动和交互上,从原来的长短视频,到直播,再到目前的智能硬件互动、AI Agent(智能体)交互,实现了全天候、个性化互动,开始做到千人千面的交互,技术的提升及成本的下降,更为人人可得的“数字分身”提供了条件。

虚拟数字人首次诞生于1982年,日本动漫《超时空要塞》中的女主林明美成为世界上第一个虚拟歌姬。

数字人产业最发达的是日本,不少人认为数字人的起源要追溯到动漫领域。以前的数字人大部分是2D版本的,例如虚拟偶像初音未来,就是以虚拟形象与语音合成的虚拟歌姬。人们以歌姬的IP形象进行相应的定位和包装,吸引了大批的粉丝。

2.0的版本更好地体现了互动性,全息等方式应用起来了,不少虚拟偶像举办演唱会,它们的动作、声音非常具有个人特色。

到了3.0版本,虚拟偶像、虚拟主播、虚拟员工、虚拟化身等层出不穷,这些虚拟数字人在各行各业表现出千人千面的特点,在直播、短视频等领域里表现得很出色。

读+:请您举例说明,虚拟数字人目前在社会中担任怎样的角色,有哪些应用场景?

张丽锦:目前,市场上应用最广、商业化程度最高的虚拟数字人有三类:虚拟偶像、虚拟主播、数字员工。虚拟偶像多见于影视、文旅、传媒和游戏;虚拟主播则主要活跃在传媒和电商;数字员工则广泛应用于金融、教育、医疗和文旅等领域。

从应用场景来看,可以分为B端、C端两大类应用。B端方面,主要是企业和机构的数字员工,如客服、品牌官、销售顾问、数字主播、导游、虚拟老师、心理医生等特定工种的“替身”。

最常见的就是我们进入了某个银行的App,就有一个虚拟数字人跳出来与你互动,你有怎样的需求,可以直接与它沟通;还有些虚拟老师在视频中教授学生一些知识,表现得与真人非常类似,也许你都看不出来。

C端方面,则以虚拟主播、虚拟偶像作为网红艺人或者“明星分身”为主。C端还有一个广阔的应用场景,便是分身型数字人,即“数字分身”,与真人的身份一一对应,出现在元宇宙空间中,如虚拟学术会议的专家分身、元宇宙毕业典礼的学生、元宇宙晚会里参与互动和抽奖的观众。

现在很多文旅单位也在做虚拟代言人,比如“刘三姐数字人”就是以“刘三姐”为主题IP进行延展设计和开发的虚拟数字人形象;央视的数字文化艺术博物馆邀请AI诗人少年李白和观众互动;元宇宙里诞生的“苏小妹”成为眉山数字代言人,成为“宋文化推荐官”……越来越多的虚拟数字人在我们的生活中出现。

读+:虚拟数字人的核心技术是什么?它们是如何被设计和编程的?

张丽锦:虚拟数字人是多模态的,因此其创建过程是一个高度综合、技术密集且系统性的,从外形到动作,到表达,到交互驱动,核心技术包括了形象生成、语音生成、音视频合成显示、交互模块、智能驱动、感知识别技术,甚至是分析决策技术等。总体而言,AI技术是虚拟数字人发展的底座。

要理解虚拟数字人的创作设计、升级迭代的技术,我们可以从其形成的数字模因来理解,包括形模因、声模因、行模因、神模因。数字模因的发展方向便是技术的方向。

比如,虚拟数字人的形模因从2D到3D,从次元风到超写实,再到全仿真,形模因可以完成“真人的全保真复刻”,声模因亦然。对形、声两类模因的复刻、创作技术相对完善,可以满足各类数字人的生产需求,目前2D真人复刻的开源也是形模因技术的进步体现。

行模因和神模因,包括了数字人的动作生成、智能交互、情感人格,目前也是AI技术需要突破的,如文生动作、声音驱动动作、情感模型等。

就拿声音来说吧,声音的克隆也分不同的方式。

比如我把马老师的声音克隆下来,不同的仿真程度是有区别的,它的制作价格也不一样,模仿得越逼真,价格就相对更贵一些,它需要更多的语料去了解你的停顿、语言习惯、表达方式等个人特色。

数字模因里可能会有你的微表情和微动作,当我们给虚拟数字人一段语音,它自己会通过语音来表达这些细微的动作,这就是声音驱动动作。

虚拟数字人核心的技术其实跟其他的大模型没有太大区别,都是依靠AI技术的进步。在虚拟数字人技术中,软硬件一体化的结合,以及IP孵化、运营都至关重要。

提升智能化,数字人将“更好用”

读+:在虚拟数字人刚出现时,不少场景应用过它,但它似乎显得机械冰冷,“不怎么好用”。它现在的发展状态是怎样的?发展趋势如何?

张丽锦:当虚拟数字人刚出现时,确实存在一些局限性,它们往往缺乏真实感和情感表达,这使得用户感到它们过于机械和冰冷。早期的虚拟数字人受限于当时的计算能力、算法精度以及数据集的大小,因此在表情、语音合成、语义理解等方面表现得不够自然,与人类的交互体验也较为生硬。但随着技术的不断进步,尤其是计算机图形学、人工智能、动作捕捉等技术的发展,虚拟数字人的制作和应用水平有了显著提升。

目前,虚拟数字人已经能够实现更加逼真的外观设计、自然流畅的动作表情,以及更加智能的交互体验。它们在娱乐、金融、教育、旅游、电子商务等多个领域得到了广泛应用。例如,在娱乐领域,虚拟偶像、虚拟主播等已经成为一种新兴的文化现象;在金融领域,虚拟数字人被用于客户服务、理财咨询等场景;在教育领域,虚拟教师为学生提供了新的学习体验。

我认为,未来虚拟数字人技术将继续朝着更加智能化、个性化、互动性强的方向发展。随着人工智能技术的进步,虚拟数字人将能够更好地理解用户的需求和情感,提供更加贴心的服务。

此外,根据2024年报告的网络调查结果来看,虚拟数字人的应用将会逐步向C端扩展,超半数的受访者已经表明曾拥有过自己的“数字分身”,近九成的用户愿意花钱为自己定制数字人。随着元宇宙概念的兴起,虚拟数字人将在虚拟世界中扮演更加重要的角色,成为人们在数字世界中的虚拟化身。

更值得注意的是,数字人IP化的趋势也越来越明显。近九成的消费者表示愿意为自己喜欢的数字人IP进行消费,这进一步推动了数字人内容制作和运营空间的发展。

最后,从实用性角度来看,个人助手型数字人也将成为未来市场的重要发展趋势。在社会快速发展的背景下,用户和市场越来越倾向于选择那些能够提供实际帮助和价值的虚拟数字人。

读+:您曾参与国内首个中国虚拟数字人的影响力指数发布,在您看来,这份报告带给我们哪些启发?

张丽锦:《中国虚拟数字人影响力指数报告》是中国传媒大学媒体融合与传播国家重点实验室以及动画学院数字人研究院的师生一起完成的课题,我是课题组组长。《报告》以上一年度的全年数据为基础,每年发布一期,至今已经连续发布三年三期。

2021年数据是《报告》第一期,当年是虚拟数字人行业在国内驶入快车道的一年。原因如下:首先,2.64亿、占我国人口总数19%的Z时代消费者,成为“元宇宙”虚拟消费、虚拟体验、虚拟恋爱等的首批拥趸;二是民族自信、文化自信催生的国风、国潮消费,让本土化企业、内容崛起;三是政策支持、资本追逐等宏观因素的催生;四是得益于元宇宙概念及技术的快速发展。可以说《报告》的初衷便是期待可以作为行业洞察和产业声量的“放大器”。

第一年我们选出来的IP只有几十个位于头部的虚拟数字人IP,到第二年是100多个,第三年就有300多个了……虚拟数字人在不停增长,每一年跟数字人相关注册企业的增长都在以百分之四五十的速度增长。

我们选择“IP影响力”这个角度切入,是希望通过行业内高质量且形成高载荷传播的虚拟数字人IP给到行业启发。这些头部IP的传播力、产品力、社会力的塑造经验与教训,既能给数字人个体的强势数字模因的塑造提供参考,也能给产业以参考。

人“人”共生,“数字身份”需规范管理

读+:近日,全球首个2D真人级AIGC实时渲染数字人模型开源了。这将给我们带来怎样开放的生态?我们又将面临哪些未来的挑战呢?

张丽锦:虚拟数字人是一个多模态的载体,它既有外形的生成也有声音、行为的生成,实际上它是一个综合的聚合技术的发展,所以说全球首个2D真人级AIGC实时渲染数字人模型开源其实并不能改变太多行业的进程。目前,2D影像型数字人的应用现在也是重点监管的对象,一方面是大量同质化的2D数字人短视频或直播,造成了客户体验下降及投诉,另一方面该技术也被滥用到新型诈骗。可以看到,无论是抖音还是视频号,对数字人带货直播、娱乐直播,不论是有对应真人的“数字分身”,还是完全凭空创造的虚拟形象,只要不是真人直播,都开始有限制。

硅基的这次开源,从我们行业内的评测来看,其实它是有克制的。现在技术强一点的公司,也可以花一两个月时间、基于开源模型做出2D数字人应用系统。

读+:虚拟主播可以24小时无休,虚拟偶像将拥有大批粉丝,“虚拟分身”让博主无需亲自输出,人们甚至可以拥有AI恋人,让其给足情绪价值……虚拟数字人给我们的生活方式还带来怎样的变化?应如何看待我们和虚拟人之间的关系?

张丽锦:虚拟数字人作为未来元宇宙空间(元宇宙的概念在炒作上下滑了,但技术的助推,其实现的图景更加清晰了)“人—物—场”中核心的“人”的一环,多为多模态技术的“集成”应用,将是我们进入虚拟空间、连接具身智能等的重要技术和交互界面。

首先,是新娱乐休闲的方式,无论是音乐会、电影、游戏还是综艺节目,都能看到它们的身影。这种新型娱乐形式不仅丰富了内容生态,还打破了物理空间的限制,让观众能够随时随地享受高质量的娱乐体验。

其次,将推动未来社交革新。通过分身型数字人,人们可以进行实时互动、分享生活、交流情感。这种基于虚拟身份的社交方式,为用户提供了更多的表达自我和建立社交关系的可能性,同时也促进了社交网络的多元化和包容性。

再次,在学习和工作领域,数字人也开始广泛而深入地接入到教育和企业生产、管理的各个流程。虚拟教师、虚拟学生等的应用,加上XR技术的加持,让教学和互动充满了新的可能;企业流程中的行政、人事、培训、销售、电商等环节都开始有数字员工的身影,你收到的录取通知可能是虚拟员工发的,你进企业的第一堂培训课,也可能是数字HR给上的。

可以说,作为新工具、人们融入虚拟世界的“技术义肢”,虚拟数字人将在工作、社交、生活等场景产生重要作用。数字人作为工具—助理—伙伴,开始层层深入到我们的生活、生产,也成为观察人“人”共生的新景观社会之钥。

虚拟数字人在给生产生活带来效率、便捷及良好体验的同时,也面临技术、监管、伦理等挑战。

从虚拟数字人所涉及的形、声、行、神模因来看,每个数字人IP都是对“人”这个主体进行了不同程度的“复刻”,这里一方面涉及对“人”的形、声、行模因信息的保护。比如,当前2D数字人技术被不法分子应用于诈骗,已经造成了很多不良影响——这就要求尽快对虚拟数字人的应用和监管出台有效的措施;另一方面,技术在不断地希望突破数字人的“AI生成”,却在生成的保护、溯源、反侵权、反诈骗上研究不足。

从法律角度来看,随着虚拟数字人应用的普及,一系列与之相关的法律问题也将浮现。例如,数字员工的法律地位、权益保护、侵权责任、生产作品归属等问题都需要得到明确的界定和解决。

从伦理角度来看,目前对去世亲人的复刻、粉丝用技术复刻偶像“私藏”等问题已经引发关注;而是否让硅基智能产生“数字生命”或者通过数字人实现“数字永生”,也是挑战传统伦理、挑战人类中心主义的命题。

因此,接下来,除了追求虚拟数字人技术的长足进步,我们应该在配套的理论研究、监管、治理上同步下功夫。例如,“数字身份”治理,对“真人复刻”进行规范,保护好个人隐私;“数字人标识体系”建设,对应用中的虚拟数字人进行标识与规范;完善虚拟数字人“再生产”的版权等问题。

(长江日报记者马梦娅)

【来源:长江日报】

更多精彩资讯请在应用市场下载“大武汉”客户端,未经授权请勿转载,欢迎提供新闻线索,一经采纳即付报酬。24小时报料热线:027-59222222。此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:kin0207@126.com

(图片来源网络侵删)