数字人产业发展趋势报告2023

author
0 minutes, 17 seconds Read

来源 腾讯研究院

全真互联时代正在悄然到来,加速线上线下的跨时空融合,作为全真互联的重要入口,数字人可以推动线上和线下更加全面地一体化,打造出沉浸式的“全真”体验与可操作的“互联”交互。

进入2022年以来,数字人在诸多应用场景大放光彩,特别是在北京冬奥会的开幕式表演、气象播报、手语解说中频频现身,使其用户基础不断扩大。爆点事件推动数字人产业被用户不断加深认知,数字人形态、技术及应用受到大量关注,而支持产业快速发展的底层元素则包括技术的发展、用户新需求、生态完善和标准的支持等。

伴随着全真互联的到来,未来数字人应用还将具有哪些可能性,技术路线会产生哪些变化?腾讯研究院、腾讯云智能和创业黑马合作,先后对数十家从事数字人的企业进行深度调研与跟踪访谈 ,分析产业发展现状,底层驱动力、未来方向和挑战等。形成《数字人产业发展趋势报告(2023)》(文末附下载二维码) 。从数字人的价值定位、核心技术、行业应用、C端发展、产业聚集 等十个不同维度进行剖析,挖掘出产业发展的十大趋势。

趋势1:数字人制造和运营服务的B端市场不断扩大,将面向更广大的C端用户提供服务,各类数字人价值定位和商业模式有差异。

数字人的最终服务对象为C端用户,在B端的应用领域从电影动画向广告营销、电商直播、虚拟偶像等领域不断扩展。未来,以虚拟分身为代表的应用潜力巨大。从需求角度,数字人制造和运营服务在B端市场不断扩大领域和规模,面向更广大的C端用户提供服务,而制作方式也从PGC向UGC发展。

在20世纪80年代电影、动画等领域早期的手绘数字人最先出现,伴随着21世纪初计算机动画和动捕技术的成熟,内容/IP型数字量应用在影视行业中,主要是增强影视中观众的体验效果,随后逐渐在文娱、市场营销、文旅、虚拟偶像等场景推广应用。近年,伴随AI驱动技术的成熟,功能服务型数字人陆续出现,主要应用于行业服务场景,如金融数字人客服、传媒数字人口播等。在虚拟空间中的虚拟分身数字范围出现相对较晚,虚拟空间的技术和产品还在发展中,待产业进一步完善,此类应用潜力巨大,是数字人市场的增量空间。

趋势2:技术集综合迭代驱动数字人形似人,制作效能将继续提升。

多元技术推动数字人外形更像真人:建模技术发展推动超写实数字人制作门槛、成本和周期进一步下降;物理仿真算法迭代推动服装动态展示趋向真实;渲染引擎迭代和GPU算力提升推动数字人画面更加精细和实时化;算法的优化推动专业动捕设备趋向便捷化,视觉动捕在C端应用潜力更大;面部捕捉技术向更简单的硬件、更细腻的表情、更自动化的流程方向发展。

趋势3:AI技术驱动数字人多模态交互更神似人,并逐步覆盖数字人全流程。

当前数字人对语言理解还是以文本为主,动作合成上声唇同步较为完善:

(1)AI驱动数字人是指数字人等语音表达、面部表情和动作形态等通过深度学习模型进行运算,并将其结果实时或者离线驱动,并进行渲染。目前主流的 方式是围绕NLP能力通过文本驱动,本质是通过ASR-NLP-TTS等AI技术进行感知-决策-表达的闭环来驱动数字人交互,同时需要预先设置相关的知 识图谱或问答库等,与数字人的对话系统对接,但目前NLP在通用性场景的能力还需要进一步完善。

(2)计算机视觉(CV)目前数字人声唇同步技术相对完善,在游戏中已经大量应用;而其他表情和动作还需要描述性的数据或者标签驱动,尚未智能合成, 表情动作也是是AI驱动未来发展的重点方向。

未来AI技术的重点方向是在输入端实现多模态感知输入,在输出端提升多模态交互能力,综合提升数字人的表现力,从目前的基于文本的交互,转化为基 于语义的交互,特别是需要强化对人情绪的感知和表达。此外除了利用ASR-NLP-TTS等技术驱动数字人交互外,AI技术也应用在2D数字人的视频生成、3D数字人的建模、视频驱动、物理仿真等多个环节。

趋势4:数字人技术与SLAM、3D交互、体积视频、空间音频等技术深度融合,渲染将从本地到云端。

数字人作为3D呈现的一种方式,未来将与其他3D技术如SLAM(即时定位与地图构建)、体积视频、空间音频等融合,进一步完善数字人和真实空间的交互。例如在直播场景中虚拟/真实空间中真人和数字人的交互,数字人对真实空间的感知等。同时由于数字人对渲染能力要求较高,未来云端渲染是重要的方向,将推动云服务商从算力(CPU)云服务,到渲染力(GPU)的云服务。但成本仍是云渲染普及的关键阻碍,需要突破。

趋势5:千行千面的数字人将成为人机交互新入口,但深度上仍需挖掘。

AI驱动的数字人通过AI能力建立人与大数据的连接,提高效率并满足人情感交流需求,提升用户体验,将成为人机交互新入口:应用广度上:目前使用文字或语音交互的场景都可用AI数字人软着陆的方式替代,不需要改变原有的业务逻辑和商业模式,大众接受成本较低,并提供更好的用户体验,未来应用场景非常广泛,可以与各种领域相结合,服务规模化和标准化。应用深度上:数字人作为企业的数字资产,是对员工工作的增强,具有生产力的属性,可以进一步释放生产力,同时降本增效。未来数字人将根据不同行业的业务特点和应用场景进行更深度结合,孵化千行千面的数字员工,提供差异化服务。

趋势6:UGC数字人将加速出现,成为未来产业的增量空间。

未来1-2年技术门槛和成本将快速下降,会出现更开放的创作者生态、更丰富的UGC内容和商业模式,UGC将成为数字人的增量空间,同时也是数字人在C端应用的主要生产方式

趋势7:数字人仍以2D显示设备为主,3D显示设备成为特定领域的新解法。

数字人的显示载体包括手机、平板电脑、AR/VR眼镜、智慧大屏或线下一体机等多种终端设备。PC、手机、智慧大屏、银行VTM机等2D主流显示设备仍是数字人显示的主要载体。数字人和3D的数字内容,对于裸眼3D、VR、AR等3D显示设备的普及具有推动重要。特别在VR/AR设备中,6dof交互更突出数字人特点,因此会在特定领域成为新解。

Similar Posts