AIGC的传播应用和核心技术有哪些

AIGC行业资讯3年前 (2023)发布编辑员

AIGC的传播应用主要集中在以虚拟主持人为中心的新闻播报等领域，虚拟人开创了新闻领域实时语音及人物动画合成的先河，只需输入要播发的文本内容，电脑就会生成相应的虚拟人播报的新闻视频，并确保音频，表情，嘴型保持自然一致，展现与真实主持人同样的信息传达效果，现在虚拟人在传媒领域的应用有三方面的特点。

应用范围不断拓展，目前新华社等媒体及东方卫视等省市级媒体，都开始积极探索虚拟人，并逐渐从新闻推广到晚会，现场记者，天气预报等更广泛的场景应用。

应用场景不断升级，除了常规式主持播报，虚拟人也开始陆续支持多语种和手语播报，2022年冬奥会期间，百度，腾讯等企业陆续推出手语播报数字人，为广大听障用户提供手语解说，更推动体育赛事的无障碍进程。

应用形态日趋完善，在形象上，虚拟人逐步从2D走向3D，在驱动范围上，开始从只有口型变化发展到面部表情，肢体与手指动作，背景内容等一应俱全，在内容构建上，从支持SaaS化平台工具构建向智能化生产延伸，例如腾讯3D手语虚拟人“聆语”，可生成唇动等细微内容，并配套可视化动作编辑平台，支持对手语动作进行微调。

AIGC的核心技术有哪些。

变分自编码器是深度生成模型中的一种，由Kingma等人在2014年提出，与传统的自编码器通过数值方式描述潜空间不同，它以概率方式对潜在空间进行观察，在数据生成方面应用价值较高。

VAE分为两部分，编码器与解码器，编码器将原始高维输入数据转换为潜在空间的概率分布描述，解码器从采样的数据进行重建生成新数据。

GoodFellow提出了生成对抗网络，成为早期较著名的生成模型，GAN使用零和博弈策略学习，在图像生成中应用广泛，以GAN为基础产生了多种变体，如DCGAN，StytleGAN，CycleGAN等，GAN包含两个部分：。

生成器：学习生成合理的数据，对于图像生成来说是给定一个向量，生成一张图片，其生成的数据作为判别器的负样本。

判别器：判别输入是生成数据还是真实数据，网络输出越接近于0，生成数据可能性越大，反之，真实数据可能性越大。