小冰李笛:为什么虚拟人必须「砍掉」中之人?

AI应用信息2个月前发布 XIAOT
170 0

现在的虚拟人赛道上,有三种主要的’流派’。而我认为,只有小冰的模式才能走得通。”小冰的CEO,李笛如是说。

如果你关注虚拟人赛道,但你不知道小冰公司,那你的功课一定没有做足。小冰诞生于微软,曾是微软人工智能团队,隶属于微软(亚洲)互联网工程院。2020年7月,小冰从微软分拆为独立公司运营,在人工智能方向持续深耕。

在虚拟偶像A-Soul、七海、柳夜熙大行其道的今天,小冰也在做虚拟人。但小冰的虚拟人却不是”偶像”,他们有些是主持人、是艺术家、是研究生。从某种程度上,是虚拟人市场上的”一股清流”。

小冰的CEO李笛,则是在2013年便加入微软,从零开始构建AI being小冰框架,是虚拟人技术的前沿人物,对技术和赛道都有深刻理解。

何故”口出狂言”?李笛自然有他的道理。然而要把这事讲清楚,就得先讲讲虚拟人的这”三种流派”。

1

虚拟人的三岔路口

“今天所谓的虚拟人赛道,是三拨人在往中间凑。而最后站在了这同一个路口上。”李笛对雷锋网表示道。

这三拨人,其一是以IP运营主导的”虚拟偶像派”,其二是以艺术家主导的”CG内容派”,其三则是以AI技术主导的”AI being派”。

先说“虚拟偶像派”,在近年可以说是炙手可热。这种模式主要通过捕捉演员(又称”中之人”)的声音和动作,进而驱动虚拟人。

“虚拟偶像派”大多重IP运营,如在现实世界”造星”一般,培养虚拟偶像在观众中的形象。而为了降低渲染成本,虚拟偶像大多以”二次元”的画风出现,紧紧地圈住了二次元粉丝的心和消费。

据统计,国内人气虚拟偶像嘉然(ID:嘉然今天吃什么)于去年直播营收670万元,在国内虚拟偶像界居首。而嘉然隶属的虚拟偶像团体,隶属于字节跳动旗下的”A-Soul”,五位成员加在一起,去年全年直播营收达到约2500万元。

再说“CG内容派”,这个流派可以说是行业的”老前辈”。发端于好莱坞电影的特效公司,这种制作方式通过动作和面部捕捉,来获取大致的动态和形象;或采用真人录制,再用CG换头。而后再倾耗大量的人力物力,以艺术家为主导,对形象(主要是面部)以CG技术,逐帧进行渲染和微调。

“CG内容派”主要以内容为主导,旨在输出观众买账的内容,对创作团队的素养要求更高,画风更多偏向于”超写实”。而在实现内容追求的基础上,成本控制则要为内容让路。据媒体报道,”超写实”虚拟人视频每秒的成本在8000到1.5万不等。

当然,以内容主导的虚拟人形象至今仍活跃在大量的影视、游戏作品当中,并持续为行业带来巨量营收。而单看虚拟人,国内正当红的”柳夜熙”、”AYAYI”、”翎”也自然是个中翘楚,收获品牌代言无数,也被人看做是虚拟人颇具潜力的一种商业模式。

一个是唱跳偶像,一个是超写实虚拟形象,李笛却对这两种流派并不看好:“这两种模式都有它的上限,就是缺乏高并发和量产化的能力。”

先说前者,中之人驱动的虚拟偶像终归有极限。甚至可以说偶像虚拟人并不能算是真正的”虚拟人”,可以看做是”披着虚拟外皮”的真人。一个动捕演员只能驱动一个虚拟形象,就代表虚拟偶像和中之人的关系十分紧密,难以实现虚拟人的量产。

提到量产能力,肯定有人问:”现在的虚拟偶像已经广受追捧,我们真的需要量产虚拟人吗?”

回看1943年,在计算机刚刚被发明出来的时候,IBM创始人——托马斯·沃森就曾表示:”世界上只需要5台计算机。”而今,智能手机已经可以说是现代生活的标配。这种数字上的量级,是数十年前的人们想象不了的。

“在未来,虚拟人的数量很可能会超过地球上的自然人。”李笛如此判断。

而说完量产问题,因为虚拟偶像与中之人的”强绑定”,虚拟偶像也并非与”塌房”绝缘。除去运营公司自身的”骚操作”导致粉丝流失因为中之人而塌房的虚拟偶像并不在少数。

hololive旗下的 “赤井心”和”桐生可可”,因在直播中辱华,导致公司在华的业务遭受重创。而老牌虚拟偶像”绊爱”,则为了扩大规模,将绊爱做成了4个分身,冷落了原本的中之人,造成在全球范围内掉分数十万,最终导致了绊爱的关停。

无论虚拟或现实,造星产业都大同小异。中之人合同到期、恋爱结婚、关系不和,都是虚拟偶像运营的不可控因素,而这些不可控因素也都指向了虚拟偶像模式的诸多隐患。

那轻IP运营,重内容创作的”CG内容派”有机会吗?李笛的答案也比较悲观。

“CG内容派”,输在”烧钱”。前文提到过”超写实”虚拟人的超高成本,而了解这个赛道的人一定知道,超写实虚拟人正陷入了一种”脸的内卷”。各家厂商都在竞争谁的渲染更细致,谁的建模更好看,谁的妆容更精致。虚拟人一张张”神颜”的背后,都是大笔大笔地烧钱。

不仅如此,李笛认为,这种模式无法实现规模的快速增长。从人力上来讲,柳夜熙的团队有150人左右,如果公司要复制柳夜熙的成功,推出一个新的”柳夜熙”,在理论上团队又需要进行150人的扩容。

在电影、游戏制作周期中,模型师和渲染师可以为了效果而对虚拟形象进行长时间的打磨和修补。而在当下的移动互联网,内容则需要保持高频更新,才能在竞争高度激烈的注意力市场站稳脚跟。这种”精益求精”的开发模式,难以适应一周双更、甚至日更的节奏。

产能的天花板,是虚拟人必须冲破的难关。

而AI being派给出的答案,是用AIGC的方式给出大量的内容,最终由市场进行淘汰和迭代。从一开始,小冰就是一家技术公司,他们对造星和造IP都不那么感冒,这让小冰对虚拟人的看法与众不同,甚至充满了颠覆性。

中之人因素不可控?MCN只能加强管理、扩充团队,用传统方式解决管理问题。而小冰却将中之人完全”砍掉”,完全用AI驱动虚拟人,一劳永逸地解决中之人问题,同时也让AI交互的高并发成为了可能。

CG渲染太贵,制作周期太长?小冰并不用CG技术进行渲染,甚至连3D模型都不用。李笛说:”对待这件事,我们的观点是’唯心’的。既然人眼看到的图像是二维的,我们可以将视网膜能看到2D图像的每一个图景,都进行还原,而并不需要真的通过3D的方式去实现。”

利用这种手段,小冰可以将渲染成本控制在17元/秒左右,成本几乎是CG渲染的1/500。尽管分辨率只有1080p,但在小屏幕上也算够看。

虚拟人颜值太”卷”?小冰公司内部几乎没有美术人员,做脸全靠大数据生成。李笛说:”你想要一个邻家女孩型,我可以给你临时生成两万张,如果你都不喜欢,我可以再给你两万张。”而也是在这种大量产出的情况下,对待虚拟人审美的选择又被重新交回给了市场。

看懂小冰的套路了吗?他们擅长暴力地”降维打击”,把最优质的资源集中到AI being的最核心功能上,余下的问题用技术创新去改变、去颠覆。

2

AI being:内外兼修,才能做”人”

小冰团队最初是微软人工智能助理Cortana团队的一部分。彼时,Cortana的宣传语是”Ask me anything”(什么都能问我),在技术内核上也更趋近于单对单的读表式回答。

“坦率说,做一个任务的对话系统要更容易,把规则写好就可以了。”李笛说道。

而为什么要去做虚拟人?李笛有这样几个判断:

一、AI落地的终极形态,不会只是事务性的助理,而会成为可以提供情感价值的陪伴。而在”助理”则会成为”陪伴”功能的一个部分,用户使用虚拟人也会更看重它的情感价值。

二、为了满足用户的情感需求,AI在未来会以多样性见长,数量级也会极其巨大。AI being会不断的市场投放和淘汰中,推举出新的头部。同时,以多样化的虚拟人满足多样的市场需求。

三、在未来,虚拟人的商业模式是以创造人、派遣人工为主要内容的订阅服务。

这么看来,虚拟人的价值就不能简单地依附在能够”做事”上,它必须得内外兼修,让它更”像”人。

“内外兼修”,是李笛用于形容理想AI being时使用的词汇。诚然,虚拟人不只是外面的那副虚拟”皮囊”,更有其性格、倾向、态度等多种重要的因素。也正是有了这种因素,AI being才能真正被成为虚拟”人”。

刚刚提到的三大流派中,”虚拟偶像派”主要靠中之人和IP运营来突出虚拟人的性格和人设,”CG内容派”则主要依靠剧本和文案。而”AI being派”想要虚拟人有自己的性格,而且想要每个虚拟人都有自己独特的性格,可以与用户产生实时的交互,这样才能”将IP价值落在虚拟人身上”。

抖音平台上,小冰可以说是最”宠粉”的虚拟人账号。团队将开放式对话系统接入小冰的抖音评论区,从而她可以做到秒回评论区所有留言。在万科,财务部虚拟员工崔筱盼荣获2021年优秀新人奖,她催办的预付应收/逾期单据核销率达到了91.44%,原因还是她人格化的部分能让人感到亲切。此外,据小冰团队观察,许多用户在使用人工智能的时候,会将虚拟人与现实中存在的人设为同名,借此来将情感移情到AI上。

让虚拟人”虚拟”得彻底,却又能够把价值落回人性,这是AI being在未来必然走上的一条路。

然而,AI的内容生成又谈何容易?在2022年冬奥会上,阿里的虚拟人”冬冬”确实又出了一次圈。运动会期间,冬冬承接了采访、新闻播报和带货等多种任务,并与武大靖等运动员在演播室实时互动,而她活泼的性格和专业的素养也确实圈粉无数。据媒体报道,冬冬的对白完全由云端的人工智能技术生成,这样的水准的确令人震惊。

关于这一点,雷峰网询问了李笛的看法。李笛表示:”这个是可能的,但是到目前为止我们知道的是只有我们做到了。在每日经济新闻的AI电视上,虚拟主播可以做到24小时 X 365天的连续直播播报。然而,金融文本生成我们做了整整五年,与每经的合作也已近三年。”

在内容生成中,李笛说主要难点有二:

一是”归因”,也就是将内容与内容背后的因果关系进行对应。没有进行归因的内容,就如同一篇没有引注的论文,尤其是在新闻的直播播报中,如果无法对内容进行归因,那就很有可能出现信息错漏,从而带来意料之外的风险。

二是”观点”,AI being普遍缺乏产出观点的能力。AI没有好恶,也缺乏进行价值判断的能力。观点性的问题缺乏标准答案,这让AI通常难以回答。但如果能将话题局限在一个很小的范围内,那么这一点也可以实现。

李笛对雷峰网说,在GAN生成式对抗网络)和小样本学习技术的赋能下,小冰向中央美院提供了一个平台,由中央美院去调用这个平台生产的作品,并确定作品的质量,为后续训练模型的修改提供反馈意见。由此,央美”研究生”毕业的夏语冰,能够做到作品质量稳定,并且具有明确的个人风格。

李笛说,如果AI不能控制作品的水平,那就不能叫做具备了艺术的能力。AI being要具备创作艺术作品的水平,能够让观众与艺术家之间,可以通过作品产生间接交流——这才是AI艺术创作的关键评判标准。

    © 版权声明

    相关文章

    暂无评论

    暂无评论...