2024年6月3日发(作者:)
AIGC技术专题研究报告
目录
1. 趋势 .......................................................... 4
1.1.发展历程:算法不断迭代,效果日渐逼真 ......................... 4
1.2.内容生产:从PGC到UGC,从UGC到AIGC ......................... 5
1.3.内容形态:从文字到图片,从图片到视频,从视频到游戏 ........... 7
2.技术 ........................................................... 9
:AIGC发展最早技术,多应用场景商业化落地 .................. 9
:图像生成传统思路,仍需解决不稳定等问题 ................. 11
ion:新一代图像生成主流模型,带动AIGC进入新篇章 ...... 12
3.商业化 ........................................................ 13
d AI:广告行业采用率高,即将上线AI素材平台 ........... 13
3.2.巴比特:率先媒体AI配图,一站式区块链版权存证 ............... 16
eder:人工智能合成创意工具,与他人协同创作 ............ 18
4.投资建议 ...................................................... 19
4.1.视觉中国:成熟商业化场景加持,布局AIGC可期 ................. 20
4.2.蓝色光标:创意画廊平台上线,聚焦AI营销场景 ................. 20
4.3.万兴科技:AI绘画小程序公测,深耕元宇宙生态 .................. 21
4.4.汉仪股份:AI助力字库设计,自动化及生产效率显著提升 .......... 22
5.风险提示 ...................................................... 24
图表目录
图表 1:AIGC发展历程 ............................................. 4
图表 2:DALL-E-2模型图片案例一 ................................... 5
图表 3:DALL-E-2模型图片案例二 ................................... 5
图表 4:中国移动互联网细分行业用户使用总时长占比 ................. 5
图表 5:抖音等短视频工具极大简化创作难度 ......................... 6
图表 6:哔哩哔哩创作者月均投稿量 ................................. 6
图表 7:哔哩哔哩用户日均观看量 ................................... 6
图表 8:内容生产的发展趋势 ....................................... 7
图表 9:内容生产及形态的演进过程 ................................. 7
图表 10:Dream writer生产的游戏电竞新闻 .......................... 8
图表 11:盗梦师文生图AI绘画工具 ................................. 8
图表 12:王者荣耀AI视频战报 ..................................... 9
图表 13:Roblox推动游戏的UGC化 .................................. 9
图表 14:自然语言处理的典型应用场景 .............................. 9
图表 15:Word2Vec的核心思想 ..................................... 10
图表 16:BERT的主要框架 ......................................... 10
图表 17:生成式对抗网络模型结构 ................................. 11
图表 18:生成式对抗网络的典型应用场景 ........................... 11
图表 19:各类生成模型之间的对比 ................................. 12
图表 20:Diffusion Model保持语义和风格并改变了细节 .............. 13
图表 21:Rosebud AI的AI编辑应用程序 ............................ 13
图表 22:Rosebud AI的 Synth应用程序 ............................ 14
图表 23:PixelVibe AI生成影像素材库 ............................. 14
15
15
15
16
17
17
18
19
19
20
21
21
22
23
23
23
图表
图表
图表
图表
图表
图表
图表
图表
图表
图表
图表
图表
图表
图表
图表
图表
24:Tokkingheads订阅付费模式...............................
25:Synth
订阅付费模式......................................
26:Rosebud AI 的商业化应用................................
27:巴比特网站头条文章图片全部为AI创作....................
28:无界版图AI创作界面....................................
29:无界版图AI创作付费模式................................
30:Artbreeder操作界面演示.................................
31:Artbreeder付费模式.....................................
32:未来
1-2年AIGC规模化应用机会..........................
33:视觉中国平台型商业模式.................................
34:康定斯基模型支持语句和图片两种格式.....................
35:康定斯基模型广场作品展示...............................
36:万兴
AI绘画小程序演示界面..............................
37:人机协作模式协同生产...................................
38:阿里汉仪智能黑体.......................................
39:行业重点关注公司.......................................
1. 趋势
1.1.发展历程:算法不断迭代,效果日渐逼真
AIGC(AI-Generated Content)尚无统一规范的定义,国内产学研各界对
于AIGC的理解是“继PGC(Professional Generated Content)和UGC(User
Generated Content)之后”,利用人工智能技术自动生成内容的新型生产方式。
国际上对应的术语是“人工智能合成媒体(AI-Generated Media或Synthetic
Media)”,是通过人工智能算法对数据或媒体进行生产、操控和修改的统称。
AIGC、NFT和VR是元宇宙和Web3.0的三大基础设施,随着数据积累、算力提
升和算法迭代,人工智能正逐步在写作、编曲、绘画和视频制作等创意领域渗
透。
图表 1:AIGC发展历程
结合人工智能的演进历程,AIGC的发展大致分为三个阶段:
萌芽阶段(1950s-1990s):受限于科技水平,仅限于小范围实验。1957年,
莱杰伦·希勒和伦纳德·艾萨克森通过将计算机程序中的控制变量换成音符,
完成了历史上第一支由计算机创作的音乐作品——《依利亚克组曲(Illiac
Suite)》。80年代中期,IBM基于隐形马尔科夫链模型创造了语音控制打字机
“坦戈拉(Tangora)”。由于高昂的系统成本却无法带来可观的商业化,人工
智能领域的投入持续减少。
积累阶段(1990s-2010s):AIGC从实验性向实用性逐渐转变。2007年,
罗斯·古德温使用人工智能系统通过对公路旅行中的一切所见所闻进行记录,
撰写世界第一部完全由人工智能创作的小说,但整体可读性不强且缺乏逻辑。
2012年,微软公开展示了全自动同声传译系统,基于深层神经网络通过语音识
别、翻译和合成生成他国语音。算力性能提升和互联网数据膨胀为人工智能提
供了海量训练数据,使其取得了显著发展。
提速阶段(2010s-至今):随着生成式对抗网络(Generative Adversarial
Network)为代表的深度学习算法的迭代创新,AIGC内容的效果日渐逼真。2018
年,英伟达发布的StyleGAN模型可以自动生成图片。2019年,DeepMind发布
了DVD-GAN模型用以生成连续视频,在草地、广场等明确场景表现突出。2021
年OpenAI推出DALL-E,并根据Diffusion models推出升级版本DALL-E-2,
主要应用于文本与图像的交互生成内容,用户只需要输入简短的描述性文字,
即可得到高质量的各类风格绘画作品。
图表 3:DALL-E-2模型图片案例二
图表 2:DALL-E-2模型图片案例一
1.2.内容生产:从PGC到UGC,从UGC到AIGC
随着技术的发展,内容的生产方式也随之变化,从PGC到UGC,再从UGC
到AIGC。根据Questmobile数据显示,2022年上半年以UGC为主要生产方式
的短视频时长进一步增长2.3个百分点达28.0%,以PGC为主要生产方式的在
线视频时长下降0.2个百分点达6.6%。相比于PGC,UGC具有供给量充足、快
速试错、优胜劣汰等优势,成为当前内容生产的主要形态。
图表4:中国移动互联网细分行业用户使用总时长占比
AIGC是UGC发展到一定阶段的必然产物。一方面,内容生产的升级依赖于
工具的迭代,而工具的迭代依赖于对优质内容的总结。以抖音为例,美颜、配
音和特效简化内容制作,而创作者对于热门和优质内容的模仿又推动优质内容
的集中产出。事实上,推荐算法的结果将加剧局部的中心化,一个爆款内容往
往带动的是一类爆款内容。可以说UGC是基于PGC内容的,从影视内容的二次
创作到爆款内容的扩散。同理,大量的UGC内容也是AIGC的温床,AI通过对
数据的深度学习和归纳,不断提高内容的质量。将UGC供给量充足、快速试错、
优胜劣汰的优势进一步深化。
图表5:抖音等短视频工具极大简化创作难度
另一方面,尽管UGC极大提升了内容的供给量,但仍难以满足日益增长的
用户需求。以哔哩哔哩为例,自2017年第一季度到2022年第二季度,用户日
均观看量从6.6上升至33.8个视频/天,用户对内容的需求不断提升。而内容
创作者渗透率约1.2%,月均投稿3.7篇/月,仍然难以满足用户的消费需求,
短视频相对供给更充足但内容质量略低。AIGC将弥补这一供给缺口。
图表 6:哔哩哔哩创作者月均投稿量
图表 7:哔哩哔哩用户日均观看量
AIGC并不是一蹴而就,百度创始人、董事长兼首席执行官李彦宏在百度世
界大会中判断AIGC将迎来三个发展阶段:1)助手阶段,AIGC辅助人类进行内
容生产;2)协作阶段,AIGC以虚实并存的虚拟人形态出现,形成人机共生;3)
原创阶段,AIGC将独立完成内容创作。
图表 8:内容生产的发展趋势
1.3.内容形态:从文字到图片,从图片到视频,从视频到游戏
内容生产方式和内容形态不可分割。从内容形态的难易程度来看,依次是
文字、图片、视频和游戏。游戏领域的UGC仍不成熟,文字领域的AIGC日趋
成熟,由此推演,图片和视频领域的AIGC化即将到来。
图表 9:内容生产及形态的演进过程
文字:相对专业性较强的博客自2000年进入中国,用户仅停留在数十万
级别。微博于2009年上线,对文字内容的数量和质量要求大幅下降,到了2010
年10月底微博的注册用户即超过5000万。2015年腾讯财经开发的写稿机器人
Dreamwriter发出第一篇稿件。发展至今,青云智能开放平台(Dreamwriter)
年发稿量30万篇,稿件字数6000万,平均成文速度为0.46秒/篇,涵盖财经、
体育、房产、法律等二十多个场景。
图片:视觉中国成立于2000年,逐步从编辑类图片涉及创意类图片,与
海外图片巨头Getty有稳定的合作。2008年以后,像我图网、图虫网这样的
UGC类型摄影师社区也逐步出现,视觉中国也于2018年收购了全球知名摄影社
区500px。2022年,OpenAI宣布开放DALL.E 2接口,已有300万人使用过DALL.E
2,每天创造图片数量超过400万。国内诸如盗梦师等品牌纷纷推出自研的AI
绘画工具,可以通过文字AI生成多种风格和画师的画作。
图表 10:Dream writer生产的游戏电竞新闻 图表 11:盗梦师文生图AI绘画工具
视频:国内三大长视频网站中优酷(2006年)、爱奇艺(2010年)、腾讯
视频(2011年),早期优酷尝试过偏UGC模式,但由于版权等问题,最后仍以
PGC内容为主。2009年,以PUGC内容为核心的哔哩哔哩成立了,并且逐步从
二次元内容向游戏、科技、动漫、影视、生活等多领域延伸。真正实现视频UGC
的大规模普及还是由抖音(2016年)和快手推动,其用户超过70%都上传过内
容。短视频的AIGC化也初见成效,MOBA类国民级游戏王者荣耀2020年7月上
线了视频战报功能,可以将玩家的精彩瞬间汇集成1分钟的短视频内容。
游戏:游戏的互动性更强,其制作难度远高于视频。1997年,全球第一款
图形图像多人在线网络游戏《Ultima Online》由美国EA公司推出。至今为止,
游戏的制作仍然以专业机构为主。元宇宙第一股Roblox于2006年成立,是世
界最大的多人在线创作游戏,其中大多数游戏作品都是用户自行建立,从FPS、
RPGC到竞速、解密,全由玩家操控的圆柱和方块形小人参与完成。Roblox尽
管提供了非常优秀的创作工具,但其画面效果仍较为粗糙,游戏领域的UGC化
并不普及。另一个广为人知的游戏UGC案例是DOTA,其是基于《魔兽争霸》的
地图编辑器而来,通过一系列特定的游戏规则和英雄,打造成风靡一时的游戏,
并持续影响着诸如《英雄联盟》和《王者荣耀》等MOBA类游戏。


发布评论