最近两个月,二次元们找到了AI的“正确用法”——玩梗。
以造梗最多的NovelAI为例,无论你投喂什么图片,AI都能二次元化,输出精美中不失离谱的图片。
(资料图片)
这只是大量AI作画正面案例里的一个少数。最近两个月,AI作画带着大量梗图火出圈,带动了整个AIGC领域的投融资,AI行业也顺带着被“奶”了一口。
但AIGC能做的,远不止作画。
AIGC实现创作自由?
AIGC(AI-generated content),意为由AI生产的内容。因此,只要创作的主体是AI,无论内容的形式是文本、图像、音频、视频以及它们排列组合的多模态内容,都属于AIGC。
在这个范畴上,游戏领域由AI生成的NPC和游戏策略,还有市面上一抓一大把的虚拟数字人,勉强可能算作AIGC之列。
2020年12月,投资机构a16z官网发布文章,提出“内容生成的四个阶段”,依次为PGC、UGC、AI辅助生成和完全的AIGC。
该文章发布时,a16z还非常保守地认为,“我们仍处于第一至第二阶段”。实际上,果壳硬科技历史文章曾提到,腾讯早在2015年推出了AI写作机器人Dreamwriter,为里约奥运会进行赛事报道,这说明彼时内容产业已经触碰到第三个阶段——AI辅助生成。
2022年百度世界大会上,李彦宏就表示AIGC有三个发展阶段:首先是“助手阶段”,AIGC用来辅助人类进行内容生产;第二是“协作阶段”,AIGC以虚拟人形态出现,形成人机共生局面;第三是“原创阶段”,AIGC将独立完成内容创作。
若以此为标准,我们已经实现了AIGC的第一个阶段,AI生成文字、图像、视频等方面已有多款产品。
AIGC项目虽然多,但是依据定位不同可分为两类:产品型和研发型。
产品型项目以创业公司为主,它们的产品一般更加更加商业化,盈利需求明显。
它们要么向用户收费——AI作画公司PromptBase直接收取1.99美元/张的作品费用;Discord的Midjourney虽然允许用户免费试用AI作画,但是免费版有使用次数限制,若想将画作商用,就要支付每个月30美元的费用。另外,若用户因Midjourney每月获利超过2万美元,还需要与Discord进行分成,分成比例在20%左右。
要么向公司收费——小冰公司公司CEO李笛曾向果壳硬科技表示,小冰通过提供人工智能框架,从其它公司处赚钱。每日经济新闻、红杉中国等公司都使用了小冰的解决方案。
而研发型项目以科技巨头的大规模深度学习模型为代表,它们一般为某些专用目的或是服务于巨头的底层技术,一般不会推出面向普通用户的产品。
如Open AI、腾讯、阿里等公司的预训练语言模型。以阿里为例,其语言模型作为自然语言技术平台的底层能力,支持产品的搜索、推荐、广告、客服等功能。
研发型项目即便推出面向一般用户的产品,也以小规模测试为主,目的是在使用中获得更多学习数据,自我学习。如百度基于文心大模型推出了AI作画产品,但使用该功能需要申请,对于使用次数也有限制。
此外,出于展示研发实力、减少重复劳动、推动技术交流等考虑,大公司一般这些项目开源,供学界研究,但这也给了少数AIGC项目一条“创业的捷径”。
市面上部分AIGC项目并非都有自己的模型,而是采购或剽窃自其它项目。
行业媒体EasyAI就在2021年的文章中提到,人工智能写作工具Copysmith AI及其同类产品Copy AI的模型并非自研,而是使用了GPT-3的语言模型。2020年10月起,GPT-3开始有偿向外界开放自然语言处理能力,这些公司利用GPT-3商业化也无可厚非[3]。
但少数公司还存在剽窃行为。今年8月,媒体曝出一家名为WriteSonic的AIGC创业公司剽窃了Stable Diffusion,推出一款AI作图的产品Photosonic AI。Stable Diffusion是一个在GitHub上完全公开免费的模型,但WriteSonic并未在产品中标注技术来源,该公司创始人也未做回应,等于是默认了[4]。
成熟的能力、开放的模型,给人工智能行业带来了新机遇,也带来了大量鱼龙混杂的AIGC项目,但是资本对此并不介意,甚至开始抢起项目。
有人旗帜鲜明,有人举棋不定
今年9月19日,红杉资本两名合伙人黄松雅(音译,Songya Huang)和帕特·格雷迪(Pat Grady)用GPT-3写了一篇名为《生成式AI,一个创造性的新世界》的文章。
文章提到,AIGC正在变得更快、更便宜,而且在某些情况下比人类的创作质量更高,并表示“AIGC有潜力产生数万亿美元的经济价值”。
但一级市场的投资热,在此之前已经开始。
有投资人称,AIGC投资从今年七八月开始热了起来,到9月已经铺天盖地了。西南某新一线城市投资经理也告诉果壳硬科技,今年下半年陆续看过几个AIGC的案子,但因为项目一般,并未出手。
10月17日,Stability AI宣布获得来自Coatue和光速创投领投的1.01亿美元投资,投后估值达10亿美元,被媒体“尊为”AIGC领域首个独角兽。两日后,德州AIGC公司Jasper获得获得Insight Partners领投的1.25亿美元A轮融资,投后估值达15亿美元。
国内方面,今年以来有多家涉及AIGC业务的公司获得新融资,它们的融资时间几乎全部发生在7月后,天使轮融资占比近半。
对于AIGC公司来说,融资事关公司扩张。
研发算法和搭建、训练模型需要投入大量人力物力,比如1750亿参数的GPT-3,训练成本为1200万美元。另外,为了训练GPT-3,微软还投资5亿美元,专门为它搭建了一座超算中心,装载了一万张英伟达GPU。
即便套用现成的模型,也要租用大量算力维持服务,并且使用的人越多、占用的算力越大。这也是为什么大部分AI作画产品,不会无限制向用户提供免费服务——每一幅作品都有算力成本。
对于投资机构来说,AIGC可能会创造巨大的商业价值。
我们可以参照计算机视觉技术的发展趋势。晨山资本副总裁吴文超认为,计算机视觉技术发展时间超40年,但迟迟没有好的商业化途径。直到人脸识别、工业视觉检测等杀手级应用出现,计算机数据技术极大提升了生产力,也创造了大量社会价值和投资机会。而AIGC的技术成熟度较计算机视觉晚了3~5年,如今已经到了大爆发的前期[9]。
有AI行业投资人告诉果壳硬科技,AIGC行业到了商业化的重要节点已经是业内共识,不能错过这个机会。
AIGC能不能投,也有VC举棋不定。
北京某一线VC投资经理对果壳硬科技表示,在AIGC产品上,她更看好大公司而非创业团队,一方面大部分创业公司无法承担运行AI大模型的成本,另一方面大公司有先发优势,不过前提是方向和模式正确。
此外,她还认为AIGC无法替代创意工作者,无论生成的内容是什么,最终的创意来源都是人,而服务创作者就是AIGC产品最直观的落地方式。
AIGC,别靠玩梗赚钱了
无论是否投资AIGC,我们还是应该关注那些具有普遍意义的问题——
一个好的AIGC产品应该长什么样?
最近两个月,被拿来玩梗的AIGC一个个都出了圈,但梗图脱离了AI的生产力定位,无法带来商业价值。
在前述北京VC投资经理看来,投资AIGC就是“选商业模式”。AIGC无法替代创意工作者,无论生成的内容是什么,最终的创意来源都是人,而服务创作者就是AIGC产品最直观的落地方式。她对果壳硬科技表示,“能更好地替代创意工作者操作过程的AIGC,才是一个好的产品。”
不过,目前的AIGC产品距离“生产力工具”仍有距离。
AIGC能做到什么程度?
整体上看,目前AIGC产品辅助生产的作用有限。
果壳硬科技历史文章也提到了AI写作高度程式化、产品退居幕后的问题。至于音视频领域,AI也存在套旋律和效果生硬、画面猎奇等硬伤[10]。
在最有望替代基础画师的作画领域,AI的理解能力和易用性程度还不够强——出现了手脚不协调、口眼歪斜等不合常理的问题,包括“不会用筷子”和“不分鲑鱼和刺身”这样的著名翻车案例。
比如百度推出的AI作画产品“文心一格”,就给我创作了这么一张“双手持筷”的作品,而它的关键词是“一个用筷子吃盒饭的少女”。
总之,AIGC的能力还是不尽如人意。
我们离AIGC还有多远?
我们更加期待AIGC可以在一些高度商业化的领域发挥作用,比如电影工业。
制作难、成本高是制约CG电影发展的原因之一。比如《阿凡达》制作成本2.61亿美元,其中特效成本高达2亿美元。《变形金刚5》制作成本2.17亿美元;《变形金刚5》制作成本2.17亿美元,特效支出占1.3亿美元。
而中国信通院发布的《人工智能生成内容(AIGC)白皮书(2022年)》提到,AIGC能够合成虚拟场景,结合抠像技术,将无法实拍或成本过高的场景生成出来[11]。2017年播出的《热血长安》, 剧中的大量场景便是通过人工智能技术虚拟生成。
虽然仍有观众对AI生成的视频场景评价褒贬不一,但至少我们已经看到了AIGC应用的影子。
AI智能作画拥有比玩梗更广阔的前景。
东京大学和日本电信电话株式会社研究发现静态喷涂碳电极,环保电池来了。
在特斯拉驾驶室安装摄像头的已经早有其人,网上类似视频也较多。
特斯拉的刹车再次“失灵”但这次应该能水落石出了
新能源不等于不安全。