【世界播资讯】拳打谷歌ChatGPT火出圈!投资人称更需警惕投资泡沫化跟风
一夕之间,ChatGPT突然火了。
所谓ChatGPT,是在今年11月30日,由人工智能实验室OpenAI上线的新模型,其网页应用允许用户免费使用,目前用户与ChatGPT之间的对话互动包括了普通聊天、信息咨询、撰写诗词作文、修改代码等,甚至令用户产生ChatGPT能否取代谷歌等搜索引擎的疑虑。
(资料图片)
一位技术领域人士认为,让ChatGPT 类平台、以及短视频平台或购物社交平台来取代搜索引擎,容易让知识来源单一化,这是危险的。东吴证券团队也认为,ChatGPT模型仍无法很好解决虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,因此其本质仍偏向AIGC内容生产工具,而非搜索引擎。
此外,ChatGPT火速出圈,但对话过程中也经常会发生因语料积累不足而产生的“事故”。多位AI界行业人士对第一财经记者表示,无需因ChatGPT的智能而对AI产生恐惧,ChatGPT的出圈本质是算力与样本量提升后得到的自然结果,更需警惕的是将ChatGPT归属于AIGC赛道后引发的创业与投资泡沫。
马斯克在推特上分享的跟ChatGPT的对话截图
“上瘾”的聊天AI
据官网介绍,计算模型GPT-3.5支持的通用聊天机器人ChatGPT,能回答连续性的问题、承认自己的错误、质疑不正确的假设,甚至拒绝不合理的需求。从写剧本、写诗、设计游戏,到给程序找bug,乃至制定一份“毁灭人类”的计划,这个AI能做的事情超乎想象。
美国企业家马斯克询问了ChatGPT如何设计Twitter,AI回答称:“为了使用户更容易查看线程互联网对话并与之交互,你可以将线性一维界面转换为二维无限网格。”
有人认为,ChatGPT的出现堪比AlphaGo打败李世石。12月5日,OpenAI创始人兼CEO阿尔特曼(Sam Altman)发布推文表示,ChatGPT用户数已突破了100万。在这条推特下,马斯克询问“每次聊天的平均费用是多少”, 阿尔特曼回复表示,“用户平均每次聊天所花费的可能是个位数美分。”
目前ChatGPT仍处于免费测试阶段,不限量向公众开放,基于其破百万的用户数,平台所花费的成本不算小。不过,在使用过程中,用户提供的反馈对OpenAI也是最有价值的信息,可以不断训练语言模型,修正错误答案。
第一财经记者注册并体验了一下ChatGPT对话。虽然目前ChatGPT并没有开放给中国地区的用户,但界面仍可使用中文。记者首先让AI自我介绍,其回复,“我是Assistant,一个由 OpenAI 训练的大型语言模型。我的工作是帮助人们回答各种问题,尽可能提供准确和详细的信息。我可以回答各种问题,无论是关于历史、科学、人文还是其他话题。”
计算机领域从业人士高毅对第一财经表示,试用ChatGPT的体验很奇妙,一个聊天AI 能写代码,能用“意念”分析代码,甚至能用“意念”分析一个超时程序的运行结果,“一开始以为他打开了个gcc 或者 python 之类的外部进程辅助分析,但试下来感觉并不是这样,而是他真的像人一样在试图理解这些代码。”
高毅故意提供了一些有问题的输入程序,使其根本无法正确执行,还故意给了个有生之年无法运行结束的程序,而ChatGPT像人而非机器一样,无视了上述这些不重要的问题,转而专注于问题的核心点,并在有限时间内给出了解答,“虽然他回答有小的错误,但能够做到这一步真的已经非常厉害了。”
东吴证券研报分析认为,ChatGPT的模型经历从GPT到GPT3的升级,优化主要来自算力增加。GPT、GPT-2和GPT-3在算法模型并没有太大改变,但参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,其中GPT-3训练一次的费用是460万美元,总训练成本达1200万美元。虽然训练数据量和算力大幅增加使GPT-3有显著优化,但高额投入也使其只能走B端变现。
此次ChatGPT出圈,其技术模型最大变化出现在2022年推出的GPT3.5,技术迭代成优化来源于1月发布的InstructGPT模型中增加了人类对模型输出结果的演示,并在对结果进行排序的基础上训练,加上指令调整的帮助,虽然其只有13亿个参数,但回答准确率、道德表现却好于GPT-3。
ChatGPT虽然强大,仍然有其局限性,比如偶尔会犯错误,有一定的误导性;作为一个AI,它也不能提供对人或事件的判断和评价。但基于其反馈强化学习系统,ChatGPT也在不断学习完善。有用户表示,前几天问ChatGPT的时候提供的错误答案,过了一天之后就已经被修正,或许是很多用户的反馈帮助ChatGPT对正确的答案进行了排序。
日常对ChatGPT进行调戏逗乐仅是娱乐项目,一旦作为严肃工作内容,则需要严谨对待。据了解,程序员交友网站Stack Overflow上已出现大量通过ChatGPT自动生成的内容,给Stack Overflow的质量管理造成影响。Stack Overflow方面发布公告称,由于从ChatGPT中获得正确答案的平台比率太低,发布由ChatGPT创建的答案对网站和询问者以及寻找正确答案的用户都有很大危害。“禁止用ChatGPT直接生成垃圾答案,否则封号。这是一个临时性规定,目的是应对目前论坛上ChatGPT生成内容的泛滥之势。”
对此,ChatGPT回应称,“因为AI生成的答案不总是准确或相关的,可能会导致Stack Overflow上混淆错误答案,误导在寻求帮助的用户。”“Stack Overflow禁止用AI生成答案是合理的。”阿尔特曼也表示,正试图阻止ChatGPT随机编造,现阶段让其与当前技术保持平衡是很棘手的。随着时间的推移,会根据用户反馈来改进。
对AI无需过分恐慌
开发出ChatGPT的公司是何来头?公开信息显示,ChatGPT由人工智能公司OpenAI开发,成立至今已经七年,坊间传言其最新估值已达到两百亿美元。
OpenAI最初是由马斯克、阿尔特曼等六人在2015年联合创办,最初为非营利性机构。2018年马斯克宣布退出,2019年,OpenAI宣布重组为一家“有限营利(capped-profit)企业”,并接受了微软10亿美元的投资,双方表示将合作替Azure云端平台服务开发人工智能技术。此次推出的ChatGPT也是在微软Azure AI服务器上完成的训练。
阿尔特曼在12月6日发布的推文中感谢微软和Azure,他表示,微软和Azure做了大量的工作,构建了迄今为止最好的AI 基础设施,但目前并没有因为OpenAI 推出的东西而获得足够的荣誉。
此次ChatGPT的火热出圈也引发外界对AI是否即将战胜人类的恐慌。但多位AI界面人士对记者称,目前ChatGPT更多是算力与语料调教后的正常结果。
据国盛证券研报,ChatGPT的背后离不开大模型、大数据、大算力,其技术底座使用的是微调后的GPT-3.5系列模型,有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。GPT-3.5在微软Azure AI超算基础设施上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。
针对外界认为ChatGPT可以取代搜索引擎的观点,前Google总部科学家、出门问问创始人李志飞认为,相对于语音助手和搜索引擎,ChatGPT目前还有很多不能干或干不好的实情,如不能查询附近的川菜馆,不能进行打电话、定日历、播放歌曲等手机本地操作。此外,ChatGPT大概率不能回答训练时它没有看到的最新网页知识,不一定能正确回答一个五年前政治人物今年的年龄,大概率不能做对简单的逻辑题和加减乘除题。
总结来说,李志飞认为,ChatGPT的“认知”建立在虚拟训练文本上,没有跟实时的数据库或信息连接,也没有显式的逻辑推理,仍有些“空中楼阁”的味道,所以特别适合插科打诨。
虽有不少声音将ChatGPT与谷歌等搜索引擎对比,但东吴证券团队认为,由于ChatGPT模型仍无法很好解决虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,因此其本质仍偏向AIGC内容生产工具。搜索引擎核心是海量信息集合,而非信息创造;但在“存在标准答案”的编码、数学计算等领域,ChatGPT或将对搜索引擎产生一定冲击。其次,相比更多面向B端客户的GPT-3,C端学习和使用成本低、产出效果好的ChatGPT有望助力AIGC破圈,并在接收海量用户反馈的过程中继续迭代,推动AIGC文字内容生产走向全民化。
不少游戏人士和插画人士也开始关注ChatGPT,但不少用户在使用之后反馈表示ChatGPT并没有想象中那么智能。有一位游戏行业人士发现,ChatGPT对于2021年之后发生的事情似乎了解得并不多,“问它《原神》,它不知道稻妻(原神的一个地名)是哪里。”该用户说。另有用户向ChatGPT提问“《原神》的开发公司是哪家”,得到的回应不是米哈游而是腾讯。
对此,另一位用户表示,目前ChatGPT的学习的数据样本只截止到2021年,等到训练的人数增加了,反馈内容的质量便会有所提升。此外,部分用户向记者反馈认为,ChatGPT在不同语种的识别和解读上存在差异,使用中文和同样内容转译成的英文输入得到的反馈结果并不相同。
尽管目前ChatGPT仅能实现文字应答,但是不少插画人士也开始利用ChatGPT工作。一位插画师告诉记者,对于目前市面上流行的AI绘画软件stablediffusion,插画师常苦于反复修改提示语但仍无法得到理想的结果。不过ChatGPT提供了一个新的思路:用于生成指导AI作画的提示语模板,即利用AI告诉AI如何作画。“相当于把ChatGPT当成一个人类惯用语和ai绘画能理解的语言中间的翻译器,只需要在它生成的模板中填写几个关键词然后粘贴到stablediffusion就好了,经过ChatGPT转换后的指令成的图比原先手动输入的内容相比要好很多。”
相较而言,人工智能研究专家、创新工场人工智能工程院执行院长王咏刚持有更谨慎的态度,他表示,其一,AI创作目前在知识教育领域争议很大,例如王咏刚杜撰了一个学术概念“镜像等离子规范场”,但ChatGPT竟然真的一本正经地进行了解读。
王咏刚称,ChatGPT的模仿能力和文笔越好,这个未来风险就越值得重视且需要提前应对。今天的AI生成理论,还没办法保证生成内容的逻辑正确与合理;建立人类领域专家参与的AI训练过程,发展与正确性相关的增强学习算法可能会是未来的一个AI科研热点。
其二的担忧点在于AI/CS专业人需保持冷静,王咏刚认为,面对大幅提升多轮对话能力的ChatGPT,越是AI/CS的从业者越是不能一味地顶礼膜拜;最起码,应该有测试和验证的精神,不断探索新模型的能力上限,甄别模型生成答案时真正的“记忆认知”和基于特征相似性的“模仿游戏”。
警惕盲目跟风
ChatGPT的火爆让国内创投圈再次热议AIGC的投资价值,AIGC 全称AI-Generated Content,指利用AI技术寻找数据规律并泛化生成的内容。
国泰君安研发分析称,AI绘画是AIGC的一大重要分支,目前处于由简单的降本增效向创造额外价值升级的阶段,跨文字和图像的多模态内容成为关键的发展节点。2022年8月,Stable Diffusion、Midjourney等AI绘画应用因《太空歌剧院》作品的获奖而在海外迅速出圈,此后热度蔓延至国内,无界版图AI、意间AI等应用于9月底相继上线,其中意间AI用户数在42天内突破百万。此次ChatGPT仅用5天便实现百万用户数,AI问答及其他分支应用的热度有望持续攀升。
就技术层面而言,国泰君安称,模型效率、素材库丰富度是AIGC应用的核心竞争力。以AI绘画为例,此前流行的GAN模型存在一定局限性,包括从噪声/条件到最终结果的一步到位式生成方式难度较高,面对复杂数据时容易训练失败,跨模态生成效果较差等。但2022年出现的Diffusion模型在这三方面均有改善,模型迭代驱动多个AI绘画应用出圈。
并且此次OpenAI发布的ChatGPT模型较前代而言有较大进步,如减少不真实回答、避免有害回答、挑战用户问题前提等,同时还具备连续对话的记忆能力,人机交互体验更为逼真。丰富的内容素材库保障模型得到充分训练,并最终生成高质量内容,是AIGC应用的另一核心竞争力。
因此,浙商证券研报认为,ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、数据标注、自然语言处理(NLP)等。
至于ChatGPT加入后对行业造成的“威胁”,高毅表示,ChatGPT不一定能完全替代所有人,但可能是相对基础的那部分,“具体到软件行业,今天能离谱地生成和分析代码,那明天很有可能 PRD 文档都能直接生成软件产品,仅需少量资深产品研发测试等人力介入。作为从业者,平时还是得多想想,哪些技能是更深的、不那么容易被替代的。”
就目前ChatGPT存在的问题而言,主要是来自于训练过程和数据集的局限性,此次面向用户免费开放能够进一步强化训练,从而完善模型质量。国盛证券研究所发现,目前OpenAI等巨头已着手自建计算集群来满足AIGC的要求,这种集中式的训练对GPU、存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练,随着需求的增加,也有望转向自建集群。
今年以来,我国“东数西算”战略自上而下快速推进,作为数字经济的基础,“算力即权力”,其重要性不言而喻,此前国内厂商的更多互联网应用聚焦于“存”而非“算”,随着AIGC技术在全球的兴起,“东数西算”的算力需求将越来越显著。
未来随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,AIGC有望加速发展。但针对此次ChatGPT再次点燃创投圈内AIGC赛道的火热,王咏刚持有谨慎态度。2022年11月,王咏刚前往硅谷,拜访了多家投资公司、科技公司、创业团队,他发现科技圈里几乎人人都在谈论AIGC,似乎没有AIGC包装的创业项目就不是好项目,没有AIGC概念的科研就发不出好论文。
但实情的确如此吗?在后续与OpenAI两位联合创始人的交流中,王咏刚发现,对方会通过非常技术化、务实的心态谈论其工作计划与技术思考,但他们并不知道AIGC到底是什么意思,这令王咏刚非常诧异,思考之后王咏刚认为,“从科技上开创AIGC这个新领域的OpenAI创始人,其实并不需要知道类似AIGC之类纯粹用来包装科技概念的新名词。他们要研究的是大模型结构、并行训练加速、神经网络优化等等具体科学与技术。这样的人才是真正的创建者和领航者。”
目前国内AIGC一片火热,在王咏刚看来,其中一部分创业者、投资者、或将AIGC快速包装成应用产品的大多数,其实只是并无能力决定科技大方向的跟风者。“期望跟风者在AIGC这个大舞台上,不要过于头脑发热,还是要多判断一下,自己构建的所谓‘产品’,到底是有益于人类进步的,还是向已经碎片化的内容世界继续灌水或倾倒垃圾的。”王咏刚表示。