AIGC行业快评:GPT-4、文心一言陆续发布场景落地逐步成为AIGC产业核心

文档编号:2608224 上传时间:2023-05-28 格式:PDF 页数:12 大小:2.70MB
下载 相关 举报
AIGC行业快评:GPT-4、文心一言陆续发布场景落地逐步成为AIGC产业核心_第1页
第1页 / 共12页
AIGC行业快评:GPT-4、文心一言陆续发布场景落地逐步成为AIGC产业核心_第2页
第2页 / 共12页
AIGC行业快评:GPT-4、文心一言陆续发布场景落地逐步成为AIGC产业核心_第3页
第3页 / 共12页
点击查看更多>>
资源描述

1、请务必阅读正文之后的免责声明及其项下所有内容证券研究报告|2023年03月17日超 配1AIGC 行业快评GPT-4、文心一言陆续发布,场景落地逐步成为 AIGC 产业核心 行业研究行业快评 传媒 投资评级:超配(维持评级)证券分析师:夏妍021-执证编码:S0980520030003证券分析师:张衡021-执证编码:S0980517060002事项:1)3 月 16 日下午 2 点,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式 AI 产品文心一言。百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解

2、、多模态生成五个使用场景中的综合能力。2)3 月 15 日凌晨 1 点,OpenAI 发布了期待已久的 GPT-4。GPT-4 相比以往版本的最大变化是跨模态、长内容的解决能力,同时 GPT-4 具有更广泛的通识知识和问题解决能力,可以更有效的解决难题。国信传媒观点:1)GPT-4 主要亮点在多模态和长内容解决能力,文心一言国产大模型终于问世,二者背后本质是生成式 AI 的确定性产业趋势,技术底座夯实之下,应用场景将迎来实质性变革;2)多家 A 股传媒上市公司宣布接入百度文心一言,具体来看,有望在虚拟人、文本生产、虚拟空间、交互对话、内容宣发、数字营销等场景开展探索布局;3)从单一模态到多模态

3、,GPT-4 有望真正带来内容端、平台端的重估。微软 GTP4、谷歌 PaLM-E 类跨模态模型可以处理更复杂的任务,使得通用大模型逐渐成为可能。除此以外,我们看到了预训练大模型成本可控及轻量化运行的趋势,这使得“通用大模型”+“垂直小模型”有望落地至具体场景,基于此诞生的类“内容大脑”的操作系统,让 AI 时代的新物种成为可能。从生产力到商业化应用,基于科技及产业视角聚焦传媒互联网关键环节核心标的,建议关注:1)数据要素及 IP 角度推荐中文在线(文学 IP 及内容数据与平台)、掌阅科技(文学 IP 及内容数据与平台)、视觉中国(图片素材)、中国科传(科技文献资源)、浙数文化(数据要素及交易

4、平台、云计算服务等)、人民网(数据确权及内容审核)、新华网(数据确权及 AIGC 算法平台)等标的;2)场景落地关注文学、音乐、数字人、营销服务、电商、视频、游戏等领域,推荐汤姆猫(人机对话游戏场景落地)、昆仑万维(算法工具、AIGC 在浏览器、游戏、社交等场景落地)、蓝色光标(数字人&营销服务)、天娱数科(ChatGPT+数字人)、三人行(营销场景)、哔哩哔哩(UGC、PUGC 内容平台)、芒果超媒(在线视频)、恺英网络(游戏开发及 NPC 对话等场景)、宝通科技(VR/AR 场景)等标的。风险提示:国内内容监管问题无法接入 ChatGPT;应用场景产品落地不及预期;预训练大模型成本高昂,企

5、业需求端尚不明晰;国产大模型效果低于预期。评论:百度:“文心一言”正式发布,关注其应用生态接入进展3 月 16 日下午 2 时百度在北京总部召开发布会,主题围绕新一代大预言模型、生成式 AI 产品文心一言。百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。请务必阅读正文之后的免责声明及其项下所有内容证券研究报告2图1:百度发布会展示文心一言五个使用场景中的综合能力资料来源:百度文心一言发布会,国信证券经济研究所整理具体来看:1)文学创作:发布会上李彦宏通过与文心一言围绕三体的 6

6、 轮连续对话展示了文心一言对事实性问题的检索回答能力、总结分析能力和推理能力。关于事实性问题回答的正确率方面,文心一言采用了知识增强和检索增强,通过 5500 亿实时数据训练,可以保证事实性的回答能够比较准确。2)商业文案创作:通过三轮连续问答,文心一言完成了为公司起名、生成 Slogan 和生成公司成立的新闻稿三项任务,展现大模型的理解能力、表达能力和创意创作能力。3)数理逻辑推算:可解决鸡兔同笼问题,在两轮鸡兔同笼问题中文心一言能够识别问题提得对不对,并展现解题推理步骤提供正确答案。4)中文理解:文心一言具备领先的对中文和中国文化的理解能力,可以解释“洛阳纸贵”的意思、其中的经济学原理,并

7、用“洛阳纸贵”写了一首藏头诗。5)多模态生成:在四轮问题交互中,文心一言完成通过文字生成图片、回答相关问题、用方言生成音频和用这些内容生成视频的任务。当前除了视频生成功能由于计算成本较高暂未开放,其他功能已向文心一言的用户开放。图2:文心一言的界面图3:与文心一言围绕三体的提问资料来源:百度文心一言发布会,国信证券经济研究所整理资料来源:百度文心一言发布会,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容证券研究报告3图4:文心一言完成为公司起名任务图5:文心一言解决两轮鸡兔同笼问题资料来源:百度文心一言发布会,国信证券经济研究所整理资料来源:百度文心一言发布会,国信证券经济

8、研究所整理图6:文心一言用“洛阳纸贵”作藏头诗图7:文心一言通过文字生成图片海报资料来源:百度文心一言发布会,国信证券经济研究所整理资料来源:百度文心一言发布会,国信证券经济研究所整理从技术栈上看,AI 时代技术栈有四层,分别为芯片层、框架层模型层和应用层。文心一言、文心一格都是属于模型层,文心是百度模型的一个品牌。AI 时代的应用譬如搜索、聊天和其他的应用会基于这些大模型来进行开发。文心一言定位为一个通用的基础模型,未来大模型或扩散拓展为“通用大模型”+“垂直小模型”,产生譬如能源模型、交通模型、媒体模型等“垂直小模型”实现场景落地。文心一言发布会提出三方面的机会:1)新型的云计算,云计算的

9、商业模式由 IaaS 变为 MaaS(Model as aService),应用或建立在大模型上而不是云算力或云储存上;2)行业模型的调精,行业将其数据、理解和知识与大模型相结合产生中间层的行业大模型,通过各个行业的模型的精调实用性更强;3)应用开发,在大模型基础服务之上产生的具有文字生成、图像生成、音频生成,以及数字人等能力的现象级新应用和新产品。从 2 月 7 日百度官宣发布文心一言,至今已有 650 家企业宣布接入文心一言生态。图8:AI 时代的四层技术栈图9:百度认为大模型的三大产业机会资料来源:百度文心一言发布会,国信证券经济研究所整理资料来源:百度文心一言发布会,国信证券经济研究所

10、整理请务必阅读正文之后的免责声明及其项下所有内容证券研究报告4 微软:多模态 GPT-4 来袭,AIGC 的应用场景端有望真正打开3 月 15 日凌晨 1 点,OpenAI 发布了全网期待已久的 GPT-4。GPT-4 的最大变化是跨模态、长内容的解决能力。同时 GPT-4 具有更广泛的通识知识和问题解决能力,可以更有效的解决难题。图10:OpenAI 发布跨模态大模型 GPT-4资料来源:推特,国信证券经济研究所整理相比前一代 GPT,GPT-4 的优势体现在:1)更有创造力:GPT-4 更具创造性和协作性,可以与用户一起生成、编辑和迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的

11、写作风格。2)视觉输入:GPT-4 可以接受图像作为输入并生成说明、分类和分析。GPT-4 可以看图说话,并并分析图表。3)处理更长的上下文:GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。GPT-4 的高级推理能力超越了 ChatGPT,处理复杂任务时 GPT-4 更可靠、更有创造力,并能够处理比较微妙的指令。请务必阅读正文之后的免责声明及其项下所有内容证券研究报告5图11:GPT-4 对文本交互的精准度和创造性进一步提升图12:GPT-4 能够理解图片中的逻辑资料来源:Open AI,国信证券经济研究所整理资料来源:Open

12、AI,国信证券经济研究所整理图13:GPT-4 可处理复杂推理任务图14:OpenAI 公布 GPT-4 可在考试中超过 90%的人类资料来源:Open AI,国信证券经济研究所整理资料来源:Open AI,国信证券经济研究所整理基于 GPT-4,OpenAI 官方给了几款加入了 GPT-4 的产品应用,涉及教育、公益、金融等领域。1)Duolingo:一款语言学习类 APP,Duolingo 把 GPT-4 接入产品,进行角色扮演,让人工智能跟用户去对话,纠正语法错误,并且把这一功能融入产品的游戏化;2)Be My Eyes:一款为视力障碍人士提供的产品,大部分的盲人类产品都只能识别文字,现

13、在可以借助 GPT-4 的图像识别分析来看世界;3)摩根士丹利:摩根士丹利的内容库包含数十万页的知识,涵盖投资策略、市场研究和评论以及分析师见解,借助GPT-4 改变其财富管理人员查找相关信息的方式;4)可汗学院是一家非营利组织,其使命是为任何地方的任何人提供免费的世界一流教育。该组织为所有年龄段的学生提供数以千计的数学、科学和人文课程宣布将使用 GPT-4 为 Khanmigo 提供支持,Khanmigo 是一种人工智能助手,既可以作为学生的虚拟导师,也可以作为教师的课堂助手。请务必阅读正文之后的免责声明及其项下所有内容证券研究报告6图15:Duolingo 接入 GPT-4图16:Be M

14、y Eyes 接入 GPT-4资料来源:Open AI,国信证券经济研究所整理资料来源:Open AI,国信证券经济研究所整理图17:摩根士丹利接入 GPT-4图18:可汗学院接入 GPT-4资料来源:Open AI,国信证券经济研究所整理资料来源:Open AI,国信证券经济研究所整理 大模型不断升级,海外到中国,生成式 AI 浪潮已来从中国本土化大模型来看,目前国内大模型处于投入期,除了互联网巨头,还有科研机构等三方不断投入预训练大模型。相对而言看,百度在 AI 领域的长期持续投入,1)ChatGPT 仍有内容监管漏洞,接入国内自己的大模型更加自主可控;2)从微软当前动态来看,ChatGP

15、T 仍未对中国用户开放注册,同时微软宣称将允许其他公司依据 ChatGPT 创建定制版本的模型,但仍未宣布具体时间表及实现路径;3)从百度的技术路径上看,百度在 AI 方面布局早,预训练大模型技术积累深,拥有海量中文自然语言数据,从数据上或更贴合中文自然语言模型的应用落地。表1:国内预训练大模型梳理序号发布时间大模型发布机构参数量训练数据模态功能是否开源12021 年 4 月PLUG阿里270 亿高质量中文训练数据(1TB以上)文本自然语言理解(NLU)、文本生成开源22021 年 4 月盘古-华为2000 亿40TB 训练数据文本自然语言理解、文本生成-请务必阅读正文之后的免责声明及其项下所

16、有内容证券研究报告732021 年 4 月孟子澜舟科技10 亿基于数百 G 级别涵盖互联网网页、社区、新闻、电子商务、金融等领域的高质量语料训练文本、图像自然语言理解、文本生成-42021 年 6 月M6阿里1000 亿超过 1.9TB 的图像和292GB 的文本文本、图像文本生成图像、图文匹配、图像描述-52021 年 6 月悟道 2.0智源研究院1.75 万亿-双语多模态大模型NLP 理解、生成任务与文生图、图生文任务开源72021 年 7 月ERNIE 3.0(文心)百度2600 亿-多模态大模型语言理解、语言生成、图文生成-2021 年 9 月紫东太初中科院自动化所千亿-三模态大模型通过跨模态语义关联达成视觉、文本、语音三模态同意表达和高效协同开源82021 年 9 月源 1.0浪潮信息2457 亿在海量中文互联网上收集整理了超过 5000G 的高质量中文训练数据集文本文本生成开源92022 年 4 月混元腾讯万亿级别-跨模态大模型已落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户-102022 年 5 月CogVideo清华94 亿-文本生成视频目前最大的通用领域

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 行业资料 > IT网络

启牛文库网为“电子文档交易平台”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。

本站是网络服务平台方,若您的权利被侵害,请立刻联系我们并提供证据,侵权客服QQ:709425133 欢迎举报。

©2012-2025 by www.wojuba.com. All Rights Reserved.

经营许可证编号:京ICP备14006015号