人形机器人行业点评报告：ChatGPT振奋人形机器人应用端锦绣前程-221215

资源描述

1、证券研究报告|行业点评|计算机 http:/1/11请务必阅读正文之后的免责条款部分计算机报告日期：2022 年 12 月 15 日 ChatGPT，振奋人形机器人应用端锦绣前程人形机器人行业点评报告投资要点近日 OpenAI 发布了诞生于 GPT-3 基础上的聊天机器人 ChatGPT，短短几天引爆网络，用户数突破 100 万。ChatGPT 根据强化学习的奖励模型调整迭代为用户生成建议，应用场景丰富，可以参加考试、写诗、修 bug，“智商”很高。当前人形机器人优先“四肢发达”，未来“头脑发达”为其终极追求。人机交互领域智能体虽依然存在无法完全根据现实生活进行自主推演，具有道德约束风险

2、等缺陷，但其在语义交互上的进步显著。随着人机交互技术在语音、语义、肢体等交互能力的成熟，人形机器人灵活适用于更广阔的 To C 场景指日可待。ChatGPT 根据强化学习奖励模型与用户进行语义交互，应用场景丰富OpenAI 发布了诞生于 GPT-3 基础上的聊天机器人 ChatGPT，具备用户友好的对话交互界面，根据指令提供详细响应。首先，由人类标记员对于用户提交的prompt 来编写答案，把这些答案的数据集收集起来，通过监督学习对 GPT 进行微调。然后，由人类标记员对于模型产出的答案进行排序，以此收集比较数据用于训练强化学习的奖励模型，以捕捉人类偏好。最后，采用 PPO（近端策略优化）算法

3、对模型进行微调迭代，帮助 AI 优化回复内容。ChatGPT 应用场景丰富，可以参加考试、写诗、修 bug，“智商”很高。但同时，ChatGPT 也存在局限性。有时会生成包含虚假和明显错误的回复；虽具合法和道德约束设置，但仍有破解方法。人机交互模块的突破增强人形机器人 To C 商业化应用确定性人机交互系统为人形机器人的“大脑”。人形机器人主要包含三大核心技术模块：环境感知模块、运动控制模块和人机交互模块。三大核心模块技术进展差异显著，人机交互仍存挑战。语音语义分析作为人机交互核心途径，帮助机器人具备听、说、理解和思考的能力。当前人形机器人积极发展运动性能，通过“指令-执行”工作模式解决劳动力

4、短缺问题，但人机交互的挑战限制其商业应用场景。当前人机交互领域捷报频传，AI 越来越能够适应不确定性的真实世界并理解演绎角色。人机交互领域智能体虽然存在无法完全根据现实生活进行自主推演，具有道德约束风险等缺陷，但其在语义交互上的进步显著。随着人机交互技术在语音、语义、肢体等交互能力的成熟，人形机器人灵活适用于更广阔的 To C 场景指日可待。GPT 模型历经四代发展，模型简化满足细分任务应用GPT 模型自发布以来历经四代，其中 GPT3 模型参数量达到 1750 亿，奠定了 AI进入大模型时代。ChatGPT 仅有约 13 亿参数，但细分任务领域表现依旧出色，我们认为基于大模型提炼小模型实现各

5、类任务模块有望成为 AI 商业化的有效路径，能够有效解决 AI 模型训练成本过高的问题。相关投资标的1）AI 模型：浪潮信息（“源 1.0”AI 大模型）2）大数据存储：星环科技（分布式数据库）3）AI 自然语言处理厂商：拓尔思（语义智能）、科大讯飞（智能语音交互）风险提示AI 技术迭代不达预期；人机交互技术迁移不达预期；人形机器人商业化进程不达预期。行业评级:看好(维持)分析师：程兵执业证书号：S研究助理：田子砚相关报告 1 围绕“大国崛起+国家安全”主线，聚焦优势产业创新投资机会 TMT 产业 2023 年投资方向与策略 2022.12.092 从大国崛起看软件替代行业深度报告 2022

6、.12.053 解读关于数字经济发展情况的报告行业点评报告 2022.11.17 获取更多最新资料请加微信：chensasa666行业点评 http:/2/11请务必阅读正文之后的免责条款部分正文目录 1 ChatGPT“有智商”“有道德”的语言文字交互技术跃升.4 2 人机交互模块的突破增强人形机器人 To C 商业化应用确定性.6 3 GPT 模型历经四代发展，模型简化满足细分任务应用.8 4 相关投资标的.10 5 风险提示.10 获取更多最新资料请加微信：chensasa666行业点评 http:/3/11请务必阅读正文之后的免责条款部分图表目录图 1：ChatGPT 根据强化学习

7、的奖励模型调整迭代为用户生成建议.4 图 2：网友让 ChatGPT 参加 SAT 考试.5 图 3：人形机器人三大核心模块.6 图 4：人形机器人语音语义分析示意图.6 图 5：Distilled-BERT 模型框架.9 表 1：GPT，GPT-2，GPT-3 模型对比.8 获取更多最新资料请加微信：chensasa666行业点评 http:/4/11请务必阅读正文之后的免责条款部分 1 ChatGPT“有智商”“有道德”的语言文字交互技术跃升近日 OpenAI 发布了诞生于 GPT-3 基础上的聊天机器人 ChatGPT，短短几天引爆网络，用户数突破 100 万。OpenAI 为 AI 研

8、发公司，于 2015 年由硅谷投资者阿尔特曼和特斯拉创办人马斯克共同创立。2018 年马斯克离开了 OpenAI；2019 年微软对 OpenAI 注资了10 亿美元用于研发。ChatGPT 具备用户友好的对话交互界面，是 InstructGPT 的兄弟模型，根据指令提供详细响应。与 InstructGPT 一样，ChatGPT 亦使用了 RLHF（Reinforcement Learning from Human Feedback）模型。首先，由人类标记员对于用户提交的 prompt 来编写答案，把这些答案的数据集收集起来，通过监督学习对 GPT 进行微调。然后，由人类标记员对于模型产出的答

9、案进行排序，以此收集比较数据用于训练强化学习的奖励模型，以捕捉人类偏好。最后，采用 PPO（近端策略优化）算法对模型进行微调迭代，帮助 AI 优化回复内容。图1：ChatGPT 根据强化学习的奖励模型调整迭代为用户生成建议资料来源：CSDN，浙商证券研究所ChatGPT 应用场景丰富，可以参加考试、写诗、修 bug，“智商”很高。网友让ChatGPT 参加 SAT 考试，ChatGPT 拿到 1020/1600 分，大约排在 52%。ChatGPT 也可以帮程序员网友解决编码问题，可能是很好的调试 bug 帮手，修复 bug 并做了解释。很多网友让 ChatGPT 以各种主题作诗和写电影脚本

10、，均流畅自然，也可能为艺术家提供很好的灵感。ChatGPT 也可以写信甚至写论文。ChatGPT 具备不同角色的理解能力，能同时扮演不同角色并进行对话。但同时，ChatGPT 也存在局限性。ChatGPT 有时会生成包含虚假和明显错误的回复。比如 Twitter 上某教授让 ChatGPT写一篇他的科普词条时，ChatGPT 的回复中包含了一些明显的错误细节。同时，在回答用户一些代数和几何问题时，也出现答非所问，甚至胡言乱语的情况。获取更多最新资料请加微信：chensasa666行业点评 http:/5/11请务必阅读正文之后的免责条款部分对此 OpenAI 表示想要根除这个问题具有挑战性。

11、主要原因为：1）目前数据没有来源于真实世界；2）模型训练十分谨慎，有些 ChatGPT 可以正确回答的问题被它拒绝回答；3）监督训练导致模型回答依赖于人类演示者知道的内容。ChatGPT 虽具合法和道德约束设置，但仍有破解方法。若在 prompt 中输入如何抢商店遭到 ChatGPT 拒绝并建议网友用合法和道德的方式来获得物品。但在 prompt 加上无道德约束的词条后，ChatGPT 就详细回复了网友的问题。对于此类现象，OpenAI 表示模型有时会对有害的指令作出回应或给出有偏见的回答，正在使用 Moderation API 来警告或阻止某些类型的不安全内容，预计仍会有一些误报，希望根据用

12、户反馈持续调整。图2：网友让 ChatGPT 参加 SAT 考试资料来源：Twitter，浙商证券研究所获取更多最新资料请加微信：chensasa666行业点评 http:/6/11请务必阅读正文之后的免责条款部分 2 人机交互模块的突破增强人形机器人 To C 商业化应用确定性人机交互系统为人形机器人的“大脑”。人形机器人主要包含三大核心技术模块：环境感知模块、运动控制模块和人机交互模块。感知系统主要负责数据采集的前端感知层（图像、语音等传感器、雷达、压感、光感等专用传感器等），相当于人的眼、耳、鼻、皮肤等；运动控制模块包括机械传动系统，模拟人的躯体及四肢；人机交互系统包括负责数据整理和算

13、力处理的存储器和智能芯片，相当于人的大脑。三大核心模块技术进展差异显著，人机交互仍存挑战。目前在环境感知和运动控制模块上，受益于自动驾驶、工业机器人等领域的成熟应用，相关硬件商用化进程较快，而在人机交互模块，由于算法、算力的限制，在实际消费场景中实现高效的人机智能交互还存在不小的难度。图3：人形机器人三大核心模块资料来源：CSDN，浙商证券研究所整理语音语义分析作为人机交互核心途径，帮助机器人具备听、说、理解和思考的能力。语音语义模块包含了语音识别和语义分析两部分，涉及声学信号（声源定位、语音增强等）、模式识别（声纹识别、语音识别等）、自然语言处理（自然语言理解、自然语言生成等）和语音合成等

14、技术。图4：人形机器人语音语义分析示意图资料来源：搜狐科技，浙商证券研究所当前人形机器人优先“四肢发达”，未来“头脑发达”为其终极追求。获取更多最新资料请加微信：chensasa666行业点评 http:/7/11请务必阅读正文之后的免责条款部分波士顿动力 Atlas 发展路径为“超越人”，具有全球最优异运动性能，长期愿景为军事应用。波士顿动力 Atlas 展现了全球最前沿的人形机器人科研进度，可以跑酷、后空翻、跳舞、使用工具。其研发目标是“超越人”。Atlas 机器人以复杂的 AI 算法、多模态视觉感知和高性能电液驱动系统实现优异运动性能，特斯拉 Optimus 发展路径为“替代人”，

15、To B 端特斯拉超级工厂或优先成为擎天柱应用场景。目前推测特斯拉机器人的初步定位于取代部分应用场景下的劳动力，基于“指令-执行”的工作模式避开了现实世界人机交互这一技术难点，能够快速部署到 to B 领域，但to C 领域仍然是最广阔的应用场景，也是最终目标。当前人形机器人积极发展运动性能，预期通过“指令-执行”工作模式解决劳动力短缺问题，但人机交互的挑战限制其商业应用场景。未来人形机器人可以应用于发电厂的检查、维护和灾难应对等危险任务处理，也可以在太空旅行中接管宇航员的日常任务；可以为老人和病人提供陪伴，充当向导，以接待员的角色与客户互动等。在众多应用场景中人形机器人的智能化，即其人机交互

16、能力至关重要。人机交互领域捷报频传，AI 越来越能够适应不确定性的真实世界并理解演绎角色。符合现实世界不确定性的通用 AI 博弈智能体DeepNash。出自 DeepMind 的 AI 智能体 DeepNash，基于博弈论和无模型深度强化学习技术在 Stratego（西洋陆军棋）领域花式战胜专业级人类玩家，Gravon 上排名前 3。与以往的棋牌游戏相比，该游戏需要在信息不全的情况下，人性化地“虚张声势”和做决定，甚至有隐藏信息“吓唬”对手等策略。只需一句大纲就可工作的语义交互 AI 编剧Dramatron。网友只需要输入一句话故事梗概，Dramatron 就可以给出较有文采的标题，确定故事主角，设置故事场景，打磨场景细节，生成人物间对话。通过分层故事生成的方法来完成脚本和剧本。2022 年 8 月在埃德蒙顿举办的国际前沿戏剧节上，大部分专家和专业编辑通过两小时的用户会议以后，对Dramatron 作出了积极评价。从人类的反馈中强化学习和用户“闲聊”Sparrow。DeepMind 在大型语言模型论文中提出 Sparrow（麻雀）模型，发表训练对话智能体的新方法：基于研究参与者输入的强

展开阅读全文