AI应用:乘产业技术趋势之风,星火燎原
时间:2024-12-10  

本篇报告,我们梳理了海外和国内市场关注度较高的AI应用,并从现阶段AI产业发展趋势的角度,分析各应用场景的受益程度。
通过self-play强化学习提升post-training推理能力,成为现阶段通向AGI的新范式。在去年强调预训练pre-training的scaling law遇到一定瓶颈后,以OpenAI o1模型为代表,AI产业开始转向以post-training的推理为重心,通过self-play强化学习,让AI不断自我交互并优化思维链,以取得在某个环境中的最大奖励。过去self-play强化学习局限在围棋等细分领域,但如果结合经过预训练大模型的通用性,有望提升其泛化能力。
强化学习需要“奖励目标”的特点/属性,指出现阶段AI应用的受益方向。根据强化学习框架,AI需要在环境中采取动作,并根据“奖励目标”来优化其策略。因此,reward value清晰的应用场景,更有助于AI通过self-play RL找到最优决策。基于此,由于self-play RL对决策式AI的提升更为直接,我们认为决策式AI的相关应用有望受益;同时,决策式AI与生成式AI结合的应用,或者是同时涵盖了模型pre-training后的生成能力与post-training后的思考能力的应用,也值得关注,如广告营销、教育、AI Agent等;多模态生成式AI的赋能则会主要在影视、游戏等内容创意向场景。AppLovin和Palantir所在场景都符合self-play RL的应用范式。

AI营销:决策式AI应用率先释放业绩,生成式AI应用空间广阔。

AI教育:生成式AI提升教学内容生成速度和质量,self-play RL学习解题思路、提供个性化学习建议。

AI电商:AI Agent重要适用场景,有望赋能买卖双方。

AI视频:多模态生成式AI对不同影视形态的赋能节奏有所不同。

风险提示:国内大模型能力提升不及预期制约AI应用发展;AI应用效果不佳导致用户生态和付费意愿偏弱;AI应用市场竞争加剧。


声明:上述内容仅为该篇证券研究报告的内容摘要,完整的观点应以方正证券研究所发布的完整报告为准。本网站所提供信息不构成投资建议,方正证券不对任何人因使用本报告所载任何内容所引致的任何损失负任何责任,投资者需自行承担风险。在本文作者所知情的范围内,本机构、本人以及财产上的利害关系人与所评价的证券没有任何利害关系。
湘ICP备08104379号-1      湘公网安备 43010302000805号 长沙网安数字警务室    本网站已支持IPv6访问     营业执照  经营许可证
版权所有 : 方正证券股份有限公司     中国证券监督管理委员会核准方正证券网上证券委托业务资格