算力周跟踪:OPENAI发布O1大模型 开启强化学习新范式
- 腕表故障
- 2024-11-14 13:17:36
- 7
摘要:
本周CPU/GPU 板块出现回调,云计算板块普涨。(1)CPU/GPU 板块:本周(0916-0918)英伟达-4.81%,海光...
本周CPU/GPU 板块出现回调,云计算板块普涨。(1)CPU/GPU 板块:本周(0916-0918)英伟达-4.81%,海光信息-4.17%,寒武纪-4.76%,龙芯中科-3.03%。英特尔+5.65%,当地时间9 月16 日,英特尔公布业务调整消息,剥离芯片代工业务。(2)云计算板块:商汤科技+5.77%,9 月14日公布商汤科技5.2 亿中标移动天津2024 年智算中心一期。 最新一周数据显示文本大模型总体访问量持续亮眼。据similarweb 最新数据(0906-0912):(1)ChatGPT 和Perplexity 访问量持续攀升。(2)豆包访问量长期增长。9 月14 日,“豆包爱学”全新升级,推出了很多辅助学习的实用功能。(3)Runway 访问量继续提升。9 月14 日,Runway推出一种新的控制机制,可以通过参考视频来精确控制运动、表现力和意图,大大提高AI 制作电影、游戏特效方向的可行性。据七麦最新数据(0911-0917):阿里通义下载量增长稳定。通义万相AI 生视频将在9 月19 日上线,现已开启预约,支持文或图生视频,支持多语音与可变分辨率生成。 OpenAI 公开o1 大模型,强化学习Scaling Law 提出算力需求。9 月13 日,OpenAI 正式公开o1 大模型,即此前宣传的草莓大模型。它具备真正的通用推理能力,在高难度基准测试中展现出色的表现,相比GPT-4o 有显著提升。OpenAI 还发布了成本效率更高的o1-mini 模型,尤其擅长编程任务。目前,ChatGPT Plus 和Team 用户可以开始使用o1 模型,但使用量有限。OpenAI 计划未来增加更多功能,如网络浏览、文件和图像上传等,以提升模型的实用性。 观点#1:思维链深化推理能力,强化学习突破LLM 推理极限。从方法上,o1 大模型首次证明了语言模型可以进行真正的强化学习――给越多算力,就输出越多智能,一直到超越人类水平。o1 还引入了思维链(CoT)推理,也就是该模型在作出反应之前,需要像人类一样,花更多时间思考问题。 通过训练,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。CoT 显著扩展了模型的表达能力,使其能够处理更复杂的问题。 观点#2:OpenAI o1 打破Scaling law 瓶颈,反哺多模态通用模型。目前普遍认为通过增加数据和模型规模来提升大模型效果的Scaling law 模式,其增长速度在放缓。目前面临的问题包括数据资源的枯竭,因为像GPT-4这样的模型已经使用了大量可用数据,导致“数据荒”。同时,大模型的训练需要大量GPU 资源,这也使得算力和数据的扩展面临瓶颈。OpenAI 发现,随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1 的性能持续提高,而且扩展这种方法的限制与大模型预训练的限制有很大不同。可以通过o1 增强最重要的基座模型逻辑推理能力,再把这种能力迁移到GPT 4o 这种多模态通用模型上。比如通过直接用o1 基座模型替换GPT 4o 的基座、或者利用o1 模型生成逻辑推理方面的合成数据增强GPT4o、再或者用o1 蒸馏GPT 4o 模型。 建议关注 国产算力链:寒武纪、海光信息、龙芯中科、盛科通信等。 数据中心硬件:中际旭创、工业富联、新易盛、天孚通信、沃尔核材、英维克、沪电股份、胜宏科技。 风险提示 技术发展及落地不及预期;下游终端出货不及预期;下游需求不及预期;市场竞争加剧风险;地缘政治风险。 【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
发表评论