逐浪AIGC丨腾讯大模型缘何慢半步?“混元”主打应用

最新信息

逐浪AIGC丨腾讯大模型缘何慢半步?“混元”主打应用
2023-09-07 14:31:00

K图 00700_0
  去年底,ChatGPT的横空出世,让AI大模型受到全球瞩目。过去大半年,大模型产品如雨后春笋般不断涌现,但在百花争艳过程中,腾讯却迟迟未出招。

  此前,业内多位权威人士均分析认为,未来的大模型生态,只会有屈指可数的通用大模型保留下来。腾讯也一直被认为是实力玩家之一。
  在9月7日召开的2023年腾讯全球数字生态大会上,腾讯混元大模型正式亮相。
  据介绍,腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,其中文创作能力、逻辑推理能力和任务执行能力,将通过腾讯云对外开放。
  过去一周,随着国家网信办发布境内深度合成服务算法备案信息,诸多大模型产品也开始从内测转向公测。而腾讯混元大模型目前也已通过备案,某种意义来讲,腾讯与国内其他厂商,现在又站在了同一起跑线上。
  不要“半成品”
  如果从技术储备来看,腾讯现在才发布大模型产品,其实是一种主动的脚步放缓。
  据21世纪经济报道记者了解,腾讯早在2021就开始探索大模型相关技术。从2021年开始,腾讯先后推出千亿和万亿参数的NLP稀疏大模型。关于混元AI大模型,腾讯在2022年4月首次对外披露相关研发进展。据当时的信息,混元AI大模型完整覆盖了NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业模型。
  腾讯如果想在上半年跟风发布一款大模型产品,并非难事。但腾讯没有这样做,为什么?对此,在今年5月举办的腾讯2023年股东大会上,腾讯董事会主席兼CEO马化腾做了非常清晰的诠释。
  马化腾当时表示,“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。互联网企业都有很多的积累,都在做,我们也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。”
  马化腾认为,对于工业革命来讲,早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要。关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地,“相信我们是有很多场景是可以落地的,目前(我们)还在做一些思考”。
  全链路自研
  马化腾的定调,抬升了外界对于腾讯大模型的预期,而这,也直接转化成了腾讯研发团队的巨大压力。
  过去半年,多位腾讯员工均向记者袒露了来自内部的压力。作为混元大模型的负责人,腾讯集团副总裁蒋杰在接受21世纪经济报道记者采访时坦言,腾讯从2020年就开始研发混元,大家今天看到的成果,也不是一蹴而就的。准确来说,混元将永远在路上,训练数据集也会持续更新,而腾讯选择此时将其亮相,是因为它已经达到了可用、可实践的状态。
  据介绍,腾讯混元大模型拥有自主研发的路径规划,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。
  蒋杰表示,腾讯混元大模型之所以选择从第一个token开始从零训练,是因为不做自研,就无法对大模型技术进行完全的掌握,而且腾讯的高并发业务场景,也不适合使用开源模型。
  在国内大模型扎堆的背景下,腾讯混元大模型也进行了诸多技术路线的探索和创新。得益于全链路自研技术,腾讯混元大模型已能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。
  强调“实用”
  在大会上,腾讯还抛出了一个新概念,即“实用级”大模型。在腾讯看来,当前大模型在处理简单任务和高容错率场景方面表现较好,但要让其更可靠地处理复杂信息,仍面临较大的技术挑战。
  “实用级”大模型可以理解为,在实际应用场景中,能够有效解决问题、提高工作效率,并在多个领域和任务上具有较高准确性和可靠性的大模型。这类模型不仅在简单任务上表现优秀,而且能够应对复杂信息处理,为客户和用户带来实际价值。
  “实用级”大模型的价值,首先体现在腾讯内部。蒋杰表示,“腾讯研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。腾讯将全面拥抱大模型。”
  今年3月的财报电话会议上,腾讯总裁兼投资委员会主席刘炽平曾表示,AI将成为公司未来业务增长的倍增器。生成式AI和基础模型技术可以补充优化腾讯的业务。因此,公司将积极投入资源来构建基础大模型,这将在未来对每个业务线都起到正向补充作用。
  目前,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。
  大会上,蒋杰也展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入腾讯混元大模型后的实际应用情况。
  而面向外部客户,腾讯混元大模型则将作为腾讯云MaaS服务的底座,客户不仅可以直接通过API调用混元,也可以将混元作为基底模型,做自己专属的行业大模型。
  蒋杰称,今年6月,腾讯对外发布了行业大模型的相关解决方案,当时是只在几个行业做好了准备,而现在,腾讯混元可以支持更多行业。
  毫无疑问,大模型时代正加速到来。截至7月,国内已经发布超130个大模型,真正掀起了百模大战。在过去二十年,腾讯凭借QQ和微信,在PC互联网和移动互联网时代占据了一席之地,现在值得关注的是,混元大模型能否帮助腾讯拿到大模型时代的“船票”?
(文章来源:21世纪经济报道)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

逐浪AIGC丨腾讯大模型缘何慢半步?“混元”主打应用

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml