根据相关报道显示,华为即将推出一款名为“盘古Chat”的多模态千亿级大模型产品,将于今年7月7日举办的华为云开发者大会(HDC.Cloud2023)上展示并进行内测,主要面向ToB/G政企端客户。

盘古Chat

相关人士表示,在2020年11月,盘古大模型在华为云内部立项成功,也完成了与合作伙伴、高校的合作搭建。在开始打造盘古大模型的时候,团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。

根据华为公布的一份论文数据显示,华为盘古 PanGu-Σ大模型参数最多为 1.085 万亿,基于华为自研 AI 计算框架 MindSpore 开发。消息指出整体而言,PanGu-Σ大模型在对话方面可能已接近 GPT-3.5 的水平。

盘古Chat

华为云官网显示,盘古大模型由自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、科学计算大模型等多项构成,通过模型泛化,解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。

免责声明:素材源于网络,如有侵权,请联系删稿。