6月5日消息,据钛媒体报道,华为公司将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat”。(注:这是内部代号,不是最终名字)
(资料图片)
报道称,预计华为盘古Chat将于今年7月7日举行的华为云开发者大会(HDC.Cloud 2023)上对外发布以及内测,产品主要面向To B/G政企端客户。
据中国商标网显示,华为技术有限公司于日前申请注册了两枚“HUAWEI NETGPT”商标,国际分类为科学仪器、网站服务,当前商标状态为申请中。此外,华为已成功注册多枚“盘古”“PANGU”商标。
根据华为公布的一份论文数据显示,华为盘古 PanGu-Σ 大模型参数最多为 1.085 万亿,基于华为自研的 MindSpore 框架开发。 整体来看,PanGu-Σ 大模型在对话方面可能已接近 GPT-3.5 的水平 。
随着ChatGPT在全球范围内迅速爆红,AI大模型赛道的热潮从国外涌向国内,并随之急速升温。目前,阿里、腾讯、百度、三六零等巨头正加速大模型布局,华为的入局意味着在大模型领域,阿里、腾讯等巨头企业将迎来强劲对手。
自2020年华为已开始布局大模型, 盘古大模型是由CV(计算机视觉)大模型、科学计算大模型、NLP(自然语言处理)大模型、语音大模型、多模态大模型组成的系列, 于2021年4月正式发布。
对于盘古大模型定位, 华为内部团队确立了三项最关键的核心设计原则: 一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
据介绍, 盘古 CV 大模型为业界最大 CV 大模型, 首次达到 30 亿参数并实现兼顾判别与生成能力、在 ImageNet 上小样本学习能力上的业界第一。
华为云盘古大模型最终分为三个层级: L0是类似于GPT3这样的基础通用大模型;L1是基础模型与行业数据结合进行混合训练后的行业大模型, 已经发布了矿山、气象、药物、分子、电力、海浪、金融等行业的大模型; L2是把L1再具体下游业务场景进行部署后生成的部署模型, 如金融OCR模型、电力巡检模型等。
盘古大模型产业链梳理
在大模型研发方面,华为拥有完整的产业链和较强的算力匹配能力。 据浙商证券此前披露, 训练千亿参数的盘古大模型时,华为团队调用了超过2000块的昇腾910芯片,进行了超2个月的数据训练能力。 华为内部称,每年大模型训练调用GPU/TPU卡超过4000片,3 年的大模型算力成本高达9.6亿元人民币。
产业生态层面, 华为则延续了自己重B端的企业基因,大模型产业化的初衷正是在于开辟更多B端业务场景。 此外,还融入了华为在5G、云计算、物联网等领域的技术优势,为企业提供智能化服务。 目前,盘古预训练大模型能力已在包括能源、零售、金融、工业等领域得到验证。 同时盘古NLP大模型通过迁移学习实现少样本学习目标,并采用了分布式计算技术,可以实现模型的在线训练和增量学习,随着数据量的增加不断优化模型,提高模型的准确度和质量, 使其更加适合复杂的商用场景, 在部分应用中的表现已超过GPT-3.5。此次,华为盘古大模型有望成为国内领先的大模型,其生态产业链标的有望迎来加速发展。
数据来源:各公司官网,华为官网,东吴证券研究所
不久前,华为宣布已基本实现14nm以上EDA工具国产化,2023年将完成对其全面验证。
华为在被美国列入实体清单后,遭三大海外EDA巨头断供,此后一直试图联合国内相关厂商共同推动EDA的国产化。 市场人士表示,虽然不确定华为合纵连横所构建的14nm以下国产EDA软件生态究竟竞争力如何,但中国EDA产业无疑正在进入新的篇章。
目前全球EDA行业参与者分为三级竞争梯队。 国产厂商华大九天在部分领域拥有全流程工具,处于第二梯队。 而拥有完整、全流程产品的Synopsys、Cadence和Siemens EDA属于第一梯队,2020年CR3达69.54%,垄断市场。
随着EDA国内市场规模实现连续增长,国产EDA厂商在三巨头业务链的缝隙中寻找突破口。 自此涌现出一大批重要EDA企业。
华大九天 选择模拟电路仿真软件,它将芯片领域的全流程设计支持技术迁移到液晶面板设计全流程;
概伦电子 在SPICE建模工具及噪声测试系统方面技术处于领先地位;
广立微 在良率分析和工艺检测的测试机方面具有明显优势。
附国产厂商汇总
目前,国内外许多企业都在研发超大规模的AI模型,盘古大模型在这个领域面临着激烈的竞争压力,需要不断优化和提高模型的性能和质量,才能以保持在市场中的领先地位。
随着未来算力提升,AI赋能下的EDA软件将颠覆传统设计方式,或许能迫使国内外EDA企业重新站到同一起跑线前。在摩尔定律停滞的大背景下,chiplet等新技术所带来的“敏捷验证”、“快速迭代”、“方法整合”等新需求,也带给国产EDA软件更多机遇。
标签: