无问芯穹于行业内初次实现了多种年夜模子算法于多种芯片上的高效协同部署、运行,以独家技能上风解决异构算力整合问题,降低行业对于单一国际芯片品牌的依靠,加强财产链供给链韧性及竞争力。
文|钱丽娜
ID | BMR2004
于AI算力酷寒的赛道中,一群来自清华年夜学、上海交通年夜学、中国科学院的年青学者用 无问芯穹 这四个布满诗情画意的字,打开了面向无垠穹隆的空间。 无问 二字源自清华的校歌,歌词中写道 树德立言,无问西东 ,AI时代即起,英雄也将不问来由。
2025年年头,DeepSeek的问世,人们惊觉年夜模子练习还有能云云压榨算力。于算力决议出产力及竞争力的时刻,算力优化这条赛道的时机陡然呈现。
依托 多元异构、软硬协同 的焦点技能上风,无问芯穹打造了毗连 M种场景与模子 及 N种硬件与芯片 的 M N AI基础举措措施新范式。
无问芯穹的方针是成为年夜模子时代首选的算力运营商。如许的定位来自在他们对于市场的洞察。
人工智能成长由算力、算法及数据三要素驱动。假如把人工智能比作一支火箭,数据是燃料,算法是导航体系,算力就是引擎。人工智能算法要于人工智能芯片上完成部署才能运行,而芯片市场中国际尖端芯片市占率居高不下,虽然很多场景里国产芯片也能完成使命,但囿在国际主流芯片的基础软件生态壁垒,凡是难以被优先利用。此外,国产算力间生态互不相通,多元芯片间难协同提供算力。同时,算力资源出现持有方分离化、地区漫衍不平衡的特色,跨体系调理与使用效率不高,高性价比、高附加值算力仍存于巨年夜的供应缺口。
为此,无问芯穹构建了一朵 异构云 ,于行业内初次实现了多种年夜模子算法于多种芯片上的高效协同部署及运行,以独家技能上风解决异构算力整合问题,降低行业对于单一国际芯片品牌的依靠,加强财产链供给链韧性及竞争力。
无问芯穹首创了跨机房练习技能,晋升零星算力资源可用性,实现高价值数据资源当地处置惩罚,让算力与数据畅通更高效。买通异属算力资源的高效调理,解决算力需求动态猜测与调理问题,实现跨域算力资源同享及配置优化,助力算力资源与下流财产协同成长。
依托 多元异构、软硬协同 的焦点技能上风,无问芯穹打造了毗连 M种场景与模子 及 N种硬件与芯片 的 M N AI基础举措措施新范式,实现多种年夜模子算法于多元芯片上的高效协同部署;于云侧,无问芯穹基在多元芯片算力底座构建了Infini-AI异构云平台,向年夜模子开发者提供极致性价比的高机能算力及原生东西链,为年夜模子从开发到部署的全生命流程降本增效;于端侧,无问芯穹以软硬协同焦点技能修筑 端模子+端软件+端IP 智能终端一体化解决方案。
异构云 降服了既有算力资源使用的技能 难点 ,毗连天下算力一体化设置装备摆设的结构 断点 ,买通算力到新质出产力转化的生态 堵点 。
无问芯穹基在异构云平台打造了多区域算力生态平台,可会聚异构、异域、异属算力,向区域下流财产提供集算力咨询、生意业务、交付、运营与调理为一体的大众算力办事。详细来看别离体现为:
异构:多元算力优化适配,冲破基础软件壁垒使能国产芯片
异构云的焦点技能是异构算力适配,即经由过程一系列技能手腕及优化计谋,使差别芯片之间可以或许高效、不变地协同事情,实现总体体系的最好机能及功效体现。
2024年7月,无问芯穹在业内初次冲破性地实现六种差别品牌芯片间的交织混淆练习,用华为昇腾、天数智芯、沐曦、摩尔线程四种国产芯片别离与超威半导体(AMD)、英伟达(NVIDIA)举行结合练习,算力使用率最高可达97.6%,撑持700亿参数范围的年夜模子练习。该技能可帮忙上层用户和使命屏蔽底层芯片差异,促成存量算力资源与新增可控算力两者间高效交融。
异域:跨机房、跨端云练习,解放长尾数据与算力资源价值
于异域结合练习技能方面,无问芯穹全世界首创跨机房练习技能。经由过程并行编排机制的怪异立异,实现超过120千米的异属机房中集群间结合练习,于通讯带宽仅有不到20GB/s 的环境下,实现沐曦加快卡与英伟达加快卡的跨机房混训,最年夜化降低低通讯带宽的影响,使算力的机能丧失连结于10%之内。同时,该技能撑持云、边数据断绝式模子练习。企业使用少量边沿算力便可实现及充沛云端算力的协同练习,高价值行业数据资产患上以留于当地,可极年夜晋升数据畅通效率与财产价值。
异属:会聚多来历算力设置装备摆设算力生态平台,赋能财产数智进级
于异属算力资源高效调理方面,无问芯穹连续打造算力资源市场化运营最好实践。已往3个月间,无问芯穹已经乐成使用焦点技能实力,前后鞭策上海徐汇模速空间算力生态平台、浙江杭州市算力资源办事平台、北京海淀大众算力办事平台等标杆项目落地。
无问芯穹结合开创人、首席履行官夏立雪先容,近百家下流企业正列队入驻上述平台。算力生态平台的设置装备摆设有益在将算力办事从单一资源生意业务进级为全财产链生态引擎,既解决企业 用患上起、用患上好 算力的实际需求,也经由过程生态聚合效应赋能地域构建随机应变的特点现代化财产系统。
无问芯穹的 异构云 降服了既有算力资源使用的技能 难点 ,毗连天下算力一体化设置装备摆设的结构 断点 ,买通算力到新质出产力转化的生态 堵点 。联合人工智能运用开发东西链,晋升算力基础举措措施对于年夜模子广泛运用的撑持程度,让算力真正成为鞭策数智化转型的焦点引擎。
无问芯穹以软硬协同焦点技能上风打造了 端模子+端软件+端IP 智能终端一体化解决方案。
智能终端是将我国数字技能冲破与制造上风、市场上风更好联合的最好 反映界面 。跟着多模态、强推理、端芯片等端侧年夜模子技能拐点的到来,数十亿终端将迈入年夜模子时代,实现人机交互范式的底子性厘革。
然而,动辄百亿参数范围的年夜模子部署对于端侧装备的计较能力、功耗及存储空间都提出了巨年夜挑战。将模子安装终端当地情况后,模子机能丧失、推理速率太慢、功耗效益低劣等困境将影响智能消费终真个成长,限定主动驾驶感知决议计划、无人机路径计划、具身智能动作决议计划等场景的落地效果。
为此,无问芯穹以软硬协同焦点技能上风打造了 端模子+端软件+端IP 智能终端一体化解决方案,以顶尖的终端AI体系,于越发苛刻的硬件资源限定下,深度协同运用场景,实现算法模子、推理引擎、体系调理、芯片架构的全链路优化闭环。已经发布全世界首个多模态3B轻量化开源模子,同精度下推理速率领先其他模子300%;自研智能终端年夜模子推理引擎,于多种硬件上推理机能达行业第一;自研第二代年夜模子推理处置惩罚器LPU,实现智能终端推理机能及能效的量级晋升。
端模子:多模态模子端侧轻量化部署,进级要害出产力东西
年夜模子能力正从云侧逐渐下沉至终端,逐渐加深对于视觉、听觉等更多模态信息的理解,终端需要实现更匹配人类感官感触感染的新交互范式。
2024年12月,无问芯穹推出全世界第一款端侧全模态理解开源模子Megrez-3B-Omni,实现端上图象、音频、文本模态数据的极速推理,并于三个模态的多种测评基准中都取患了最优机能,推理速率最年夜可领先同精度模子300%,同时还有尤其提供了WebSearch 功效,可以主动决议计划东西挪用机会,用户患上以构建属在本身AI搜刮,经由过程收集获取最新信息,降服小模子的幻觉问题及常识贮备不足的局限。
端软件:撑持端侧AI更高效落地,协同基础软硬件体系运行
跟着优质数据资源价值挖掘触顶,将来模子能力增加将转向依靠推理时的迭代计较,以此晋升模子指令遵照能力及繁杂使命处置惩罚能力,这将鞭策财产中10 100倍的推理开消需求增加。
无问芯穹自研智能终端推理加快引擎Mizar 适配Intel、AMD、NVIDIA等硬件平台,撑持各类终端装备CPU、GPU 及NPU 的同时推理,还有能经由过程超过软硬件条理的体系优化,为多款智能终端装备分外带来70% 以上的机能晋升,最年夜化端侧硬件机能的使用,已经于遐想多款型号产物中完成适配,将陪同最新版本产物预装量产及上线。
端IP:软硬件一体化设计,以AI推理硬件为智能终端提速增效
多模态模子与推理时计较的范式变化使患上智能终真个算力与带宽需求激增,现有端芯片已经没法满意泛端侧智能运用需求。无问芯穹持久对峙软硬件协同优化技能线路以实现硬件效能的数目级晋升,而非纯真依靠硬件工艺的迟缓迭代,自研第二代年夜模子推理处置惩罚器LPU(Large-model Processing Unit)IP,采用了 算法-软件-架构-工艺 协同优化设计,撑持文生文、文生图与文生视频等年夜模子于智能终端上的高机能、低功耗推理,可年夜幅降低年夜模子终端财产部署成本,支撑人工智能于新型消费电子、立异型硬件制造以和工业、办事、医疗等浩繁场景中的高质量落地。
无问芯穹基在软硬件协同设计焦点技能能力,打造的 端模子+端软件+端IP 智能终端一体化解决方案,可合用在多样化新一代智能终端, 致力在实现10倍以上的推理吞吐及能效晋升,正与遐想等行业伙伴一路打造下一代征象级新终端与端云协同计较新范式,鞭策端侧轻量化模子于垂类终端如智能网联新能源汽车、人工智能手机及电脑、智能呆板人以和智能制造设备中的范围化落地。
-乐鱼.leyu(中国)