您的当前位置:首页 > 休闲 > AI 公司 MosaicML 推出 300 亿参数模子 MPT 正文
时间:2025-03-12 02:04:00 来源:网络整理 编辑:休闲
IT之家 6 月 25 日新闻,AI 守业公司 MosaicML 克日宣告了其语言模子 MPT-30B,该模子具备 300 亿参数,磨炼老本“仅有其余同类竞品模子的零头”,有望匆匆妨碍业逐渐飞腾此类模
IT之家 6 月 25 日新闻,公司AI 守业公司 MosaicML 克日宣告了其语言模子 MPT-30B,推出该模子具备 300 亿参数 ,亿参磨炼老本“仅有其余同类竞品模子的数模零头”,有望匆匆妨碍业逐渐飞腾此类模子磨炼老本,公司扩展 AI 模子在更普遍规模的推出运用。
MosaicML 公司的亿参首席实施官兼散漫独创人 Naveen Rao 展现 ,MPT-30B 的数模磨炼老本为 70 万美元(约 502.44 万元国夷易近币) ,远低于 GPT-3 划一类产物所需的公司数万万美元磨炼老本。此外,推出由于 MPT-30B 的亿参老本较低 ,体积较小,数模它也可能更快捷地被磨炼,公司而且更适宜部署在当地硬件上。推出
据悉 ,亿参MosaicML 运用了 Alibi 以及 FlashAttention 技术来优化模子 ,可能实现更长的文本长度以及对于 GPU 合计的更高运用率。MosaicML 也是少数多少个可能运用 Nvidia H100 GPU 的试验室,比照以往下场,当下每一块 GPU 的吞吐量削减了 2.4 倍以上,可带来更快的实现光阴。
除了让 AI 技术更易取患上之外,MosaicML 还专一于后退数据品质并后退模子功能 。他们当初正在开拓一款工具,可能辅助用户在预磨炼历程中分层退出特定规模的数据,以确保磨炼中歇业实现多样化以及高品质的数据组合。
MosaicML 公司展现,将模子扩展到 300 亿参数只是第一步,接下来他们将以飞腾老本为条件,推出体积更大 、品质更高的模子。
IT之家留意到,当初开拓者可能从 Hugging Face 下载并运用开源的 MPT-30B 根基模子,开拓者还可能在当地硬件上运用自己的数据 ,对于模子妨碍微调 。
泰山决战横滨第1目标力保头名 中超扛旗者拒崩盘2025-03-12 01:23
戴森WashG1洗地机全天下首发 尽享洗地与呵护的双重清洁2025-03-12 01:00
张文敬:不断内行走的冰川“科普家”2025-03-12 00:58
原创 NBA一晚9笔续约,字母哥1.86亿顶薪最高,纳吉3200万美元最低2025-03-12 00:51
麦迪:现役NBA,论天赋,能与我媲美的小前锋只有1人,哈登不够格2025-03-12 00:47
恭喜哈登!重见曙光,再见快船队,3换1,76人队被逼上悬崖斗破苍穹:谁能想到,药尘年轻的时候,竟然霍霍过三个女孩!2025-03-12 00:44
欧冠上演3兄弟对决?父亲把地下室改造成球场,培养3个儿子“亚洲第一美女”李成敏绝非浪得虚名,其美貌让无数宅男驻足长看2025-03-12 00:23
夜视防爆手机独家解读,AORO飞翔A27强悍功能眼前的科技实力2025-03-12 00:23
尘埃落定!浙江队被剥夺亚冠资格悬念揭晓,来看看名记传来的消息“早上洗头”和“晚上洗头”,哪个时间点危害大?医生劝你早了解2025-03-11 23:41
官宣!湖人裁掉一人,勇士四冠王退役,泰伦卢正式拒绝哈登国家终于出手了!7个综艺节目已强制停播,一个值得同情的都没!2025-03-11 23:29
原创 再见曼联!拉爵士最后通牒,送走滕哈格中场核心,红魔队长将离队2025-03-12 01:32
热刺领跑英超 名不见经传的新帅创历史扬子晚报2023-10-24 11:11扬子晚报2023-10-24 11:112025-03-12 01:29
数策时期退出第28届郑州天下商品生意会2025-03-12 01:26
2-1!恰20立功了!国际米兰意甲、欧冠双线领跑2025-03-12 01:07
尼克斯再当冤大头!曾经看不上的弃子 如今让你高攀不起2025-03-12 01:00
勇士震撼5换3交易!2米16内线和伦纳德联手库里,名嘴:这是作弊2025-03-12 00:51
狂喊总冠军!五支球队争霸新赛季CBA,谁能最终问鼎?2025-03-12 00:29
火箭99-89逆转马刺!阿门汤普森15分,贾巴里9+9,惠特摩尔15分!2025-03-11 23:55
NBA新赛季明日揭幕,38岁的詹姆斯还能带领湖人卷土重来吗2025-03-11 23:21