微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5
2023-06-27 14:30:30 来源:IT之家
(资料图片仅供参考)
IT之家 6 月 27 日消息,AI 模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款 13 亿参数的语言模型 phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的 GPT 3.5”。
IT之家注意到,该模型以 Transformer 架构为基础,微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”,以及 8 个英伟达 A100 GPU,在短短 4 天内完成训练。
微软团队表示,比起增加模型的参数量,通过提高模型的训练数据集质量,也许更能强化模型的准确率和效率,于是,他们利用高质量数据训练出了 phi-1 模型。在测试中,phi-1 的分数达到 50.6%,比起 1750 亿参数的 GPT-3.5(47%)还要好。
微软表示,phi-1 接下来会在 HuggingFace 中开源,而这不是微软第一次开发小型 LLM,此前,他们打造一款 130 亿参数的 Orca,使用了 GPT-4 合成的数据训练而成,表现也同样比 ChatGPT 更好。
目前关于 phi-1 的论文已经在 arXiv 中发布,可以在这里找到论文的相关内容。
关键词:
[责任编辑:]
相关阅读
- (2023-06-27)微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5
- (2023-06-27)杭州银行将定增规模由125亿元下调至80亿元_天天微资讯
- (2023-06-27)深圳在售二手房数量下降 截止6月26日共有53698套有效房源-环球时快讯
- (2023-06-27)环球今日讯!优德精密6月27日快速反弹
- (2023-06-27)每日讯息!广州下雪了(关于广州下雪了的基本详情介绍)
- (2023-06-27)北京今年首次配置油车指标 “无车家庭”中签概率高 报道
- (2023-06-27)消息称谷歌终止了AR眼镜项目
- (2023-06-27)贵阳上榜“2023避暑旅游优选地” 每日看点
- (2023-06-27)人生努力的意义,到底是什么?_全球即时看
- (2023-06-27)速看!甘肃一市发布重要人事
- (2023-06-27)【OFweek维科杯】英威腾参评最具成长力企业|天天视点
- (2023-06-27)营收1.49万亿!“代工之王”设立10亿级储能子公司
- (2023-06-27)业内:化纤纺织市场开工率均不足八成
- (2023-06-27)鲁昕:重塑职业院校人才培养定位,提升科技成果转化和产业化水平|当前热门
- (2023-06-27)沈阳“相声江湖”演艺综合体项目在大东区启动 焦点热讯
- (2023-06-27)勇闯浙赛 无惧风雨挑战 Hyundai N绍兴柯桥站再创佳绩
- (2023-06-27)端午假期快速路建设“不打烊” 全球播报
- (2023-06-27)兰州新区这个地方新增410个车位 当前独家
- (2023-06-27)《狂飙》之后为何是《熟年》?
- (2023-06-27)网经社张周平:政策和市场驱动是跨境电商高速发展的重要原因 天天要闻
- (2023-06-27)全球热门:惠州“山海经”|华工旅游管理系主任吴志才:“3.0时代”的惠州两山经济将到来
- (2023-06-27)当前报道:美国禁毒,内病外治行不通(钟声)
- (2023-06-27)环球今热点:以色列推出高超音速拦截弹
- (2023-06-27)江苏1-5月固定资产投资同比增长5.2% 居民消费价格同比上涨1.1%_今日精选
- (2023-06-27)西南医大龙舟队出国赛龙舟
- (2023-06-27)福彩3D23167期晒票,每个人要懂得承担一切的责任 每日精选
- (2023-06-27)冷水江村级集体经济发展多元化
- (2023-06-27)这一击160公里/时!9.5万元索尼镜头被棒球击中报废 摄影师逃过一劫
- (2023-06-27)4:0,2:1,卡塔尔遭遇首败,国足利好!墨西哥大胜冲击第9冠
- (2023-06-27)最长续航610km 荣威中高级纯电轿车D7官图发布-当前速讯