设为首页收藏本页滚动新闻

您的位置：首页 > 财经观察 >

微软打造 13 亿参数小型 LLM AI模型，效果胜于千亿参数 GPT-3.5

2023-06-27 14:30:30 来源：IT之家

评论

(资料图片仅供参考)

IT之家 6 月 27 日消息，AI 模型盲堆体积实际上效果并不见得更好，更多要看训练数据的质量，微软日前最近发布了一款 13 亿参数的语言模型 phi-1，采用“教科书等级”的高品质资料集训练而成，据称“实际效果胜于千亿参数的 GPT 3.5”。

▲ 图源 Arxiv

IT之家注意到，该模型以 Transformer 架构为基础，微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”，以及 8 个英伟达 A100 GPU，在短短 4 天内完成训练。

▲ 图源 Arxiv

微软团队表示，比起增加模型的参数量，通过提高模型的训练数据集质量，也许更能强化模型的准确率和效率，于是，他们利用高质量数据训练出了 phi-1 模型。在测试中，phi-1 的分数达到 50.6%，比起 1750 亿参数的 GPT-3.5（47%）还要好。

▲ 图源 Arxiv

微软表示，phi-1 接下来会在 HuggingFace 中开源，而这不是微软第一次开发小型 LLM，此前，他们打造一款 130 亿参数的 Orca，使用了 GPT-4 合成的数据训练而成，表现也同样比 ChatGPT 更好。

目前关于 phi-1 的论文已经在 arXiv 中发布，可以在这里找到论文的相关内容。

关键词：

[责任编辑：]

相关阅读

(2023-06-27)微软打造 13 亿参数小型 LLM AI模型，效果胜于千亿参数 GPT-3.5
(2023-06-27)杭州银行将定增规模由125亿元下调至80亿元_天天微资讯
(2023-06-27)深圳在售二手房数量下降截止6月26日共有53698套有效房源-环球时快讯
(2023-06-27)环球今日讯！优德精密6月27日快速反弹
(2023-06-27)每日讯息!广州下雪了（关于广州下雪了的基本详情介绍）
(2023-06-27)北京今年首次配置油车指标 “无车家庭”中签概率高报道
(2023-06-27)消息称谷歌终止了AR眼镜项目
(2023-06-27)贵阳上榜“2023避暑旅游优选地” 每日看点
(2023-06-27)人生努力的意义，到底是什么？_全球即时看
(2023-06-27)速看！甘肃一市发布重要人事
(2023-06-27)【OFweek维科杯】英威腾参评最具成长力企业|天天视点
(2023-06-27)营收1.49万亿！“代工之王”设立10亿级储能子公司
(2023-06-27)业内：化纤纺织市场开工率均不足八成
(2023-06-27)鲁昕：重塑职业院校人才培养定位，提升科技成果转化和产业化水平|当前热门
(2023-06-27)沈阳“相声江湖”演艺综合体项目在大东区启动焦点热讯
(2023-06-27)勇闯浙赛无惧风雨挑战 Hyundai N绍兴柯桥站再创佳绩
(2023-06-27)端午假期快速路建设“不打烊” 全球播报
(2023-06-27)兰州新区这个地方新增410个车位当前独家
(2023-06-27)《狂飙》之后为何是《熟年》？
(2023-06-27)网经社张周平：政策和市场驱动是跨境电商高速发展的重要原因天天要闻
(2023-06-27)全球热门:惠州“山海经”｜华工旅游管理系主任吴志才：“3.0时代”的惠州两山经济将到来
(2023-06-27)当前报道:美国禁毒，内病外治行不通（钟声）
(2023-06-27)环球今热点：以色列推出高超音速拦截弹
(2023-06-27)江苏1-5月固定资产投资同比增长5.2% 居民消费价格同比上涨1.1%_今日精选
(2023-06-27)西南医大龙舟队出国赛龙舟
(2023-06-27)福彩3D23167期晒票，每个人要懂得承担一切的责任每日精选
(2023-06-27)冷水江村级集体经济发展多元化
(2023-06-27)这一击160公里/时！9.5万元索尼镜头被棒球击中报废摄影师逃过一劫
(2023-06-27)4:0，2:1，卡塔尔遭遇首败，国足利好！墨西哥大胜冲击第9冠
(2023-06-27)最长续航610km 荣威中高级纯电轿车D7官图发布-当前速讯

每日推荐

图片新闻

48小时频道点击排行

热图推荐

友情链接申请

综合门户
网站链接
时尚网站
财经网站
媒体网盟
行业网站
地方网站
合作伙伴
本地网站