微软推出微型AI自动编码模型phi-1,击败 GPT-3.5
2023-06-26 14:16:39 来源:站长之家
编程客栈()6月26日 消息:微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型 phi-1,并且其性能优于 ChatGPT 背后的大型语言模型 GPT-3.5。
据了解, 这个基于 Transformer 的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。
微软的研究人员仅用了四天时间就使用 Nvidia 的8个 A100芯片来训练 phi-1。该模型使用来自网络的60亿个token以及使用 GPT-3.5生成的另外10亿个token进行训练。
(资料图片仅供参考)
在性能方面,phi-1在HumanEval基准测试中获得了50.6% 的 pass@1准确率。尽管模型小得多,但微软模型击败了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S 编程客栈(37.6% ) 。
在MBPP pass@1测试中,phi-1表现更好,取得了55.5% 的分数。上述许多模型尚未发布该基准测试的结果,但 WizardLM 的WizardCoder在本月早些时候进行的测试中得分为51.5%。WizardCoder 是一个150亿个参数模型,而 phi-1的参数模型为13亿个。
高质量数据带来差异
微软的研究人员认为,正是“高质量数据的力量”让 phi-1表现如此出色。为了说明这一点,研究人员将他们模型的论文js命名为“教科书就是你所需要的”。
他们写道:“正如一本全面、精心制作的教科书可以为学生提供掌握新学科所需的知识一样,我们的工作展示了高质量数据在磨练语言模型在代码生成任务中的熟练程度方面的显着影响。” 。
“通过制作‘教科书质量’数据,我们能够训练出一个模型,尽管模型大php小缩小了10倍,数据集大小缩小了100倍,但在编码基准(例如 HumanEval 和 MBPP)上,该模型超越了几乎所有开源模型。”
与其他可用的编码模型相比,Phi-1仅限于 python 编javascript码。他们表示,该模型的局限性还在于它缺乏大型模型的特定领域知识,例如使用特定 API 进行编程。
为了扩展他们的工作,微软的研究人员建议使用 GPT-4而不是 GPT-3.5来生成用于模型训练的合成数据。
研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法“在数据生成过程中注入随机性和创造力,同时仍然保持示例的质量和连贯性。”
关键词:
[责任编辑:]
相关阅读
- (2023-06-26)微软推出微型AI自动编码模型phi-1,击败 GPT-3.5
- (2023-06-26)【环球播资讯】2023民用航空行业市场深度调研及投资分析
- (2023-06-26)工商银行兔年金条100g价格今天多少一克(2023年06月26日)
- (2023-06-26)快播:三菱日联金融集团(MUFG.US)将以4.67亿美元收购印尼汽车贷款提供商Mandala Finance
- (2023-06-26)文天祥次子的下落-热闻
- (2023-06-26)彩金群英会金币价格今天多少一克(2023年06月26日)
- (2023-06-26)超帅气的甲斗系列食玩新玩具官方补完假面骑士钢斗的最终形态 当前视点
- (2023-06-26)皖能电力投资新设储能技术公司 注册资本3.2亿 天天新要闻
- (2023-06-26)购物中心运营市场前景及现状分析2023|天天实时
- (2023-06-26)全球最新:苹果 iMac 终于要更新了,30 英寸大屏幕 + M3 系列芯片
- (2023-06-26)当前最新:《暗黑破坏神4》感知到的威胁任务攻略
- (2023-06-26)环球新动态:新华网评:遏制网暴,要刹住动辄让人“社死”的歪风
- (2023-06-26)歌尔股份:可为客户提供包括VR/MR光学透镜、光学模组等在内精密光学零组件产品解决方案 世界热推荐
- (2023-06-26)天天快播:在支付宝网站如何注册企业账户 支付宝怎么注册企业
- (2023-06-26)热议:涉嫌信披违规,新潮能源因信披违规收警示函
- (2023-06-26)让科研人员大胆探索(创新谈)
- (2023-06-26)环球滚动:司法部:准予5家外国律师事务所在华设立代表处
- (2023-06-26)6.26午评|躺枪了!
- (2023-06-26)微pe工具箱没有浏览器解决方法_焦点短讯
- (2023-06-26)华鑫证券:给予锡业股份买入评级|天天看热讯
- (2023-06-26)仕净科技(301030):该股换手率大于8%(06-26)
- (2023-06-26)联合水务(603291)盘中异动 股价振幅达8.39% 上涨6.57%(06-26) 环球速看
- (2023-06-26)行业风向标丨政策刺激新型储能加快发展,行业需求有望迎来高增_今日关注
- (2023-06-26)彩金猴王出世金币价格今天多少一克(2023年06月26日)
- (2023-06-26)2023癸卯年150克方形金币价格(2023年06月26日)-实时
- (2023-06-26)“探营”天津夏季达沃斯论坛会场 亮点多多期待满满
- (2023-06-26)天天播报:铁路端午小长假运输发送旅客7037.9万人次 较2019年同期增长11.3%
- (2023-06-26)全球热头条丨北京油车摇号结果出炉:超六成指标被“无车家庭”摇中 概率高于个人
- (2023-06-26)兔年生肖150克银币价格(2023年06月26日)-热点
- (2023-06-26)身份证和档案年龄不一致,退休时按哪个计算?最新解答来了