世界时讯:商汤大模型多个评测表现超ChatGPT
2023-06-23 11:23:10 来源:哔哩哔哩
(资料图)
商汤科技近日公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。评测显示,“商量”在这三个测试集中的表现均领先ChatGPT,实现了我国语言大模型研究的突破。 全球三大权威语言模型测评基准分别为由美国加州大学伯克利分校等高校构建的多任务考试评测集MMLU、由微软研究院推出的学科考试评测集AGIEval(含中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等),以及由上海交通大学、清华大学和英国爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval。 截至6月,全球范围内正式发布的大语言模型已超过40款,其中由中国厂商、高校、科研院所等发布的大语言模型近20款。在MMLU测评中,“商量2.0”综合得分为68.6,超ChatGPT(67.3分),仅落后于GPT-4(86.4分)位居第二;在AGIEval测评中,“商量2.0”得分49.9分,超ChatGPT(42.9分),仅次于GPT-4的56.4分。在C-Eval测评中,“商量2.0”得分66.1分,在参评的18个大模型中,仅次于GPT-4(68.7分)。 4月,商汤发布“日日新”大模型体系以及中文语言大模型“商量”。目前,“商量”已在众多行业和场景中落地应用,已有近千家企业客户通过申请,应用和体验“商量2.0”的长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力。在服务客户过程中,“商量2.0”持续迭代和提升,并实现知识的实时更新。
关键词:
[责任编辑:]
相关阅读
- (2023-06-23)世界时讯:商汤大模型多个评测表现超ChatGPT
- (2023-06-23)全球热议:曝索尼将推出新PS5捆绑包:包含两年三档会员!
- (2023-06-23)留学必知!内地学子赴港就读的五大优势-世界速讯
- (2023-06-23)一代名相晏婴如何巧解拆迁难? 环球聚焦
- (2023-06-23)多地端午假期首日旅游成绩单出炉,你贡献了多少?_每日快讯
- (2023-06-23)全国铁路今天预计发送旅客1620万人次 天天即时
- (2023-06-23)每日速看!江苏5月全社会用电量同比增长11.7%
- (2023-06-23)看点:江西跨境电子商务发展大会举行 签约金额达10.35亿元
- (2023-06-23)让端午文化焕发时代魅力|世界热门
- (2023-06-23)无锡南禅寺对联_全球即时看
- (2023-06-23)全球关注:迎战中考士气足
- (2023-06-23)“营商110”守护企业安全 天天新视野
- (2023-06-23)短讯!最新动作!多国央行宣布:加息!
- (2023-06-23)环球速递!中建二局举办粤港澳大湾区建设劳动和技能竞赛总结推进会
- (2023-06-23)杭州新增“亚运车道”,最新说明来了!_天天时快讯
- (2023-06-23)卓越司庆X端午双节同庆,重磅钜惠持续放送!-天天消息
- (2023-06-23)广西桂林:开展端午节前粽子产品过度包装专项检查 给粽子包装“瘦身”_观速讯
- (2023-06-23)微资讯!调研|金融支持科创之杭州样本:不看营收利润 如何以人定贷
- (2023-06-23)世界快播:医疗器械召回信息公开(江西易琛医疗器械有限公司)
- (2023-06-23)环球微头条丨洪恩Q1财报:利润增三倍,上线儿童AIGC聊天模块,海外app入围最受欢迎榜前十
- (2023-06-23)工信部:制定实施“5G+工业互联网”512升级版工作方案-每日短讯
- (2023-06-23)新和县农村信用合作联社 减费让利惠企利民出实招-当前独家
- (2023-06-23)北京工业大学校友总会第八届校友代表大会第三次会议顺利召开-世界今头条
- (2023-06-23)女子派出所死亡疑团:4小时监控缺失 执法记录仪为啥在关键时刻“掉链子”?
- (2023-06-23)6月21日影视院线行业十大熊股一览 今日播报
- (2023-06-23)盛夏至!热力地图热情四射 每日快看
- (2023-06-23)喜得双胞胎孙儿!TVB前知名男星升级做爷爷,没存款太穷被离婚-前沿资讯
- (2023-06-23)精选!GLOBALink | China-proposed initiative contributes to global development, say experts
- (2023-06-23)环球观察:国家新闻出版署发布6月国产网络游戏审批信息 共89款游戏获批
- (2023-06-23)京广高铁助力石家庄快速融入环首都一小时生活圈 每日观察