高校为何难出大模型
2023-08-25 13:16:13 来源:第一财经
作者: 金叶子
[ 和团队率先在国内发布了具备 ChatGPT 能力语言模型MOSS的复旦大学计算机学院教授邱锡鹏表示,大模型更顶尖的研究机构在业界,这是一个不可回避的事实。从DeepMind再到OpenAI,都是如此。美国的很多著名高校,从研究实力上看已经落后于这些顶级的研究院了。 ]
(资料图片仅供参考)
ChatGPT诞生至今已过去9个多月,大模型在产业界和学界的最新进展有哪些?
在8月24日举行的2023世界人工智能大会(WAIC)青年优秀论文奖颁奖仪式暨青年科学家论坛上,谈到大模型为何难以首先诞生在高校,同济大学计算机系副主任何良华教授认为,学界之所以很难出现ChatGPT这样的模型,主要是算力和数据的问题。
何良华说,大模型非常吃算力,高校也难以去购买大量的算力。而有了算力之后,要把参数训练得比较成熟,需要海量的数据,但是学界是拿不到这么多数据的。除了这两个问题,还和学界自身的需求有关。“我们都期望在理论上做一些创新。比如我的学生如果跟我说现在需要几千张卡(算力)来做一个事情,我所有的经费给他也不够,课题也难以立项。因为它既不是应用,又不是理论,找不到这样一笔经费,研究只能中断。”
和团队率先在国内发布了具备 ChatGPT 能力语言模型MOSS的复旦大学计算机学院教授邱锡鹏表示,大模型更顶尖的研究机构在业界,这是一个不可回避的事实。从DeepMind再到OpenAI,都是如此。美国的很多著名高校,从研究实力上看已经落后于这些顶级的研究院了。
邱锡鹏解释,学校和研究院的差异还是在于自由的探索。对于很多研究院来讲,长期的目标还是奔着盈利,包括国内很多企业之前也建了很多研究院,过不了几年就发现可能面临着盈利、变现的压力,导致做的研究不是特别纯粹。在他看来,OpenAI的团队是一个以前没有出现过的形态,这种制度设计非常好,能使团队既能坚持本心做研究,同时也没有那么大的压力。
“在学校的话还是要发挥学校的长处,做的研究没有太多的盈利要求或面临短期变现的压力,也可以思考得更长远。特别在如今高算力要求的情况下,在学术界和产业界的研究院之间,还是可以发挥学术界的优势。”他说。
上海科技大学生物医学工程学院常任助理教授钱学骏则认为,工业界做出的很多创新性和比较有影响力的工作,可能不是学界追求的主要目标。“学界可能更想(发明)一种思路上的想法,而不是通过大算力、大数据,集中各方面的优势做出来的,对学界来说这些也不够有优势,无法获得大量数据。”
华为诺亚方舟实验室AI研究员谢恩泽说,怎么构建高质量的数据集,可能是对于大模型一个很重要的补充。模型本身来说,用多大的模型配多大的数据以及用多长时间,这也是很重要的,而这些只有在大厂才有机会接触一些资源。
今年以来,生成式人工智能的发展成为地方政府和科技大厂瞄准的关键词。科技部人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,当前国内10亿参数规模以上的大模型已发布79个。
在不久前的浦江基础科学发展论坛上,清华大学人工智能研究院常务副院长孙茂松教授对第一财经表示,我国乃至全球发展大模型最终的突破关键,是基础科学的突破。
他说,对于大模型,当前的问题在于并不清楚OpenAI的机理是如何运作的,就连推出ChatGPT的OpenAI公司首席执行官萨姆·奥特曼也表示,虽然做出了GPT但也不清楚发生的原理,“实际上就是对这个机理还不清楚”。他认为,现有的人工智能模型已经能做到说话通顺,但这个问题的内在实现逻辑仍然十分复杂。如果弄清楚了大模型里的规律、ChatGPT背后的机理,就有可能克服现有人工智能大模型的局限性,建立下一代人工智能的理论和模型。
关键词:
[责任编辑:]
相关阅读
- (2023-08-25)高校为何难出大模型
- (2023-08-25)香港兴业国际(00480)委任邵蓓兰为提名委员会委员
- (2023-08-25)行者app怎么发布动态 操作方法介绍
- (2023-08-25)幽行玄城女鬼怎么打 幽行玄城女鬼打法详解
- (2023-08-25)中移物联网5G专网行业通道及组网服务集采:总规模6200套
- (2023-08-25)白酒概念板块跌1.03% 大湖股份涨9.97%居首
- (2023-08-25)核电内部通信龙头企业|北京挪拉斯坦特芬通信设备有限公司亮相全球最大核能展——2023深圳核博会
- (2023-08-25)自治区农业农村厅领导到广西蚕业技术推广站开展蚕桑产业发展调研
- (2023-08-25)燃气灶热电偶拆卸(燃气灶热电偶更换视频)
- (2023-08-25)红米Note 11R老是自动重启怎么解决
- (2023-08-25)瑞鹄模具(002997):轻量化零部件业务高速增长
- (2023-08-25)美能能源(001299):2023年8月23日因换手率达20%而异动上榜
- (2023-08-25)营口万彧企业信息服务有限公司(关于营口万彧企业信息服务有限公司简述)
- (2023-08-25)图解安宁股份中报:第二季度单季净利润同比减29.72%
- (2023-08-25)图解国机汽车中报:第二季度单季净利润同比减49.18%
- (2023-08-25)医疗事故鉴定是否是前置程序
- (2023-08-25)海关总署:全面暂停进口日本水产品 港澳进口禁令将带来重大影响!
- (2023-08-25)食盐价格出现异动,海南省市监局:经营者要配合政府保供稳价
- (2023-08-25)《装甲核心6》评测结果绝了,48家给出了87%的好评
- (2023-08-25)手机卡顿问题怎么解决:这四款手机不卡
- (2023-08-25)WiFi万能钥匙自建公益热点放飞偏远山区儿童移动互联梦想
- (2023-08-25)《千手千眼》的艺术特色
- (2023-08-25)中汽协:1-7月汽车销量排名前十位企业共销售1304.8万辆 比亚迪股份(01211)销量增速最为显著
- (2023-08-25)上海威尔泰工业自动化股份有限公司2023半年度报告摘要
- (2023-08-25)银行训练大模型进展如何?新成立的创新实验室显端倪
- (2023-08-25)黑河市爱辉区1.42万亩小麦开始集中收割
- (2023-08-25)嘉宝莉漆加盟电话(嘉宝莉漆加盟)
- (2023-08-25)我的世界1.16.5家具mod(我的世界1 7 10家具mod)
- (2023-08-25)2023年七夕节瓦屋山免票么?
- (2023-08-25)广州黄埔大风刮倒榕树砸中两台小车,幸无人伤亡