首页 > 动漫

当前动态:商汤大模型多个评测表现超ChatGPT

来源: 时间:2023-06-23 11:41:48


(相关资料图)

本报讯 (记者沈湫莎)商汤科技近日公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。评测显示,“商量”在这三个测试集中的表现均领先ChatGPT,实现了我国语言大模型研究的突破。      全球三大权威语言模型测评基准分别为由美国加州大学伯克利分校等高校构建的多任务考试评测集MMLU、由微软研究院推出的学科考试评测集AGIEval(含中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等),以及由上海交通大学、清华大学和英国爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval。      截至6月,全球范围内正式发布的大语言模型已超过40款,其中由中国厂商、高校、科研院所等发布的大语言模型近20款。在MMLU测评中,“商量2.0”综合得分为68.6,超ChatGPT(67.3分),仅落后于GPT-4(86.4分)位居第二;在AGIEval测评中,“商量2.0”得分49.9分,超ChatGPT(42.9分),仅次于GPT-4的56.4分。在C-Eval测评中,“商量2.0”得分66.1分,在参评的18个大模型中,仅次于GPT-4(68.7分)。      4月,商汤发布“日日新”大模型体系以及中文语言大模型“商量”。目前,“商量”已在众多行业和场景中落地应用,已有近千家企业客户通过申请,应用和体验“商量2.0”的长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力。在服务客户过程中,“商量2.0”持续迭代和提升,并实现知识的实时更新。

(原标题:商汤大模型“商量”多个评测表现超ChatGPT)

相关稿件

当前动态:商汤大模型多个评测表现超ChatGPT

当前快报:盘点奇异博士10大敌人,洛基排第5,多玛姆没排上前3

每日观察!我国累计招收博士后约34万人 已设立博士后科研工作站4338个

天天快资讯丨贾乃亮带女儿逛街被偶遇 10岁甜馨身高猛窜已到爸爸肩膀

全球视点!3-6,4-6!张帅连丢两盘不敌世界第150,惨遭巡回赛10连败

环球短讯!新青年|90次火箭燃料加注,这个“90后”的青春真的很“燃”!

过氧化钠为什么不是碱性氧化物(过氧化钠为什么不是碱性氧化物?)

1980五行属什么(1980年属猴的人五行是金还是木命)

华旺科技(605377)7.3万股限售股将于6月23日解禁上市,占总股本0.02%|观速讯

端午节首日,北京“热”出了新高度,他们却......_热门

做好签收准备 smart精灵#3开启首批交付 环球观天下

最新动作!多国央行宣布:加息!

每日快报!(国际)挪威央行加息50个基点以抑制通胀

总数约5000人 河南省科技特派员今年再“升级”|焦点快看

大降价!这些药品平均降价近50%!-全球即时

治疗膝骨关节炎有新办法

环球快资讯:丰台区长辛店老镇举办端午民俗文化节

股价跌停!实控人前妻减持套现 昆仑万维资本市场“泻火” 环球热讯

天天亮点!澳门:龙舟竞渡庆端午 传承中华文化和弘扬爱国精神

限量WIFI6路由器半价:仅需69元

合约购机变成“信用购”,用户称被网贷更改套餐要付违约金?

【天天热闻】华阳集团:接受北京汇信聚盈私募基金管理有限调研

【聚看点】邵阳市脑科医院临床第二党支部开展“端午艾草香,浓浓医患情”主题党日活动

2023粤港澳车展:911 GT3 RS实车首次公众亮相-世界微资讯

天天快看点丨河南打造四大一号旅游公路

扎哈罗娃:西方这么干,将引发核大国直接冲突 环球热消息

观点:讲好健康中国故事

2023年北京科技大学各省市招生计划汇总

全球看热讯:重庆彭水:石漠化荒山披“绿装”

五大摸排任务全部完成,广州白云“5431”机制有何奥妙? 全球热点评