商汤“商量SenseChat 2.0”在多个评测基准综合表现中排名第二-天天滚动
时间:2023-06-22 21:25:53
(资料图)
近日,商汤科技公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩,其综合得分分别为68.6、49.91、66.1。根据评测结果,在当下市面上参与评测的主流大模型中,“商量SenseChat 2.0”三个测试集的综合表现排名第二。(21世纪经济报道)
相关稿件
商汤“商量SenseChat 2.0”在多个评测基准综合表现中排名第二-天天滚动
天天快资讯丨湖南首例!湘雅医院完成经直肠无创高能聚焦超声手术
清风头条丨溆浦县:推动监督向基层延伸 护航乡村振兴 每日速递
要闻速递:应急管理部工作组在宁夏银川市指导燃气爆炸事故应急处置工作
全国夏播粮食超七成 “先进农机+配套技术”助农增产增收-世界简讯
【报资讯】“中老班列”、江海联运双双首发 重庆市场采购贸易方式试点迎新突破
活化非遗民俗,留住最美乡愁 申城端午小长假首日接待游客276余万人次
环球热讯:增城新塘镇龙舟节6月29日举行,这些区域及路段将有交通管制
【聚看点】发送241万人次创历年端午新高,广铁迎来“史上最火端午”
全球速讯:德国柏林民众放飞气球抗议北约军演 呼吁和平解决冲突
【国际微访谈】卢旺达驻华大使:“债务陷阱”说辞十分荒谬 中国为非洲基础设施建设提供了真正的帮助
国家市场监督管理总局认可与检验检测监督管理司一级巡视员乔东接受审查调查 当前热文