首页 > 汽车

新华社研究院发布国产大模型报告:讯飞星火第一 智商最高、工具提效能力最强

来源:中金在线 时间:2023-08-13 23:44:26


(相关资料图)

500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。    《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。  面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;即将到来的8月15日会在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。  在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。  在工作效率提升方面,《报告》认为,AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。  《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。

相关稿件

新华社研究院发布国产大模型报告:讯飞星火第一 智商最高、工具提效能力最强

江苏盐城大丰区发生疑似龙卷风

记者:新月正在等内马尔的同意,巴黎将收到超过6000万欧的转会费

北京门头沟:截至12日18时 第一轮山区巡诊已基本实现全覆盖

你花样百出、我见招拆招!安顺交警严查“黑车”

世锦赛创佳绩、国家级赛事“一炮双响”!这个周末乐从好“燃”!

党参怎么保存(党参怎么保存比较好)

2023年8月票房破40亿

雷阵雨还在线,35℃高温又要回来了

“泰安高铁站按摩椅占近9成”数据不实!但它依然惹人嫌

云南楚雄发生4.4级地震 消防救援力量赶往震中

外媒:中国出境游恢复势头良好

中国智慧科技如何成就世界级领先?

蒋定尧(关于蒋定尧简述)

拆迁等费用过亿!昌平这处棚改地块又有新批复!一“广场”被规划为商业!

95平方高压电缆能带多少千瓦 95平方电缆带多少千瓦

家庭影院组成5.1部分有哪些(家庭影院的组成)

工龄越长养老金涨越多吗?2023年上涨养老金工龄养老金挂钩如何调整?

良信股份(002706):业绩提速明显 降本增效带动盈利趋势向上

云南多地举行火把节 多举措解决拥堵“痛点”

沿着环岛旅游公路看海南 游客“快进慢游”体验海岛风光

bv和bvr电线哪个好 什么是BV线

“创造新文化,书写新《春秋》!”听,这是戏剧人对中华文化的炙热倾诉!|青年导演创作扶持计划(第二季)

汉庭如家价格直逼香格里拉背后:客房数量赶英超美但盈利能力差距大

圣诞礼物便宜又贴心想知道怎么让垃圾桶绝不再丢失

西安市突发山洪泥石流已发现21名遇难者 仍有6人失联

西安长安区救灾现场共转移受灾群众81人 已搜救出4名遇难者

智·领先行 东风Honda全新英仕派杭州区域隆重上市

王秋明:我们今天做足了准备,但被对手打进一个点球非常遗憾

柬埔寨用中国品牌的汽车去机场接王毅,还在舷梯上安装了防晒棚。