热头条丨模型“日日新”:商汤“商量SenseChat 2.0”多个评测基准综合表现超ChatGPT
(资料图)
上证报中国证券网讯(记者 宋薇萍)商汤科技近日公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。根据评测结果,“商量SenseChat 2.0”在三个测试集中表现均领先ChatGPT,实现了我国语言大模型研究的重要突破。
截至目前,已有近千家企业客户通过申请,应用和体验“商量SenseChat 2.0”超强的长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力,并且“商量SenseChat 2.0”还在服务客户过程中,持续实现着快速迭代和提升,以及知识的实时更新。
商汤科技公布的评测结果中,选取了全球三大权威语言模型测评基准MMLU、AGIEval、C-Eval,结果显示“商量SenseChat 2.0”在三个测试集中表现均领先ChatGPT,部分已十分接近GPT4的水平。
其中,MMLU是由美国加州大学伯克利分校、哥伦比亚大学、芝加哥大学及伊利诺伊大学厄巴纳-香槟分校联合打造的大规模多任务语言理解的评测基准,涵盖了科学、技术、工程、数据,人文、社会科学等领域的57个科目,难度从初级水平到高级专业水平,考验世界知识和解决问题的能力。
在该评测中,“商量SenseChat 2.0”综合得分为68.6,远超GLM-130B(45.7分)的得分,同时还超过了ChatGPT(67.3分)、LLaMA-65B(63.5分)仅落后GPT-4(86.4分),位居第二。
AGIEval是由微软研究院发布的,专门用于评估基础模型在人类认知和问题解决相关任务中表现出的一般能力,从而实现模型智能和人类智能的对比。
在该评测中,“商量SenseChat 2.0”测出49.91的分数,遥遥领先GLM-130B(34.2分)、LLaMMA-65B(34.0分),并再次超越ChatGPT(42.9分),仅次于GPT-4的56.4分。在其中的AGIEval(GK)评测子集中,“商量SenseChat 2.0”以58.5分全面领先,仅微弱差距落后GPT-4(58.8分)。
C-Eval是由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别。
面对C-Eval评测基准,“商量SenseChat 2.0”拿到了66.1的分数,在参评的18个大模型中,仅次于GPT-4(68.7分),全面领先ChatGPT等一众海内外大模型。其中,C-Eval(Hard)子评测集,是选择了8个具有挑战性的数据、物理和化学科目,进一步考核大语言模型的推理能力,“商量SenseChat 2.0”也表现居于前列。
据悉,今年4月,商汤正式发布“商汤日日新SenseNova”大模型体系,以及自研中文语言大模型“商量SenseChat”。截至6月,全球范围内正式发布的大语言模型已超过40款,其中由中国厂商、高校、科研院所等发布的大语言模型近20款。
关键词:
相关新闻
- 热头条丨模型“日日新”:商汤“商量SenseChat 2.0”多个评测基准综合表现超ChatGPT
- 【天天新视野】首届国际智慧养老产业博览会将在深圳举办
- 2023算力互联互通大会成功在京召开|热资讯
- 广东:大力推进耕地保护节约集约用地 全面推进全域土地综合整治_每日视讯
- 天天关注:gost俄罗斯国家标准_gost
- 广汽集团最新公告:拟向广汽三菱提供委托贷款不超过9.42亿元
- 汇安成长优选混合增聘基金经理单柏霖 柳预才离任
- 2023国产机器人龙头企业市场份额状况
- 看热讯:扇头、脚踹这是老师该有的样子吗?毁三观!
- 中伟股份:全资子公司与POSCO Future M签署合资协议_天天速递
- 考生之家登录_考生之家
- 环球今日报丨汇隆活塞北交所上市首日涨51% 募1.35亿申万宏源保荐
- 林志玲一家三口首被拍,夫妻私下时髦得像出街,儿子个头超大真胖
- “上山下海”洗龙水!海口秀英区邀您一起体验端午“仪式感”[图]-全球快讯
- 如果处女座有这些表现,说明真的对你走心了 当前看点
- 环球热门:国家邮政局:1-5月邮政行业业务收入累计完成5963.9亿元 同比增长12.2%
- 1m3lng等于多少天然气_1吨lng等于多少立方米天然气 今头条
- 电脑桌面图标不见了怎么恢复win10_电脑桌面图标不见了怎么恢复 当前热议
- 单伟红主持召开第二次区委班子解放思想案例研讨剖析会
- 国企下岗职工社保新政策文件-国企下岗职工社保新政
- 世界最资讯丨孕妇可以吃槐花吗_槐花功效内容
- 返乡新青年 振兴新力量
- 本赛季金童奖候选出炉,看看谁能够获得1.穆西亚拉...
- 留给失踪潜艇的时间不多了!还剩约40小时氧气支持 美国防部派飞机协助搜救_全球观热点