讯飞星火位列国产主流大模型测评榜首位
(资料图)
500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。
《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;即将到来的8月15日会在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。
在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。
在工作效率提升方面,《报告》认为,AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。
《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。(张艳芬)
- 讯飞星火位列国产主流大模型测评榜首位
- 10分钟跑400公里 宁德时代新旗舰将发布
- 吉林省解除水旱灾害防御Ⅱ级应急响应
- 东方证券:算力板块具备较好吸引力,国产算力产业链值得重视
- 新一轮“汽车降价潮”来袭!特斯拉Model Y国内再降1.4万,Model 3限时保险补贴8000元
- 贵州联动协作惩治国企腐败 深挖细查堵塞监管漏洞
- 新华网8月14日盘中涨幅达5%
- 河南濮阳:代表建议与检察建议实现双向衔接转化
- 我市中小学幼儿园开学时间有调整!
- 狄耐克:8月11日获融资买入144.22万元
- 早间公告:大中矿业子公司以约42亿元竞拍锂矿勘查矿权成功
- 吞食孔明传李进二周目入队方法介绍(吞食孔明传李进怎么打)
- 客家匾额馆(关于客家匾额馆介绍)
- 华为nova 11软件隐藏教程
- 加蓬咝蝰蛇有毒吗(加蓬咝蝰蛇的天敌)
- 缅甸帕敢一玉石矿区发生塌方 多人受伤
- 百度文库侵权门相关的法律知识_百度文库侵权
- 今明两天贵州东部南部地区局部有大到暴雨~~~
- 吴江社保中心网站(吴江社保大厅入口)
- 逆水寒手游杭州词话龙井村任务攻略 杭州词话龙井村任务怎么过
- 捉奸界天花板?偷情男子把命根都丢了!妻子剪掉后带着命根子就跑
- 无大范围高温!未来一周安徽天气:局部大雨、暴雨!
- 沈阳国防医院口碑如何
- 文学港湾|剑钧|三角山哨所的军礼
- 通知:连休8天!
- 口渴的渴的 口渴的地精任务在哪接
- 移动卡什么套餐,流量多又便宜?
- 辽宁盘锦:红海滩碱蓬草迎来最佳观赏期
- 转氨酶高是怎么回事(张献忠屠川是怎么回事)
- 广东优化环评管理促进海洋牧场高质量发展 部分项目可免环评备案