👀🍭☎
新民晚报讯(记者金志刚)近日,复旦大学自然语言处理(NLP)实验室LLMEVAL团队公布了2024年高考数学大模型评测结果。数据显示,字节豆包在2024高考数学新II卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二三位。而在高考数学新I卷评测排名中89HG.COM,字节豆包也排在前列。
评测选取2024高考数学新I卷和新II卷的14道客观题,参评“选手”涵盖GPT-4o、文心一言、阿里千问、字节豆包等主流大模型。GPT-4o是OpenAI于今年5月新推出的大语言模型,数学能力是其发布会现场着重展现的能力模块。但结果显示,部分国产大模型在本次数学评测中的成绩优于GPT-4o。在新II卷客观题测试中,字节豆包成绩排在首位,其次是阿里千问和GPT-4o。
今年5月,豆包大模型在火山引擎原动力大会上正式发布。相关数据显示,在MMLU、BBH、GSM8K、HumanEval等11个业界主流的公开评测集上,Doubao-pro-4k的总分为76.8分,优于同期测试的其他国产模型。在数学能力、语言理解能力,以及综合评测集CMMLU和CEval的评测上,豆包也有不错的表现,得分排在前三。
👈(撰稿:柯绍芳)本溪除雪,石家庄禁面,四川公职人员集体脱岗......热搜管政务,管得过来吗?
2024/06/16诸舒江🏌
价格周报|猪价继续上行,近两个月上涨超20%
2024/06/16桑娟荣⚷
南非媒体:非国大与民主联盟就组建团结政府达成协议
2024/06/16储叶希❃
浙菜:我们不止杭帮菜,还有“鲜”和远方
2024/06/16晏乐博⚬
爆发强劲势能!固德威整体解决方案2024SNEC焕发领潮力量
2024/06/16吉盛晶🔴
中南大学湘雅二医院桂林医院:让患者眼里有光 心中燃起希望
2024/06/15郑曼瑾☭
『展览』首尔特展《卡地亚.时之结晶》
2024/06/15向瑾洁♠
美司法部:凤凰城警方有种族歧视和过度使用武力行为
2024/06/15赵瑞宽c
为传统民俗增添新魅力
2024/06/14屈心进m
四川发布干部任前公示
2024/06/14魏荷梅👐