【AIGC评测体系】大模型评测指标集

大模型评测指标集

    • (☆)SuperCLUE
    • (1)SuperCLUE-V(中文原生多模态理解测评基准)
    • (2)SuperCLUE-Auto(汽车大模型测评基准)
    • (3)AIGVBench-T2V(文生视频基准测评)
    • (4)SuperCLUE-Coder(代码助手测评基准)
    • (5)SuperCLUE-RAG(中文原生检索增强生成测评基准)
    • (6)SuperCLUE-Agent(Agent能力测评基准)
    • (7)SuperCLUE-Image(中文原生文生图测评基准)

(☆)SuperCLUE

  • CLUE官网: https://www.CLUEBenchmarks.com
  • SuperCLUE排行榜网站: https://www.superclueai.com
  • Github地址: https://github.com/CLUEbenchmark/SuperCLUE
Panda

(1)SuperCLUE-V(中文原生多模态理解测评基准)

  • 推荐文章: SuperCLUE-V: 中文原生多模态理解测评基准
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-V
Panda

(2)SuperCLUE-Auto(汽车大模型测评基准)

  • 推荐文章: SuperCLUE-Auto:首个汽车行业中文大模型测评基准发布
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-auto
Panda

(3)AIGVBench-T2V(文生视频基准测评)

  • 推荐文章: AIGVBench文生视频测评首期结果公布,1000个AI视频对比,最高72.9分,Luma仅第3
  • AIGVBench登录页: www.AIGVBench.com
Panda

(4)SuperCLUE-Coder(代码助手测评基准)

  • 推荐文章: 代码助手测评」启动,SC-Coder测评方案公布
Panda

(5)SuperCLUE-RAG(中文原生检索增强生成测评基准)

  • 推荐文章: 中文RAG检索增强生成榜单出炉!仅有一家刚刚及格
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-RAG
Panda

(6)SuperCLUE-Agent(Agent能力测评基准)

  • 推荐文章: SuperCLUE-Agent: Agent智能体中文原生任务能力测评基准
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-Agent
Panda

(7)SuperCLUE-Image(中文原生文生图测评基准)

  • 推荐文章: 文生图大模型基准测评首期榜单公布,DALL-E 3取得最高76.94分
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-Image
Panda
Panda

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/765970.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

python_zabbix

zabbix官网地址:19. API19. APIhttps://www.zabbix.com/documentation/4.2/zh/manual/api 每个版本可以有些差异,选择目前的版本在查看对于的api接口#token接口代码 import requests apiurl "http://zabbix地址/api_jsonrpc.php" data {&quo…

顺序串算法库构建

学习贺利坚老师顺序串算法库 数据结构之自建算法库——顺序串_创建顺序串s1,创建顺序串s2-CSDN博客 本人详细解析博客 串的概念及操作_串的基本操作-CSDN博客 版本更新日志 V1.0: 在贺利坚老师算法库指导下, 结合本人详细解析博客思路基础上,进行测试, 加入异常弹出信息 v1.0补…

从零开始:如何设计一个现代化聊天系统

写在前面: 此博客内容已经同步到我的博客网站,如需要获得更优的阅读体验请前往https://mainjaylai.github.io/Blog/blog/system/chat-system 在当今数字化时代,聊天系统已成为我们日常生活和工作中不可或缺的一部分。从个人交流到团队协作,从客户服务到社交网络,聊天应用…

内网渗透第四天!!!冲冲冲!!怎么绕过uac以及你会all劫持???不安全的服务路径以及服务权限,你会吗???

在第三天我们简单的说了一下绕过uac,但是我们使用的msf模块ask要对方管理员跟我们一起来进行操作,才可以进行提权的操作,这点就限制住了我们。我们今天来讲一下不用钓鱼的绕过的操作。 绕过uac: 使用uacme项目和msf联动来进行绕过…

AD9026芯片开发实录6-example code

官方发布的软件包中,带了一份example code,用于向客户展示API的调用方法以及基于官方的验证版ADRV902X最简单的bring up的流程。 该 example 位于软件包的路径下:“\Adi.Adrv9025.Api\src\c_src\app\example\”。 代码组成: initd…

.NET周刊【6月第5期 2024-06-30】

国内文章 呼吁改正《上海市卫生健康信息技术应用创新白皮书》 C# 被认定为A 组件 的 错误认知 https://www.cnblogs.com/shanyou/p/18264292 近日,《上海市卫生健康“信息技术应用创新”白皮书》发布,提到医疗信创核心应用适配方法及公立医院信息系统…

2024 年江西省研究生数学建模竞赛题目 A题交通信号灯管理---完整文章分享(仅供学习)

问题: 交通信号灯是指挥车辆通行的重要标志,由红灯、绿灯、黄灯组成。红灯停、绿灯行,而黄灯则起到警示作用。交通信号灯分为机动车信号灯、非机动车信号灯、人行横道信号 灯、方向指示灯等。一般情况下,十字路口有东西向和南北向…

二刷 动态规划

什么是动态规划 Dynamic Programming DP 如果某一问题有很多重叠子问题,使用动态规划时最有效的 动态规划中每一个状态是由上一个状态推导出来的。 动规五部曲 1.确定dp数组以及下标的含义 2.确定递归公式 3.dp数组如何初始化 4.确定遍历顺序 5.举例推导dp数…

分班查询系统,老师们应该如何制作?

新学期的开始,作为教师,我们面临的一项关键任务就是组织分班。传统分班方法往往需要处理大量的数据,这个过程不仅耗时,而且容易出错。为了简化这一流程,提高效率,我们可以利用现代技术,创建一个…

VSCode打开其它IDE项目注释显示乱码的解决方法

问题描述:VSCode打开Visual Studio(或其它IDE)工程,注释乱码,如下图所示: 解决方法:点击VSCode右下角的UTF-8,根据提示点击“通过编码重新打开”,再选择GB2312&#xff0…

【触想智能】工业平板电脑在新能源领域上的应用分析

工业平板电脑是一种具有高性能和稳定性的计算机设备,适用于在恶劣环境下进行数据采集、运营管理和现场操作。 随着新能源技术的快速发展,工业平板电脑不断地得到应用,并且已成为新能源领域中的重要工具之一。本文将从四个方面探讨工业平板电脑…

VMware Mac/Win 虚拟机软件介绍

VMware作为全球领先的虚拟化技术提供商,其Mac/Win虚拟机软件为用户带来了前所未有的跨平台操作体验。这款软件凭借其强大的功能和稳定的性能,成为了众多开发者、设计师、企业用户以及个人用户的首选工具。 强大的多操作系统支持 VMware Mac/Win 虚拟机…

c++习题06-ljc的储蓄计划

目录 一,问题 二,思路 1,思路1 2,思路2 三,代码 1,思路1代码 2,思路2代码 四,用例输入输出 一,问题 二,思路 1,思路1 定义变量&#x…

频繁调价不用愁,统一销售报价话术就用聊天宝

前言 在当今的数字化时代,企业面临着日益增长的客户服务需求,特别是在电商、销售等领域。客服团队的效率和响应速度直接影响到客户满意度和企业的专业形象。面对频繁变动的价格信息和销售策略,如何确保客服回复的及时性和准确性成为了一大挑…

uboot 编译时传递参数实现条件编译

KCFLAGS make ARCHarm KCFLAGS-DENV_DEBUG CROSS_COMPILEaarch64-linux-gnu-env/sf.c env_sf_save 加入调试信息 # saveenv Saving Environment to SPI Flash... env_sf_save (1) spi_flash_erase (2) spi_flash_write is40000 Erasing SPI flash...Writing to SPI flash.…

Git入门 本地仓库 远端仓库 多分支

Git入门 Git入门本地git初始化git仓库初始化 创建远端仓库githubgitee 指定远端仓库推送至远端多分支将feature分支合并至dev分支 其他开发者 Git入门 本地git初始化 git仓库初始化 mkdir myrepo # 创建仓库文件夹 cd myrepo/ # 进入目录 git init # 初始化git仓库 (创建.g…

YOLOv8改进 | 卷积模块 | 减少冗余计算和内存访问的PConv【CVPR2023】

秋招面试专栏推荐 :深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 💡💡💡本专栏所有程序均经过测试,可成功执行💡💡💡 专栏目录 :《YOLOv8改进有效…

某Dota/IM对战平台玩家助手、查看战绩下、胜率等

功能说明 WAR3游戏启动后,可以自动获取游戏双方的玩家列表,然后查询显示玩家的战绩及个人信息。附带查看玩家的战绩详情、最近游戏,查看对手及友方的战绩详情,据此推算出是否开黑、是否小号等信息 使用方法及运行效果 启动 查…

品牌推广怎么样?掌握正确做法,让品牌大放异彩!

品牌推广对于初创公司来说是一项至关重要的任务。在市场众多品牌中,如何脱颖而出,是每个品牌方都要考虑的问题。 作为一名手工酸奶品牌的创始人,目前全国复制了100多家门店,我来分享下,如何推广,可以让品牌…

前端基础--Vue3

Vue3基础 VUE3和VUE2的区别 2020年9月18日,Vue.js发布版3.0版本,代号:One Piece 于 2022 年 2 月 7 日星期一成为新的默认版本! Vue3性能更高,初次渲染快55%, 更新渲染快133% 。体积更小 Vue3.0 打包大小减少41%。 同时Vue3可以更好的支持T…