始徒Beginner
大模型如何评测?
🛠工具与编程
人工智能
,
大模型
,
指标
,
评测
doggie
2025年11月24日03:11
1
看了,比较有用
【转载】大语言模型评估的常用方法、指标与框架
【转载】如何测评大模型对长文本处理的性能
【转载】大模型有哪些评估指标?
【闪客】大模型是如何测试的?以Gemini3为例_哔哩哔哩_bilibili
你知道用什么指标评价一个大模型的好坏吗?PPL,MMLU,MATH,GPQA,BBH,IF-EVAL,MMLU-PRO_哔哩哔哩_bilibili
看看别人怎么做的
阿里
快速评测大语言模型-人工智能平台 PAI(PAI)-阿里云帮助中心
看了,废话连篇
【转载】大模型评测指标全解析:如何精准衡量AI模型的性能
Related topics
話題
回覆
觀看
活動
大模型测评指标——困惑度
🛠工具与编程
大模型
,
困惑度
0
16
2026年04月29日
【转载】大模型有哪些评估指标?
🛠工具与编程
转载
,
大模型
,
测评指标
0
13
2025年11月25日
【转载】大语言模型评估的常用方法、指标与框架
🛠工具与编程
转载
,
大模型
,
测评指标
0
101
2025年11月24日
大模型评测工具DeepEval
🛠工具与编程
评测
,
指标
0
14
2025年11月25日
中文大语言模型评测第三期
🛠工具与编程
评测
0
16
2025年12月20日