AlpacaEval

AlpacaEval

免费编程助手学术研究开发者工具

AlpacaEval 是一个基于 LLM 的自动评估工具,用于评估模型遵循指令的能力,快速、廉价且可靠。

访问官网
AlpacaEval

我们的评价

AI 正在分析...

像谁在用

personas.forDeveloperspersonas.forResearchers🎓学生友好

核心功能

基于 AlpacaFarm 评估集
使用 GPT-4 进行自动标注
高与人工标注的一致性
支持社区贡献模型和评估集
提供详细分析文档

适用场景

评估语言模型的指令遵循能力比较不同模型的性能促进社区对模型评估的贡献

适合人群

研究人员开发者AI 模型评估者

定价

免费

相似工具

相关推荐