AlpacaEval

AlpacaEval

無料コードアシスタント研究開発ツール

AlpacaEval 是一个基于 LLM 的自动评估工具,用于评估模型遵循指令的能力,快速、廉价且可靠。

公式サイトへ
AlpacaEval

当サイトの評価

AIが分析中...

こんな人が使っています

personas.forDeveloperspersonas.forResearchers🎓学生向け

機能

AlpacaFarm評価セットに基づく
GPT-4を用いた自動ラベリング
人間のラベリングと高い一致度
コミュニティ貢献モデルおよび評価セットをサポート
詳細な分析ドキュメントを提供

ユースケース

言語モデルの指示遵守能力の評価異なるモデルのパフォーマンスの比較モデル評価におけるコミュニティの貢献の促進

おすすめユーザー

研究者開発者AIモデル評価者

料金

無料

類似ツール

関連ツール