LiveCodeBench

LiveCodeBench

無料コードアシスタント

LiveCodeBench是一个面向代码大语言模型的全面且无污染的评估基准。它持续收集最新编程竞赛题目,支持代码生成、自我修复、执行与测试预测等多场景评测,帮助研究者客观衡量模型的泛化能力与真实水平。

公式サイトへ
LiveCodeBench

当サイトの評価

AIが分析中...

こんな人が使っています

personas.forDevelopers🎓学生向け

機能

最新の競技問題を継続的に収集し、トレーニングデータの汚染を防ぐ
コード生成、自己修復、実行およびテスト予測などの多面的な側面をカバーする
時間別に分類されたモデルの一般化能力の動的評価を提供する
オープンソースの提出メカニズムで、カスタムモデルの接続とランクリストの更新をサポートする
複雑なコードタスクにおけるオープンソースモデルとクローズドソースモデルのパフォーマンスを深く比較する

ユースケース

未見のプログラミング問題における大規模言語モデルの実際の汎化能力を評価するさまざまなコードモデルにおける生成、修正、実行タスクでのパフォーマンスの違いを比較する伝統的なベンチマークテストにおいてモデルが潜在的に過学習している問題を検出および分析する

おすすめユーザー

AI大規模モデル研究者コード大規模モデル開発者アルゴリズムコンテストおよびプログラミング教育従事者

料金

無料

類似ツール

関連ツール