DAPO

DAPO

無料コードアシスタント

DAPO是一款开源的大语言模型强化学习训练系统,基于verl框架构建。它通过动态采样与解耦裁剪等核心算法,显著提升模型训练效率与稳定性,并在数学推理任务中表现优异。项目完全开源算法、数据集及训练脚本,助力AI研究与开发。

公式サイトへ
DAPO

当サイトの評価

AIが分析中...

こんな人が使っています

🎓学生向け

機能

完全オープンソースのアルゴリズム、データセットおよびモデル重み
ダイナミックサンプリング戦略によるトレーニング効率の向上
エントロピークラッシュを回避するデカップルカット技術
すぐに使えるトレーニングスクリプトを提供
大規模なGPUクラスターでの効率的なトレーニングをサポート

ユースケース

大規模言語モデルの強化学習トレーニング数学的推論能力の専門的な最適化AIアルゴリズムの研究と実験の再現

おすすめユーザー

AI研究者大規模モデルアルゴリズムエンジニアオープンソース技術開発者

料金

無料

類似ツール

関連ツール