LLMEval

免费学术研究编程助手数据分析开发者工具

LLMEval is a research initiative from Fudan NLP Lab, providing rigorous and fair evaluation frameworks for large language models across multiple domains.

访问官网

我们的评价

AI 正在分析...

像谁在用

personas.forAnalystspersonas.forDeveloperspersonas.forResearchers🎓学生友好

核心功能

Comprehensive evaluation across 13+ academic disciplines

Adversarial hardening for robustness

Physician-validated medical benchmark

Contamination-resistant data curation

Automated LLM-as-a-judge process

适用场景

Evaluating the performance of large language modelsResearching logical reasoning capabilitiesAssessing fairness and robustness in AI models

适合人群

ResearchersAI developersMedical professionals

定价

免费

相似工具

Andi

免费

Andi is a generative AI-powered search engine that provides direct answers instead of just links.

学术研究

Cody

免费

AI assistant transforming business knowledge management with customizable integration.

编程助手

Perplexity

免费增值

Find and summarize trusted web information instantly.

学术研究

Where To

免费

Unleash data-driven location insights with AI-powered geospatial analytics.

数据分析

IngestAI

免费增值

One-stop shop for anyone looking to leverage AI.

数据分析

Casper AI

免费

AI tool for summarizing content, enhancing productivity seamlessly.

学术研究

LLMEval

我们的评价

像谁在用

核心功能

适用场景

适合人群

定价

相似工具

Andi