Структурированный блокнот   
 Машинное обучение (Machine Learning, обучающиеся алгоритмы) →  Обучение с учителем (Supervised learning) →  Language models →  Метрики качества языковых моделей →  Публичные бенчмарки →  

Simple Bench

https://simple-bench.com/

Подбирают заковыристые вопросы на логику, в которых путаются текущие LLM, но при этом достаточно легко разбираются люди.
Поиск по записям: только в текущем разделе.