WOLFRAM

Wolfram LLM
Проект сравнительного анализа

Использование Wolfram Language для сравнения производительности основных LLM

Будучи основными пользователями и аналитиками технологии больших языковых моделей (LLM), мы постоянно следим за производительностью LLM. Этот проект включает в себя публикацию наших текущих результатов, изначально для конкретной хорошо изученной задачи генерации кода.

Задача состоит в переходе от спецификаций на английском языке к коду на языке Wolfram Language. В качестве тестовых примеров используются упражнения из книги Стивена Вольфрама Элементарное введение в Wolfram Language. Миллионы людей выполняли эти упражнения онлайн, и мы разработали эффективные инструменты для функционального тестирования кода, которые сейчас применяем в LLM.

Эта таблица и предыдущие версии доступны в электронной форме в репозитории данных Wolfram.

Узнайте, как Wolfram Language может улучшить результаты вашей большой языковой модели.

Для разработчиков LLM: свяжитесь с нами, чтобы получить набор данных и инструменты или договориться о включении вашего LLM.