Суббота , 6 сентября 2025



Hermes 4: Новая эра открытых языковых моделей без цензуры

Стартап Nous Research представил семейство языковых моделей Hermes 4, которые бросают вызов лидерам рынка, таким как OpenAI и Google. Эти модели отличаются отсутствием цензурных ограничений и высокой производительностью. В этой статье мы разберём ключевые особенности Hermes 4, её преимущества и технические новшества, а также обсудим, что это значит для будущего искусственного интеллекта.

Читатель узнает: как Hermes 4 конкурирует с закрытыми системами, какие технологии лежат в основе её работы и почему отсутствие цензуры может стать новым стандартом в ИИ.

1. Что делает Hermes 4 уникальной?

Открытость и свобода от цензуры

В отличие от коммерческих моделей, таких как GPT-4 или Claude, Hermes 4 практически не имеет ограничений на контент. «Пользователь должен решать самостоятельно, что важно, а что нет» — заявляют разработчики. Это делает модель идеальной для задач, где требуется максимальная гибкость.

Гибридные рассуждения

Hermes 4 использует уникальный механизм гибридных рассуждений, который позволяет переключаться между быстрыми ответами и глубоким анализом. Это обеспечивает как скорость, так и точность в решении сложных задач.

Технические достижения

  • Результаты тестов: 96,3% в MATH-500 и 81,9% в AIME’24.
  • RefusalBench: 57,1% против 17% у GPT-4o.

2. Технологии обучения Hermes 4

DataForge: Генератор синтетических данных

DataForge преобразует простые данные в сложные ответы на основе графов. Например, статья из Википедии может быть превращена в рэп-стихи с последующей генерацией вопросов и ответов.

Atropos: Фреймворк обучения с подкреплением

Atropos включает сотни обучающих сред для отработки навыков: математики, программирования и творческих задач. Обратная связь поступает только при правильных решениях.

>Обучение на масштабных данных

>При обучении использовались:>

>

  • >5 млн примеров с рассуждениями>
  • >

  • >6 млн примеров без рассуждений>
  • >

  • >192 ИИ-ускорителя Nvidia B200>
  • >

  • >71 616 GPU-часов (около 15 дней полной загрузки)>

    >>Это обеспечило высокую производительность модели даже на сложных задачах.

    >Ограничения и будущее Hermes >

    >Вычислительные ресурсы>

    >Hermes > требует значительных мощностей для работы>, что делает её менее доступной для рядовых пользователей по сравнению с коммерческими системами./>«Мы работаем над оптимизацией>, чтобы сделать модель более доступной», — говорят разработчики./

    >Проблемы с объёмом рассуждений>

    >Младшая модель с > млрд параметров в > случаев достигала максимальной длины контекста>, что приводило к бесконечным циклам./

      >

    • >Решение: остановка процесса на > токенов сократила инциденты на >–79%.
    • >

    • >Качество ответов при этом сохранилось на высоком уровне./

      >Открытые модели vs коммерческие системы>

      >>Несмотря на достойные результаты>, Hermes > сложнее в использовании>, чем решения от OpenAI или Google./>«Мы верим>, что прозрачность и свобода важнее корпоративных политик», — подчёркивают в Nous Research./

      >>Заключение: Почему Hermes > важен?>

      >>Hermes > представляет собой новую веху в развитии открытых языковых моделей./

        >>

      • >>Альтернатива крупным коммерческим системам.
      • >>

      • >>Отсутствие цензуры и прозрачность «мыслительного» процесса.
      • >>

      • >>Высокая производительность в тестах./

        >>Nous Research доказала>, что открытые модели могут быть не только конкурентными>, но и более гибкими>, предоставляя пользователю полный контроль над ИИ./