Сайт

Категорія


Залишилось редагувати: 314


Наступний додаток

DeepSpeed Chat

Повний конвеєр RLHF для навчання моделей, подібних до ChatGPT

Про DeepSpeed Chat

Microsoft недавно випустила DeepSpeed-Chat, вигідний вартістю, відкритий інструмент, який може бути використаний для створення високопродуктивних моделей, подібних до ChatGPT. З його допомогою можна тренувати моделі з до 13 мільярдів параметрів на одному GPU або за низькою вартістю у $300, використовуючи Azure Cloud. DeepSpeed-Chat використовує DeepSpeed-Inference та DeepSpeed-Training для швидшого тренування і підтримує розміри моделей, що в 7,5 рази більші, ніж інші рішення. Таким чином, DeepSpeed-Chat робить складне тренування RLHF доступним, простим і доступним для спільноти штучного інтелекту.

Перша версія DeepSpeed-Chat включає три основні функції:

  • Простий у використанні досвід тренування та інференсу для моделей, подібних до ChatGPT.
  • DeepSpeed-RLHF конвеєр.
  • DeepSpeed-RLHF система.

Скріншоти DeepSpeed Chat

DeepSpeed Chat - скріншот 1

Читати англійською