DeepSpeed Chat
Повний конвеєр RLHF для навчання моделей, подібних до ChatGPT
Про DeepSpeed Chat
Microsoft недавно випустила DeepSpeed-Chat, вигідний вартістю, відкритий інструмент, який може бути використаний для створення високопродуктивних моделей, подібних до ChatGPT. З його допомогою можна тренувати моделі з до 13 мільярдів параметрів на одному GPU або за низькою вартістю у $300, використовуючи Azure Cloud. DeepSpeed-Chat використовує DeepSpeed-Inference та DeepSpeed-Training для швидшого тренування і підтримує розміри моделей, що в 7,5 рази більші, ніж інші рішення. Таким чином, DeepSpeed-Chat робить складне тренування RLHF доступним, простим і доступним для спільноти штучного інтелекту.
Перша версія DeepSpeed-Chat включає три основні функції:
- Простий у використанні досвід тренування та інференсу для моделей, подібних до ChatGPT.
- DeepSpeed-RLHF конвеєр.
- DeepSpeed-RLHF система.
Скріншоти DeepSpeed Chat
Читати англійською