
Компанія Google відреагувала на запуск ChatGPT Translate, представивши новий набір моделей штучного інтелекту для перекладу, який вийшов за кілька годин після релізу OpenAI.
Сімейство моделей Google TranslateGemma охоплює 55 мов (у тому числі українську) і включає три версії:
- 4B — для використання на смартфонах;
- 12B — для ноутбуків;
- 27B — для роботи на хмарних серверах.
Для розробки були використані дані Gemma 3, а також контрольоване налаштування (SFT) з використанням різноманітних даних — як людських перекладів, так і синтетичних від Gemini. Як стверджують у Google, це допомогло моделям досягти високої якості перекладу навіть для мов з обмеженими ресурсами. Додаткове покращення якості було досягнуто завдяки навчанням з підкріпленням (RL).
Компанія Google оцінила якість моделей, використовуючи MetricX — показник, що вимірює кількість помилок в перекладі. Чим нижче значення, тим менше помилок: цікаво, що модель TranslateGemma з 12 мільярдами параметрів отримала 3,60 бали, що перевищує 4,04 бали базової моделі з 27 мільярдами параметрів (приблизно на 26% менше помилок).

Нові моделі штучного інтелекту Google навчались та тестувались на 55 мовних парах, серед яких іспанська, французька, китайська, хінді та інші. Крім того, компанія навчила модель на додаткових 500 мовних парах. Серед важливих можливостей цієї системи — можливість обробляти зображення: ШІ здатен розпізнавати текст зі сканів, скріншотів, фотографій і перекладати його.

Моделі TranslateGemma вже доступні для завантаження на платформах Kaggle та Hugging Face.








