Kandinsky научился понимать иностранные языки

На международной конференции по искусственному интеллекту Artificial Intelligence Journey Сбер представил Kandinsky 2.0 — усовершенствованную версию нейросети Kandinsky, которая дебютировала в июне этого года. Как заявляют создатели, это первая российская мультиязычная диффузионная модель для генерации изображений по текстовому описанию с 2 млрд параметров. Kandinsky 2.0, в отличие от предшественника, может обрабатывать запросы на 101 языке и, как утверждают разработчики, делает это одинаково быстро и качественно вне зависимости от того, какой язык используется — распространённый, вроде русского и английского, или редкий, например, монгольский.
Нейросеть разработали и обучили исследователи Sber AI при поддержке учёных из Института искусственного интеллекта AIRI. Увидеть, как она рисует, можно на сайте FusionBrain, а также при помощи команды «Запусти художника» на умных устройствах Sber и в мобильном приложении Салют. Как отмечают создатели Kandinsky 2.0, она за несколько секунд позволяет получить уникальное изображение под конкретную задачу и свободно распространять его без лицензии, что очень актуально для бизнеса. По их мнению, нейросеть рисует реалистичные изображения, которые зачастую неотличимы от тех, что создают люди.