Автор: Анастасія Апетрі
Про це пише NV.
“Наш експеримент приніс кілька несподіваних результатів. Англійська, попри свій статус основної мови для навчання моделей, не стала лідером. Найкращі результати штучний інтелект показав саме з польською мовою, особливо під час роботи з довгими текстами”, — йдеться у звіті дослідників.
Учасники дослідження визнали цей результат парадоксальним, адже польська мова традиційно вважається складною для вивчення людиною. Проте ШІ, схоже, без труднощів справляється з її граматикою та структурами. Польське патентне відомство прокоментувало відкриття словами: “З польською мовою виникають труднощі у людей, але не у штучного інтелекту”.
Особливо цікаво, що польська посіла перше місце попри значно меншу кількість даних для навчання моделей порівняно з англійською чи китайською. Остання, до речі, опинилася майже внизу рейтингу — на 23-му місці з 26.
Дослідники припускають, що причиною такого успіху польської може бути її чітка граматична структура, а також висока морфологічна різноманітність, яка, навпаки, допомагає моделям краще розпізнавати контекст і зв’язки між словами.
У десятку найефективніших мов для ШІ увійшли: польська, французька, італійська, іспанська, російська, англійська, українська, португальська, німецька та нідерландська.

