Алгоритм Google BERT обновлён

9 декабря 2019

Модели BERT в Google Поиске 2019

21 октября 2019 Google выкатил алгоритм, работающий пока что только на английском языке. Какие изменения произошли в декабре? Стал ли BERT понимать русскую речь?

Не всегда у пользователя есть знания, чтобы точно сформулировать запрос. Трансформеры — модели, обрабатывающие слова, принимая во внимание контекст, в котором они использованы. Это дало возможность понимать смысл запроса пользователя. Задача алгоритма BERT — понимать, что ищет пользователь, и подобрать точный ответ, независимо от формы запроса. Для этого нужно понимать язык, уметь работать с разговорными запросами. В декабре 2019 года Google стал делать это лучше. Может быть и для зоны ru есть изменения? Посмотрим...

Работа алгоритма BERT в русскоязычном секторе

Проверила работу алгоритма Google BERT на распознавание омонимов и заодно синонимов. По словам Google, "модели BERT могут рассматривать полный контекст слова, глядя на слова, стоящие до и после него, что особенно полезно для понимания цели поисковых запросов".

Ввела в строку поиска Google слово "фидер". В выдаче были фидеры (рыбная ловля) - 9 результатов и фидеры (радиотехника) - 1 результат на второй позиции.

Чтобы Google меня понял, зашла на парочку сайтов, предлагающих фидеры для рыбной ловли. Далее ввела уточняющий запрос "фидер оптима". В выдаче - только Волжанка.

Набираю "фидер оптимальный". Выдает информационные сайты с заголовками "как выбрать фидер для рыбной ловли". В первую очередь выдаёт рекламу - товарные предложения. Ниже находится информационный сайт со словом "оптимально" в description, далее, сайт без этого слова в тексте. Далее - видеоряд.

Снова ввожу "фидер", не чистя кеш, - получаю исходную выдачу.

Проверяю на понимание частицы "не" (отрицания). Ввожу "фидер не рыболовный", "фидеры, кроме рыболовных", выдаёт только рыболовные фидеры.

Мои выводы

Google хорошо понимает контекст и в русскоязычном сегменте, но с языковыми особенностями русского языка у алгоритма всё еще остаются большие проблемы.