Команда Microsoft Research AI объявила, что планирует открыть исходный код оптимизированной версии модели Google BERT, созданной для работы с движком ONNX Runtime.


В настоящее время использование ONNX Runtime позволяет сократить задержки в работе BERT при реализации языкового представления для поисковой системы Bing.


Теперь разработчики смогут внедрять BERT, используя ONNX Runtime и графический процессор Nvidia V100 с задержкой всего лишь 1,7 миллисекунды, что ранее было доступно только для крупных технологических компаний.


Оптимизированная модель Google BERT, созданная Microsoft, является результатом сотрудничества между командами Azure AI и Microsoft Research AI.


Подробнее об открытом обмене нейронными сетями (ONNX) можно прочитать здесь.


Напомним, что Google объявил о запуске BERT Update, который помогает поисковой системе лучше понимать запросы на естественном языке, в октябре минувшего года. При этом Bing начал использовать подобные BERT модели ещё в апреле 2019 года.





Обсудить  

Читайте также


Комментарии Кто голосовал Похожие новости