Фото Thomas Peter / REUTERS
В Китае развернута самая большая в мире сеть из 200 млн камер наружного наблюдения, а банкоматы уже производят аутентификацию по лицу клиента. Все это говорит о том, что машинное зрение здесь стало главным технологическим трендом на ближайшие несколько лет
Десятого января появилась новость, что китайский стартап по распознаванию лиц SenseTime привлек инвестиции на $2 млрд. Компания занимается ИИ, фокусируясь на машинном зрении и распознавании лиц. Сделка еще не состоялась, — пока что это лишь слухи, — но по-настоящему важна даже не сама новость, а феномен китайского ИИ-рынка в целом и факт его бурного развития.
На взгляд машины
Машинное зрение — одно из направлений искусственного интеллекта, под которым понимается распознавание образов на изображениях и видео. Соответствующие алгоритмы появились уже давно, а конкуренция построена на уменьшении процента ошибок и оптимизации производительности в проектах. Второе особенно важно в промышленном применении: в Китае, например, самая большая в мире сеть из 200 млн камер наружного наблюдения, и потоковое распознавание лиц требует колоссального объема вычислительных мощностей.
Есть и множество других практических применений технологии. Например, банкоматы определенных банков Китая уже производят аутентификацию по лицу клиента и PIN-коду. Тестируется распознавание соответствия лица и паспорта на паспортном контроле, а смартфоны научились классифицировать даже некачественные снимки в галерее по содержанию — все это результат применения ИИ. Говоря об использовании технологии распознавании объектов, кроме беспилотных автомобилей можно упомянуть также о медицине (определении раковых опухолей на ранних этапах) или промышленности. Да, алгоритмы пока что ошибаются в решении этих ответственных задач, но реже человека. В сумме текущий рынок пока не настолько велик, как, скажем, рынок сервисов по доставке еды, но в потенциальной перспективе — огромен. В 2017 году его объем составлял $34 млрд, а Китай на нем занимал 9,4%.
Кроме научных университетов и исследовательских департаментов корпораций вроде Baidu с Tencent, в Китае есть четыре большие частные компании, занимающиеся машинным зрением. Все четыре монетизируются за счет B2B и государственных контрактов.
SenseTime, даже без учета запланированного инвестраунда, — самая крупная из них. Основанная четыре года назад профессором гонконгского университета Сяо Тангом, корпорация занималась в первую очередь распознаванием лиц на фото и видео. Сейчас портфолио предлагаемых сервисов расширилось за счет распознавания любых образов (не только лиц), в том числе для беспилотных автомобилей и обработки изображений. Серьезное финансирование удалось привлечь летом 2017 — $410 млн при оценке в $1,5 млрд. В 2018 состоялся раунд уже на $1,2 млрд при оценке в $4,5 млрд, в том числе от Alibaba Group. Инвестиции при этом нужны на ускорение исследований и разработки новых продуктов.
Конкурирующий Face++, занимаясь по большому счету теми же самыми технологиями, привлек в сумме $1,2 млрд за все время и сейчас готовится к новому раунду на $500 млн по оценке $3,75 млрд. Так же как и SenseTime, компания быстро растет и приносит прибыль. Компания уже совершила аутентификацию для 295 млн человек. Одно из самых известных применений — авторизация в AliPay: технология аналогичная FaceID на смартфонах Apple, но работающая на камерах Android-устройств.
В Face++ инвестировал фонд Ant Financial, принадлежащий Alibaba: стартапы пригодятся компании для верификации онлайн- и оффлайн-платежей в ретейле. Ant Financial проинвестировал еще трех подобных единорогов. Между тем, в компанию Face++ вложился и российско-китайский инвестиционный фонд. Стратегия РКИФ в этом случае не совсем ясна, но в любом случае крупные инвесторы являются сигналом прибыльного и быстрорастущего бизнеса.
На третьем и четвертом местах CloudWalk, привлекший в сумме $538 млн с последней оценкой в $3,5 млрд, и YITU, поднявший $355 млн при оценке в $2,3 млрд. Технология у всех одна и та же, но компании отличаются предложенными решениями: одни разрабатывают системы безопасности, другие, например, аутентификацию платежей по лицу через смартфон. О пузыре говорить не приходится: инвесторы — как государственные, так и частные фонды — ожидают получить 15-кратную прибыль.
Дело государственной важности
Говоря о государственных контрактах, нельзя не отметить сильную поддержку не только машинного зрения, а всего направления искусственного интеллекта правительством Китая. В 2017 году в стране составили национальный план развития AI и сформировали специальное ведомство на пересечении нескольких министерств. Оно назначило пять компаний ответственными за каждую из областей: SenseTime — за машинное зрение, Baidu — за беспилотные автомобили, Alibaba Cloud — за умный город (сейчас это управление светофорами и камеры наблюдения), Tencent — за медицинские применения, а iFlyTek, публичную компанию с капитализацией $9 млрд, — за Natural Language Processing, то есть понимание естественного языка и синтез речи.
Кроме финансирования развитию алгоритмов помогает и политика в области обработки данных. У китайских компаний доступ к ним гораздо проще, чем у западных, да и сами китайцы по опросам гораздо легче делятся персональной информацией ради улучшения сервиса, чем жители любой другой страны.
С точки зрения глобальной перспективы Китай пока лишь догоняет США. Да, число патентов и публикаций в научных журналах в Китае уже выше, чем в США. Но если смотреть на результаты, то, например, тот же Waymo на голову выше Baidu Apollo в разработке беспилотных автомобилей с точки зрения объема и результатов тестов (числа вмешательств живого водителя). Однако, согласно планам правительства, Китай хочет стать мировым лидером к 2030 году, и кажется, что к этому есть все предпосылки.
- Под присмотром: во сколько обойдется система распознавания лиц на улицах Москвы