Машинное обучение может дать компаниям конкурентное преимущество за счет использования собираемых ими данных — например, моделей покупок — для создания прогнозов, которые помогут повысить прибыльность продуктов (например, рекомендации по электронной торговле). Но любому сотруднику сложно не отставать, а тем более управлять огромными объемами создаваемых данных. Это создает проблему, поскольку системы ИИ, как правило, дают превосходные прогнозы, когда им предоставляются самые свежие данные. Системы, которые не проходят регулярную переобучение на новых данных, рискуют со временем устареть и стать менее точными.
К счастью, новый набор методов, получивших название «MLOPs», обещает упростить процесс подачи данных в системы за счет абстрагирования от сложностей. Одним из ее сторонников является Майк Дель Бальсо, генеральный директор Tecton. Дель Бальсо стал соучредителем Tecton, когда работал в Uber, когда компания изо всех сил пыталась создавать и развертывать новые модели машинного обучения.
«Модели, оснащенные высокоточными функциями реального времени, могут давать гораздо более точные прогнозы. Но создание конвейеров данных для создания этих функций сложно, требует значительного количества специалистов по обработке данных и может увеличить сроки реализации проекта на недели или месяцы», — сказал Дель Бальсо в интервью TechCrunch по электронной почте.
Дель Бальсо, который ранее возглавлял группы машинного обучения поисковой рекламы в Google, запустил Tecton в 2019 году вместе с Джереми Херманном и Кевином Штумпфом, двумя бывшими коллегами Uber. Во время работы в Uber трио создало Michelangelo, платформу искусственного интеллекта, которую Uber использовала внутри компании для создания прогнозов рынка, расчета ожидаемого времени прибытия и автоматического обнаружения мошенничества, а также для других вариантов использования.
Успех Микеланджело вдохновил Дель Бальсо, Германа и Штумпфа на создание коммерческой версии технологии, которая стала называться Tecton. Инвесторы последовали его примеру. Например, сегодня Tecton объявила о привлечении 100 миллионов долларов в рамках раунда серии C, в результате чего общая сумма привлеченных средств компании составила 160 миллионов долларов. Транш возглавил Кляйнер Перкинс при участии компаний Databricks, Snowflake, Andreessen Horowitz, Sequoia Capital, Bain Capital Ventures и Tiger Global. Дель Бальсо говорит, что он будет использоваться для масштабирования инженерных и маркетинговых команд Tecton.
«Мы ожидаем, что программное обеспечение, которое мы используем сегодня, будет высоко персонализированным и интеллектуальным», — сказал партнер Kleiner Perkins Баки Мур в заявлении, предоставленном TechCrunch. «Хотя машинное обучение делает это возможным, это остается далеким от реальности, поскольку создание поддерживающей инфраструктуры непомерно сложно для всех, кроме самых передовых компаний. Tecton делает эту инфраструктуру доступной для любой команды, позволяя им быстрее создавать приложения для машинного обучения».
Панель мониторинга Tecton. Кредиты изображений: Тектон
На высоком уровне Tecton автоматизирует процесс построения функций с использованием источников данных в реальном времени. «Функции» в машинном обучении — это отдельные независимые переменные, которые действуют как входные данные в системе ИИ. Системы используют функции, чтобы делать свои прогнозы.
“[Automation,] позволяет компаниям гораздо быстрее развертывать модели машинного обучения в реальном времени с меньшими усилиями по обработке данных», — сказал Дель Бальсо. «Это также позволяет компаниям генерировать более точные прогнозы. Это, в свою очередь, может напрямую отразиться на итоговых результатах, например, за счет повышения уровня обнаружения мошенничества или предоставления более качественных рекомендаций по продуктам».
Помимо организации конвейеров данных, Tecton может хранить значения функций в средах обучения и развертывания системы ИИ. Платформа также может отслеживать конвейеры данных, вычисляя задержку и затраты на обработку, а также извлекать исторические функции для обучения систем в производственной среде.
Tecton также размещает платформу хранилища функций с открытым исходным кодом Feast, которая не требует специальной инфраструктуры. Вместо этого Feast повторно использует существующее облачное или локальное оборудование, при необходимости запуская новые ресурсы.
«Типичными вариантами использования Tecton являются приложения машинного обучения, которые извлекают выгоду из логических выводов в реальном времени. Некоторые примеры включают обнаружение мошенничества, рекомендательные системы, поиск, андеррайтинг, персонализацию и ценообразование в режиме реального времени», — сказал Дель Бальсо. «Многие из этих моделей машинного обучения работают намного лучше, когда делают прогнозы в реальном времени с использованием данных в реальном времени. Например, модели обнаружения мошенничества значительно точнее при использовании данных о поведении пользователя всего за несколько секунд до этого, таких как количество, размер и географическое местоположение транзакций».
По данным Cognilytica, к 2025 году мировой рынок платформ MLOps будет стоить 4 миллиарда долларов — по сравнению с 350 миллионами долларов в 2019 году. Tecton — не единственный стартап, который гонится за ним. Конкуренты включают Comet, Weights & Biases, Iterative, InfuseAI, Arrikto и Continual, и это лишь некоторые из них. Что касается магазина функций, Tecton конкурирует с Rasgo и Molecula, а также с более известными брендами, такими как Splice, Google и AWS.
Дель Бальсо указывает на несколько моментов в пользу Tecton, таких как стратегическое партнерство и интеграция с Databricks, Snowflake и Redis. У Tecton сотни активных пользователей — ни слова о клиентах, кроме того факта, что за последний год база увеличилась в пять раз — и Дель Бальсо сказал, что валовая прибыль (чистые продажи за вычетом стоимости проданных товаров) превышает 80%. Годовой регулярный доход, по-видимому, утроился с 2021 по 2022 год, но Дель Бальсо отказался предоставить точные цифры.
«Мы все еще находимся в начале пути MLOps. Это сложный переход для предприятий. Их команды специалистов по данным должны вести себя как инженеры данных и начать создавать код производственного качества. Им нужен целый набор новых инструментов для поддержки этого перехода, и им необходимо интегрировать эти инструменты в согласованные платформы машинного обучения. Экосистема инструментов MLOps по-прежнему сильно фрагментирована, что затрудняет для предприятий создание этих платформ машинного обучения», — сказал Дель Бальсо. «Пандемия ускорила переход к цифровому опыту, а вместе с ним и важность развертывания операционного машинного обучения для поддержки этого опыта. Мы считаем, что пандемия ускорила внедрение новых инструментов MLOps, включая хранилища функций и платформы функций».
В компании Tecton, расположенной в Сан-Франциско, в настоящее время работает 80 сотрудников. Компания планирует нанять около 20 человек в течение следующих шести месяцев.