Автор фото: Getty Images
Эта компания делает ставку на tokenmaxxing, чтобы стать следующим гигантом в вычислениях
6:00 AM PDT · 15 апреля 2026 года
«Дайте мне токены. Просто дайте мне токены. Я хочу их быстро. Я хочу их дешево. Я хочу их сейчас».
Именно так, по словам CEO Parasail Майка Генри, звучит мантра разработчиков, создающих софт на базе генеративных AI-моделей. Parasail предоставляет облачный вычислительный сервис компаниям, которые запускают AI-модели для inference, и, как рассказал Генри TechCrunch, компания обрабатывает 500 миллиардов токенов в день. Неплохо для tokenmaxxing?
Генри раньше был топ-менеджером в Groq, производителе чипов для LLM, где он строил облачное направление компании — раннее признание того, что разработчикам, создающим ПО на AI-моделях, нужна специализированная облачная обработка под их задачи. Теперь, спустя год после выхода из режима stealth, Parasail привлекла $32 млн в раунде Series A, чтобы масштабировать эту модель.
У Генри есть опыт в физическом проектировании чипов, но Parasail не собирается обязательно владеть собственными чипами. Хотя часть ее GPU принадлежит компании, в основном она арендует вычислительное время в 40 дата-центрах в 15 странах мира и дополнительно закупает мощности на market liquidity, скрытно координируя все это, чтобы снизить стоимость inference-запросов.
Грамотно распределяя нагрузки и избегая пиков спроса, компания рассчитывает конкурировать с фирмами, которые владеют собственным silicon и могут быть ограничены уже существующими обязательствами перед клиентами и текущими рабочими нагрузками.
Потенциал компании зависит от дальнейшего распространения open-source моделей и agents за пределами frontier labs. Руководители и инвесторы Parasail говорят, что это обусловлено ростом стоимости и трения при использовании предложений компаний вроде Anthropic и OpenAI.
Вместо этого, по словам Андреаса Штульмюллера, CEO Elicit, формируется гибридная архитектура. Elicit — стартап, который привлек $22 млн в Series A для разработки research assistant для научной литературы. Клиенты компании в крупных фармацевтических компаниях используют этот инструмент на базе LLM, чтобы просматривать и анализировать данные из десятков тысяч научных статей.
Встречайте следующего инвестора или стартап из вашего портфеля на Disrupt
Ваш следующий раунд. Ваш следующий найм. Ваш следующий прорывной шанс. Найдите его на TechCrunch Disrupt 2026, где за три дня соберутся более 10 000 основателей, инвесторов и лидеров техносферы ради 250+ практических сессий, сильных знакомств и инноваций, определяющих рынок. Зарегистрируйтесь сейчас, чтобы сэкономить до $410.
Встречайте следующего инвестора или стартап из вашего портфеля на Disrupt
Ваш следующий раунд. Ваш следующий найм. Ваш следующий прорывной шанс. Найдите его на TechCrunch Disrupt 2026, где за три дня соберутся более 10 000 основателей, инвесторов и лидеров техносферы ради 250+ практических сессий, сильных знакомств и инноваций, определяющих рынок. Зарегистрируйтесь сейчас, чтобы сэкономить до $410.
Сан-Франциско, Калифорния | 13–15 октября 2026 года
«Мы все больше переходим к open models, потому что очень тяжело отправлять сотни тысяч запросов в API endpoint», — сказал TechCrunch Штульмюллер. Особенно сейчас, когда компания использует agents для улучшения продукта, разбивая задачи на части и работая более стратегически на длинном горизонте. Open models берут на себя первичную фильтрацию, чтобы снизить стоимость работы, а затем более мощная frontier model дает итоговый ответ.
Рост числа запросов к моделям по мере того, как agents становятся все более обычной частью разработки ПО, подталкивает инвестиции в компании вроде Parasail, которые строят инфраструктуру для дешевого inference. Самир Кумар, партнер Touring Capital, который стал со-ведущим этого раунда, рассказал TechCrunch, что в будущем inference, по его оценке, будет составлять как минимум 20% стоимости создания ПО.
Какую долю этого рынка сможет занять Parasail? На переполненном рынке cloud compute Генри утверждает, что его компания выделяется за счет фокуса на inference (training запрещен) и готовности работать со стартапами без долгосрочных обязательств. Это, по его словам, отличает ее как от крупных облачных компаний, ориентированных на enterprise-бизнес, так и от более хорошо финансируемых конкурентов в сегменте cloud inference, таких как Fireworks AI и Baseten.
Разумеется, есть и другой риск: почти все клиенты компании — стартапы на стадиях seed и Series B в непредсказуемом AI-секторе.
Стив Джанг, партнер Kindred Ventures и другой со-ведущий раунда, считает, что экономика развертывания моделей потребует именно такого compute brokerage, которое предлагает Parasail. И это еще до массового использования моделей для generation of content и robotics.
«Все думали, что это AI bubble. Никакого AI bubble нет», — сказал он TechCrunch. «Спрос на inference значительно опережает предложение».
Материал — перевод статьи с английского.
Оригинал: This startup is betting tokenmaxxing will create the next compute giant
