$294 000 против $100 000 000 — причины скандала вокруг китайской модели DeepSeek-R1

В мире высоких технологий давно укоренилось представление о том, что создание передовых моделей искусственного интеллекта — это удел гигантов с практически безграничными бюджетами. Операции исчисляются сотнями миллионов долларов, а доступ к вычислительным ресурсам сравним с национальными проектами. Однако недавнее заявление китайской компании DeepSeek заставило экспертов по всему миру усомниться в этом догмате.
Экономика прорыва: 294 тысячи против ста миллионов
Согласно утверждениям DeepSeek, обучение флагманской модели R1 обошлось компании в 294 тысячи долларов. Сумма, вызывающая недоумение на фоне заявления генерального директора OpenAI Сэма Альтмана, который еще в 2023 году оценил стоимость обучения базовых моделей своей компании в 100 миллионов долларов. Глубокая пропасть между этими цифрами ставит перед индустрией фундаментальный вопрос: является ли колоссальное финансирование гарантией успеха или же свидетельством неэффективности?
Для достижения результата DeepSeek задействовала кластер из 512 ускорителей Nvidia H800. Обучение заняло 80 часов — срок, несопоставимо малый по отраслевым меркам. Этот факт не просто демонстрирует оптимизацию процессов, но и сигнализирует о начале новой эры в разработке ИИ — эры, где важны не только объем инвестиций, но и стратегия, и интеллектуальный подход к ресурсам.

Технологический суверенитет и аппаратные войны
История с чипами для DeepSeek-R1 сама по себе стала элементом большого технологического противостояния. Модель обучалась на ускорителях H800, специально разработанных Nvidia для китайского рынка в обход американских экспортных ограничений, запрещающих поставки более мощных H100 и A100.
Однако в июне американские официальные лица заявили, что у DeepSeek есть доступ к значительным объемам запрещенных H100, приобретенных уже после введения контроля. Nvidia парировала, настаивая на использовании китайской компанией именно H800. В этой полемике скрывается важный подтекст: гонка за ИИ все теснее связывается с геополитикой, а доступ к аппаратному обеспечению становится вопросом национальной безопасности.
Примечательно и другое признание DeepSeek: компания владеет чипами A100 и использовала их для подготовки экспериментов. Это раскрывает сложную, многоуровневую инфраструктуру компании, которая вынуждена лавировать в условиях санкций, находя способы для продолжения исследований.

Обвинения в дистилляции и философия открытости
Успех DeepSeek-R1, выпущенной в январе, был настолько оглушительным, что спровоцировал волну продаж акций технологических гигантов и временно обрушил капитализацию лидеров отрасли, включая саму Nvidia. Столь быстрое появление сильного конкурента не могло не вызвать вопросов о его происхождении.
В январе советник Белого дома и представители американской ИИ-индустрии выдвинули серьезное обвинение: DeepSeek намеренно «дистиллировала» модель OpenAI для создания своей. Дистилляция — это процесс создания меньшей по размеру и более эффективной модели на основе большой, что требует значительно меньше вычислительных ресурсов.
В своей статье DeepSeek впервые отреагировала на эти претензии. Компания не стала отрицать использование данных, связанных с OpenAI. Напротив, она признала, что ее обучающие данные, основанные на просканированных веб-страницах, содержали «значительное количество ответов, сгенерированных моделью OpenAI». Это, как отмечается в статье, могло привести к косвенному получению знаний. Однако акцент сделан на непреднамеренность этого процесса — он стал следствием загрязнения открытых сетевых данных продуктами ИИ.
Главный же ответ DeepSeek — философский. Компания открыто защищает саму практику дистилляции, утверждая, что она делает технологии искусственного интеллекта более демократичными и доступными. Это заявление бросает вызов всей экосистеме, где доминируют закрытые, дорогие модели. Глубокое знание, по мнению китайского разработчика, не должно быть товаром роскоши.

Что дальше?
История DeepSeek — это не просто рассказ об успехе отдельной компании. Это многослойный нарратив о будущем всей отрасли. Во-первых, он доказывает, что барьеры для входа в элитный клуб разработчиков ИИ могут быть не такими высокими, как принято считать. Инновационные подходы и оптимизация способны сократить затраты
Во-вторых, эта история обнажает растущую напряженность вокруг технологического суверенитета и этики разработки. Споры о дистилляции, использовании данных и доступе к чипам будут только обостряться, требуя выработки новых международных норм.
И наконец, она символизирует сдвиг в парадигме: от закрытых систем, охраняемых как величайшая коммерческая тайна, к более открытым и доступным решениям. Будет ли этот тренд доминирующим, покажет время, но ясно одно — монополия на искусственный интеллект, как и на его создание, подходит к концу.
Рекомендуем


