Меню

$294 000 против $100 000 000 — причины скандала вокруг китайской модели DeepSeek-R1

$294 000 против $100 000 000 — причины скандала вокруг китайской модели DeepSeek-R1
Фото: открытые источники

В мире высоких технологий давно укоренилось представление о том, что создание передовых моделей искусственного интеллекта — это удел гигантов с практически безграничными бюджетами. Операции исчисляются сотнями миллионов долларов, а доступ к вычислительным ресурсам сравним с национальными проектами. Однако недавнее заявление китайской компании DeepSeek заставило экспертов по всему миру усомниться в этом догмате.

Экономика прорыва: 294 тысячи против ста миллионов

Согласно утверждениям DeepSeek, обучение флагманской модели R1 обошлось компании в 294 тысячи долларов. Сумма, вызывающая недоумение на фоне заявления генерального директора OpenAI Сэма Альтмана, который еще в 2023 году оценил стоимость обучения базовых моделей своей компании в 100 миллионов долларов. Глубокая пропасть между этими цифрами ставит перед индустрией фундаментальный вопрос: является ли колоссальное финансирование гарантией успеха или же свидетельством неэффективности?

Для достижения результата DeepSeek задействовала кластер из 512 ускорителей Nvidia H800. Обучение заняло 80 часов — срок, несопоставимо малый по отраслевым меркам. Этот факт не просто демонстрирует оптимизацию процессов, но и сигнализирует о начале новой эры в разработке ИИ — эры, где важны не только объем инвестиций, но и стратегия, и интеллектуальный подход к ресурсам.

Технологический суверенитет и аппаратные войны

История с чипами для DeepSeek-R1 сама по себе стала элементом большого технологического противостояния. Модель обучалась на ускорителях H800, специально разработанных Nvidia для китайского рынка в обход американских экспортных ограничений, запрещающих поставки более мощных H100 и A100.

Однако в июне американские официальные лица заявили, что у DeepSeek есть доступ к значительным объемам запрещенных H100, приобретенных уже после введения контроля. Nvidia парировала, настаивая на использовании китайской компанией именно H800. В этой полемике скрывается важный подтекст: гонка за ИИ все теснее связывается с геополитикой, а доступ к аппаратному обеспечению становится вопросом национальной безопасности.

Примечательно и другое признание DeepSeek: компания владеет чипами A100 и использовала их для подготовки экспериментов. Это раскрывает сложную, многоуровневую инфраструктуру компании, которая вынуждена лавировать в условиях санкций, находя способы для продолжения исследований.

Обвинения в дистилляции и философия открытости

Успех DeepSeek-R1, выпущенной в январе, был настолько оглушительным, что спровоцировал волну продаж акций технологических гигантов и временно обрушил капитализацию лидеров отрасли, включая саму Nvidia. Столь быстрое появление сильного конкурента не могло не вызвать вопросов о его происхождении.

В январе советник Белого дома и представители американской ИИ-индустрии выдвинули серьезное обвинение: DeepSeek намеренно «дистиллировала» модель OpenAI для создания своей. Дистилляция — это процесс создания меньшей по размеру и более эффективной модели на основе большой, что требует значительно меньше вычислительных ресурсов.

В своей статье DeepSeek впервые отреагировала на эти претензии. Компания не стала отрицать использование данных, связанных с OpenAI. Напротив, она признала, что ее обучающие данные, основанные на просканированных веб-страницах, содержали «значительное количество ответов, сгенерированных моделью OpenAI». Это, как отмечается в статье, могло привести к косвенному получению знаний. Однако акцент сделан на непреднамеренность этого процесса — он стал следствием загрязнения открытых сетевых данных продуктами ИИ.

Главный же ответ DeepSeek — философский. Компания открыто защищает саму практику дистилляции, утверждая, что она делает технологии искусственного интеллекта более демократичными и доступными. Это заявление бросает вызов всей экосистеме, где доминируют закрытые, дорогие модели. Глубокое знание, по мнению китайского разработчика, не должно быть товаром роскоши.

Что дальше?

История DeepSeek — это не просто рассказ об успехе отдельной компании. Это многослойный нарратив о будущем всей отрасли. Во-первых, он доказывает, что барьеры для входа в элитный клуб разработчиков ИИ могут быть не такими высокими, как принято считать. Инновационные подходы и оптимизация способны сократить затраты

Во-вторых, эта история обнажает растущую напряженность вокруг технологического суверенитета и этики разработки. Споры о дистилляции, использовании данных и доступе к чипам будут только обостряться, требуя выработки новых международных норм.

И наконец, она символизирует сдвиг в парадигме: от закрытых систем, охраняемых как величайшая коммерческая тайна, к более открытым и доступным решениям. Будет ли этот тренд доминирующим, покажет время, но ясно одно — монополия на искусственный интеллект, как и на его создание, подходит к концу.

Лента новостей
Загрузить ещё
Файлы cookie
Информационное агентство "Минская правда" использует на своём сайте анонимные данные, передаваемые с помощью файлов cookie.
Информационное агентство «Минская правда»
ул. Б. Хмельницкого, д. 10А Минск Республика Беларусь 220013
Phone: +375 (44) 551-02-59 Phone: +375 (17) 311-16-59