Многие компании сообщают, что достигли критической точки в своих расходах на ИИ, которую отраслевые аналитики называют «стеной цен». Этот порог представляет собой точку, когда дальнейшие инвестиции в премиальные услуги ИИ больше не приносят пропорциональную прибыль, что вынуждает компании либо сокращать свои амбиции в области ИИ, либо искать более экономически эффективные альтернативы.
"Нам пришлось принять трудное решение", – сказал Марк Чен, технический директор платформы электронной коммерции среднего размера. «Затраты на обработку ИИ отнимали 40 % нашего бюджета на облачные вычисления. Мы не могли продолжать идти по этому пути, не жертвуя другими важными областями развития нашего бизнеса».
Ценовое давление особенно остро ощущается для компаний, которые в значительной степени полагаются на искусственный интеллект для обслуживания клиентов, создания контента или анализа данных. Эти организации часто обрабатывают миллионы вызовов API ежемесячно, при этом затраты быстро растут в зависимости от объема использования.
В ответ на рост затрат многие западные компании обращаются к разработанным в Китае программам LLM, которые предлагают значительные преимущества в затратах, сохраняя при этом впечатляющие показатели производительности. Модели таких компаний, как Baidu, Alibaba и Tencent, становятся все более привлекательными вариантами для организаций с ограниченным бюджетом.
"Китайские программы магистратуры добились значительного прогресса за последний год", - отметил профессор Линь Вэй, исследователь искусственного интеллекта в Пекинском университете. "Многие из наших моделей теперь соответствуют западным аналогам или превосходят их в тестах производительности, при этом стоят на 60–80 % дешевле при эквивалентных уровнях использования".
| Китайский поставщик LLM |
Модель |
Ежемесячная стоимость за 2024 год (предприятие) |
Производительность по сравнению с GPT-4 |
Основные преимущества |
Байду |
Эрни 4.0 |
4500 долларов США |
92% |
Хорошие возможности китайского языка, мультимодальная обработка |
Алибаба |
Тунъи Цяньвэнь |
3800 долларов США |
88% |
Интеграция с Alibaba Cloud, оптимизация электронной коммерции |
Тенцент |
Хуньюань |
4200 долларов США |
90% |
Расширенные возможности кодирования, интеграция с социальными сетями |
智谱AI |
GLM-4 |
3500 долларов США |
85% |
Академическая направленность, ориентированность на исследования |
Однако внедрение китайских программ LLM не обходится без проблем. Компаниям приходится учитывать сложные геополитические соображения, правила конфиденциальности данных и потенциальные ограничения языковой поддержки для некитайских приложений.
Революция открытого исходного кода
Помимо китайских альтернатив, многие организации используют LLM с открытым исходным кодом как экономичное решение. Такие модели, как Llama от Meta, предложения Mistral AI и альтернативы, разработанные сообществом, обеспечивают беспрецедентную гибкость без постоянной платы за подписку.
"Экосистема открытого исходного кода значительно повзрослела", – сказала Сара Джонсон, защитник открытого исходного кода в AI Freedom Foundation. "Теперь у нас есть модели, которые обеспечивают 80–90 % производительности коммерческих моделей высшего уровня при гораздо меньшей стоимости, а также дополнительные преимущества индивидуальной настройки и конфиденциальности".
Компании сообщают, что после завершения первоначальной настройки общая стоимость владения решениями с открытым исходным кодом, включая инфраструктуру, обслуживание и тонкую настройку, может быть на 70–90 % ниже, чем стоимость услуг по подписке премиум-класса.
| Модель с открытым исходным кодом |
Требования к вычислительной мощности |
Стоимость реализации |
Производительность по сравнению с GPT-4 |
Лучшие примеры использования |
Мистраль 7Б |
Один графический процессор |
1200 долларов США (установка) |
75% |
Обслуживание клиентов, обобщение контента |
Лама 3 70Б |
4–8 графических процессоров |
8500 долларов США (установка) |
88% |
Сложные рассуждения, специализированные задачи |
Сокол 180B |
8+ графических процессоров |
15 000 долларов США (установка) |
85% |
Корпоративные приложения, исследования |
Команда R+ |
4 графических процессора |
7800 долларов США (установка) |
83% |
Генерация кода, техническая документация |
Гибридные подходы и стратегическое развертывание
Многие организации применяют гибридные стратегии, сочетая услуги премиум-класса для критически важных приложений с экономичными альтернативами для менее требовательных задач. Такой подход позволяет компаниям поддерживать высокое качество работы с искусственным интеллектом, одновременно управляя общими расходами.
"Мы внедрили многоуровневый подход", – объяснила Рэйчел Парк, директор по стратегии ИИ в Global Financial Services. "При взаимодействии с клиентами мы используем модели премиум-класса для оптимального взаимодействия, а внутренние процессы и некритичные приложения используют решения с открытым исходным кодом. Этот гибридный подход позволил сократить наши затраты на искусственный интеллект на 65 % при сохранении производительности".
Другие стратегии включают:
Точная настройка модели для повышения производительности открытого исходного кода.
Кеширование API и оптимизация ответов для сокращения количества вызовов
Периферийные вычисления для минимизации затрат на облачную обработку
Стратегическое распределение рабочей нагрузки между различными типами моделей
Последствия для рынка и перспективы
Сдвиг в сторону более экономичных решений искусственного интеллекта меняет конкурентную среду. Крупнейшие поставщики услуг сталкиваются с необходимостью корректировать свои модели ценообразования, в то время как китайские разработчики LLM и сообщества с открытым исходным кодом испытывают все большее распространение и инвестиции.
"Мы наблюдаем фундаментальную переоценку экономики искусственного интеллекта", – заявил Майкл Торрес, рыночный аналитик Исследовательского института искусственного интеллекта. «Рынок переходит от менталитета «премиум любой ценой» к более осознанному подходу. Это, вероятно, приведет к появлению более многоуровневых предложений от крупных поставщиков и продолжению инноваций в сфере открытого исходного кода».
Отраслевые эксперты прогнозируют, что к 2025 году более 60 % компаний примут мультимодельную стратегию, используя различные решения искусственного интеллекта в зависимости от конкретных сценариев использования, а не полагаясь на одного поставщика.
Заключение: путь к новой экономике искусственного интеллекта
Поскольку затраты на ИИ продолжают расти, организациям необходимо более стратегически подходить к инвестициям в ИИ. Нынешняя «стена цен» представляет собой не просто проблему, но и возможность переоценить стратегии внедрения ИИ, изучить альтернативы и разработать более устойчивые подходы к внедрению ИИ.
"Будущее корпоративного искусственного интеллекта заключается не в поиске одной-единственной самой мощной модели", — заключил д-р Родригес. "Речь идет о создании оптимизированной экосистемы решений, обеспечивающих максимальную ценность при устойчивых затратах. Компании, которые овладеют этим балансом, получат значительное конкурентное преимущество в ближайшие годы".
Продолжающаяся эволюция экономики искусственного интеллекта, скорее всего, продолжит стимулировать инновации: поставщики будут разрабатывать более гибкие модели ценообразования, а альтернативные решения будут становиться все более изощренными. Для бизнеса ключевой урок ясен: продуманное, стратегическое внедрение ИИ, а не только грубая вычислительная мощность, будет определять успех в эту новую эпоху искусственного интеллекта.
Затраты на ИИ резко растут, поскольку подписки достигают ценового предела — фирмы обращаются к китайским LLM, моделям с открытым исходным кодом, чтобы расширить бюджет. Читать статью полностью #AIAssistantCosts #OpenSourceLLMs #ChinaLLMImpact
Затраты на ИИ резко растут, поскольку подписки достигают ценового предела — фирмы обращаются к китайским LLM и моделям с открытым исходным кодом, чтобы расширить бюджет. Читать статью полностью #AIAssistantCosts #OpenSourceLLMs #ChinaLLMImpact