원제 : What We Think vs. What We Do 우리가 사람들이 Large Language Models (LLM)를 사용하는 방법에 대해 생각할 때, 익숙한 그림이 떠오릅니다 : 생산성.우리는 개발자가 더 빨리 코딩하고 마케팅 담당자가 이메일을 쓰고 분석가가 밀접한 문서를 요약한다고 상상합니다. 실제 사용의 100조 개 이상의 토큰을 분석한 OpenRouter의 혁신적인 새로운 연구는 훨씬 더 복잡하고 놀라운 그림을 보여줍니다. "킬러 애플리케이션"에서부터 아무도 AI의 상태에 대한 우리의 핵심 가정에 도전하는 장기적으로 어떤 모델이 승리하는지 결정하는 이상한 현상에 대해 이야기하지 않습니다. 실제로 Open Source AI의 가장 큰 사용 사례는 작동하지 않습니다; 그것은 게임입니다. 생산성 엔진으로 인한 AI의 지배적 인 설명과는 달리 오픈 소스 (OSS) 모델의 가장 큰 단일 사용 사례는 창조적 인 역할 플레이입니다.Data shows that "creative roleplay" and storytelling account for more than half (about 52%) of all OSS token usage, with programming being a distant second. 이것은 대규모 사용자 기반이 이러한 경험을위한 오픈 모델로 전환하는 것을 제안합니다.이 모델은 더 큰 창조적 인 자유를 제공하고 자주 소유 모델에서 발견되는 상업적 컨텐츠 필터에 의해 덜 제한됩니다.이 발견은 AI가 주도하는 엔터테인먼트, 동반자 및 상호 작용 소설에 대한 대규모 소비자 수요를 밝힙니다.이 산업은 엔터프라이즈 솔루션에 초점을 맞추고 있지만, 조용한 대다수는 AI를 사용하여 새로운 세계를 만들고 탐험하고 있습니다. 2) ‘AI 에이전트’의 조용한 상승 사람들이 LLM을 사용하는 방식은 근본적인 변화를 겪고 있습니다.우리는 간단한, 단일 회전, 질문과 대답 상호 작용에서 멀리하고 여러 단계, 도구 통합 작업 흐름으로 이동하고 있습니다.이 "행동적 인"작업 흐름에서 모델 계획, 이유 및 행동은 복잡한 작업을 완료하며, 종종 각 단계에서 직접적인 인간의 개입이 없습니다. 이 변화는 데이터에서 분명합니다 : 논리 최적화 모델은 이제 모든 사용량의 50 % 이상을 처리하고 있으며, 2025 년 초에 무시할 수없는 금액에서 극적으로 증가합니다.이 논리 방향으로의이 움직임은 더 복잡한 워크로드에 의해 촉진되며, 평균 사용자의 인스턴트는 2024 년 초부터 전체 코드베이스를 분석하는 것과 같은 작업을 수용하기 위해 거의 4 배 증가했습니다. 이 보고서는이 전환을 격렬한 용어로 제시하고 있으며, 에이전트 추론이 AI와 상호 작용하는 새로운 기본 요소가되고 있다는 결론을 내린다. 충분히 곧, 이미 그렇지 않으면, 에이전트적 추론은 추론의 대부분을 차지할 것이다. 성공은 더 이상 단순히 합리적인 텍스트를 생성하는 것이 아니라 계획과 행동을 필요로하는 복잡하고 주된 작업을 처리하는 것입니다. 오픈소스는 AI 시장의 1/3을 조용히 캡처하고 있습니다. Anthropic 및 OpenAI와 같은 주요 실험실의 특허 모델이 여전히 시장을 이끌고 있지만 오픈 소스 모델은 2025 년 말까지 모든 토큰 사용의 약 1/3을 포착하기 위해 꾸준히 성장했습니다. 이 확장의 핵심 원동력은 Qwen 및 DeepSeek과 같은 공급자로부터 중국에서 개발 된 OSS 모델의 상승이었습니다.이 모델은 몇 주 만에 주간 시장 점유율이 1.2%에서 거의 30%로 성장하여 전 세계 사용자들 사이에서 빠르게 끌림을 얻었습니다. 이 추세는 AI 생태계에서 "속도적 인 이중 구조"를 나타냅니다. 원인은 특허 및 OSS 모델 사이의 균형이 현재 오픈 소스의 경우 약 30 %에 안정되었음을 제안합니다.이 균형은 개발자가 높은 신뢰성 기업 작업을 위해 특허 시스템을 선택하면서 OSS의 비용 효율성과 다른 중요한 워크로드에 대한 사용자 정의를 활용하기 때문에 존재합니다. AI가 상품이 아닌 이유(Why AI Is Not a Commodity) 많은 사람들이 AI 모델이 빠르게 저렴한 상품이 될 것이라고 예측했으며 가격이 주요 차이점이지만 데이터는 다른 이야기를 말합니다. LLM에 대한 수요는 놀랍게도 가격 불연성이며 가격 변화는 사용에 거의 영향을 미치지 않습니다.이 연구에 따르면 10% 가격 감소는 0.5-0.7%의 사용 증가에 해당합니다. 상품화 된 시장 대신에, 생태계는 구별 된 원형으로 분할되었습니다 : 프리미엄 리더: Anthropic의 Claude 4 Sonnet과 같은 모델은 높은 가격을 지배하지만 여전히 대규모 사용량을 보이며 사용자가 최고 수준의 품질과 신뢰성을 위해 프리미엄을 지불 할 준비가되어 있음을 증명합니다. 효율적인 거인 : Google의 Gemini Flash 및 DeepSeek와 같은 모델은 저렴한 비용과 높은 볼륨을 결합하여 비용 민감한 대규모 작업에 기본 선택입니다. 프리미엄 전문가 : OpenAI의 GPT-5 Pro와 같은 매우 비싼 모델은 성능이 중요한 유일한 것이고 비용이 부차적 인 작업에 절약적으로 사용됩니다. Long Tail: Qwen 2 7B Instruct 및 IBM Granite 4.0 Micro와 같은 모델은 바닥 가격이 있지만 범위가 제한되어 능력과 모델 시장 적합성이 단순한 비용 이상의 중요한 차별 요소라는 것을 강조합니다. 이 분할은 시장의 현재 상태에 대한 중요한 통찰력을 보여줍니다. 상대적으로 평평한 수요 탄력성은 LLM이 아직 상품이 아니라는 것을 의미합니다; 많은 사용자는 품질, 기능 또는 안정성에 대한 보상을 지불 할 준비가되어 있습니다. 현재 전문화 된 기능과 신뢰할 수있는 성능은 종종 비용이 많이 들며, 특히 전문적이거나 임무에 중요한 워크로드를 수행합니다. AI에서 승리하는 것은 신데렐라의 "Glass Slipper"와 같습니다. 새로운 모델이 지속적으로 출시되는 시장에서, 어떻게 단일 모델이 지속적인 이점을 구축합니까?이 연구는 사용자 보존을 설명하기 위해 "Glass Slipper 효과"라고 불리는 새로운 프레임 워크를 제안합니다.이 아이디어는 간단합니다 : 새로운 모델이 사용자 그룹에 대한 중요한, 이전에 만족되지 않은 필요를 해결하는 최초의 경우 "완벽한 적합"을 달성합니다. 이 초기 사용자는 오랫동안 모델에 붙어있는 "기초적인 조합"을 형성하여 나중에 사용하는 사용자보다 훨씬 더 높은 보존율을 보여줍니다.그들의 작업 흐름, 도구 및 습관은 처음으로 문제를 해결한 모델에 잠겨있어 새롭고 심지어 약간 더 나은 대안으로 전환하는 데 매우 저항적입니다. 명확한 예는 Gemini 2.5 Pro의 2025 년 6 월 코호트와 Claude 4 Sonnet의 2025 년 5 월 코호트에서 볼 수 있습니다.이 코호트는 5 개월 후 사용자의 약 40 %를 보유하고 있습니다.이 후속 코호트보다 훨씬 높은 비율.이 보고서에 따르면 기초 코호트를 구축하지 못한 Gemini 2.0 플래시와 같은 모델과 급격하게 대조하여 모든 사용자가 획득 할 수없는 "충분히 좋은" 시장에 출시하는 것이 높은 성과를 초래한다는 것을 보여줍니다. 이 현상은 AI의 빠르게 움직이는 세계에서 "첫 번째로 해결"의 장점은 믿을 수 없을 정도로 강력하고 내구성이있다.혁신적인 모델의 진정한 신호는 단순히 히프 또는 벤치마크가 아니라 완벽한 적합성을 발견 한이 붙어있는 기초 사용자 그룹의 조용한 형성입니다. 결론 : AI의 진정한 이야기는 여전히 쓰여지고 있습니다. 인공지능의 실제 사용은 주류 이야기보다 훨씬 더 뉘앙스럽고 다양하며 놀랍습니다.데이터는 놀라운 창의성과 생산성에 의해 동일하게 구동되는 생태계를 보여줍니다.이 생태계는 복잡하고 에이전틱한 워크플로우로 빠르게 전환하고 있습니다.오픈 소스가 강력한 힘이며 지속적인 사용자 충성도는 히프가 아니라 어려운 문제를 해결하는 최초의 사람으로 만들어집니다. AI가 간단한 도구에서 복잡한 협력자로 이동함에 따라 예기치 않은 행동과 살인자 앱이 다음에 나타날 것입니까? Apple Podcast : 여기 Spotify : 여기 애플 포드캐스트: 여기에 스포티파이 : 여기에