빠르게 진보하는 기술과 마찬가지로, AI는 대규모 , 그리고 그들 중 일부는 그럴 자격이 있고, 비밀 하드웨어 스타트업에서 핀테크 거인에 이르기까지 공공 기관에 이르기까지 팀들은 AI 전략에 열심히 노력하고 있습니다. FOMO 푸드 페이즈 그 중 일부는 NO “우리는 어떻게 AI와 기계 학습을 사용하여 우리가하는 일을 더 잘할 수 있습니까?” “우리는 어떻게 AI와 기계 학습을 사용하여 우리가하는 일을 더 잘할 수 있습니까?” 더 자주 그렇지 않은 기업들은 고용을 했을 수도 있고, 고용을 했을 수도 있다. 별보다 작은 결과, 또는 어쩌면 그러나 가장 일반적인 시나리오는 그들이 아직 가장 기본적인 인프라를 구현할 수있는 인프라를 구축하지 않았다는 것입니다 (그리고 그들의 혜택을 수확). 알고리즘과 작동, 훨씬 적은 . not 최초의 데이터 과학자 데이터 글쓰기 데이터 과학 기계 학습 데이터 과학 / AI 컨설턴트로서, 나는 특히 지난 2 년 동안 수많은 시간 동안이 메시지를 전달해야했습니다. 당신이 그 흥분을 공유하는 경우 특히 자신의 분야의 모든 흥분 중에 젖은 담요가되는 것은 어렵습니다.그리고 자신이 임명 한 게이트웨이터 인 엘리트 (또는 존재)처럼 들리지 않고 AI에 대한 준비가되어 있지 않은 기업을 어떻게 말합니까? 동의 다음은 가장 반영되는 설명입니다: Think of AI as the top of a 필요성의 피라미드 . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). 필요성의 피라미드 기본 요구 사항 : 계산할 수 있습니까? 우리가 가진 피라미드의 바닥에 어떤 데이터가 필요한지, 그리고 무엇이 사용할 수 있습니까? 사용자 중심의 제품이라면 모든 관련 사용자 상호 작용을 기록하고 있습니까? 센서라면 어떤 데이터가 통과되고 있습니까? 아직 도구화되지 않은 상호 작용을 기록하는 것이 얼마나 쉬운가요? 이것은 최근 기계 학습의 발전을 가능하게 한 것입니다. data collection 데이터베이스 다음은, 어떻게 하는가 시스템을 통해? 신뢰할 수있는 스트림 / ETL이 있습니까? 어디에 저장하고 얼마나 쉽게 액세스하고 분석 할 수 있습니까? 약 10 년 동안 신뢰할 수있는 데이터 흐름이 데이터로 무엇이든 할 수있는 열쇠라고 말했습니다. data flow 제이 크레프스 [외부: 나는 정확한 인용을 찾고 그의 '에서 그것을 발견했다. 나는 로고를 사랑한다 그 후, 한 구절 이상, 그는이 정확한 Maslow의 필요 차원 비교를하고있다, 좋은 측정 (Jay 덕분에)에 던져 '그것은 명백한 것을 지적 가치가있다'와 함께 (Jay 덕분에!) 관련 작업에 대해 이야기, 나는 또한 나중에 실행 (h / t Daniel Tunkelang) 힐러리 Mason과 Chris Wiggins의 우수한 포스트 데이터 과학자가 하는 일에 관해 - 몇 일 전, Sean Taylor 밝혀진 자신의 데이터 과학 필요성 피라미드 (이론적으로 데이터 과학의 결합되지 않은 삼각형이라고 불린다)는 물론 완전히 다른 것입니다. 나는 로고를 사랑한다 포스트 밝혀진 데이터가 접근 가능한 경우에만, 당신은 이것은 당신이 많은 데이터를 놓치고있는 것을 발견 할 때, 당신의 센서가 신뢰할 수없는, 버전 변경은 당신의 사건을 떨어 뜨린 것을 의미, 당신은 깃발을 잘못 해석하고 있습니다 - 당신은 피라미드의 기초가 견고한지 확인하기 위해 돌아갑니다. explore and transform 데이터를 신뢰할 수 있고 청소할 수 있다면 전통적으로 BI 또는 BI로 생각되는 것을 구축하기 시작할 수 있습니다. : 추적, 계절성 및 다양한 요인에 대한 민감성을 정의하는 매개 변수를 정의합니다.어쩌면 일부 거친 사용자 분할을하고 무언가가 뛰어 나가는지 확인할 수 있습니다.그러나 목표가 AI이기 때문에 이제 당신이 나중에 생각하는 것을 구축하고 있습니다. 이 단계에서, 당신은 또한 당신이 예측하거나 배우고 싶은 것을 알고, 당신은 당신의 기계 학습 모델을 준비하기 시작할 수 있습니다. 라벨을 생성함으로써, 자동으로 (어떤 고객들이 굴러 갔습니까?) 또는 인간과 함께. analytics features training data 이것은 또한 당신이 당신의 가장 흥미롭고 설득력있는 것을 발견 할 때입니다. - 그러나 그것은 또한 또 다른 중간 포스트의 주제입니다. data stories 계산할 수 있어요, 지금은 어떻게 하나요? 우리는 훈련 데이터 - 확실히, 이제 우리는 기계 학습을 할 수 있습니까? 어쩌면, 당신이 내부적으로 churn를 예측하려고하는 경우; 아니, 결과가 고객을 향한 것입니다 경우. 우리는 재해를 피하고 변화의 영향을 모두에게 영향을 미치기 전에 대략적인 예측을 얻기 위해 점차적으로 배포 할 수 있도록 프레임 워크가 있습니다. 현장에 (recommender 시스템의 경우, 이것은 예를 들어 '가장 인기있는', 다음 '당신의 사용자 세그먼트에 가장 인기있는' - 매우 짜증나지만 효과적인 '개인화 전에 스테레오 타입'입니다). experimentation simple baseline 간단한 heuristics는 놀랍게도 이길 어려운, 그리고 그들은 당신이 중간에 hypertuned 하이퍼 매개 변수와 신비한 ML 블랙박스없이 시스템을 끝에서 끝까지 디버그 할 수 있습니다. 이 시점에서, 당신은 매우 간단한 ML 알고리즘을 배포 할 수 있습니다 (물론적 회귀 또는, 예, 분할과 같은), 다음 당신의 결과에 영향을 미칠 수있는 새로운 신호와 기능에 대해 생각합니다. 날씨 및 통계 데이터는 나의 go-tos입니다.그리고 그렇지 않다 - 그것이 강력하다면, 깊은 학습은 자동으로 당신을 위해 이것을하지 않습니다.새로운 신호를 가져오는 것 (기능 생성, 기능 엔지니어링이 아닌)은 점프와 경계로 성능을 향상시킬 수있는 것입니다.우리가 피라미드의 다음 단계로 이동하는 것에 흥분하는 데이터 과학자라 할지라도 여기에 약간의 시간을 보낼 가치가 있습니다. AI 를 가져 가라! 당신은 그것을 만들었습니다. 당신은 도구를 가지고 있습니다. 당신의 ETL은 엉망입니다. 당신의 데이터는 조직되고 깨끗합니다. 당신은 대시보드, 라벨 및 좋은 기능을 가지고 있습니다. 당신은 올바른 것을 측정하고 있습니다. 당신은 매일 실험 할 수 있습니다. 당신은 끝에서 끝까지 디버그 된 기본 알고리즘을 가지고 있으며 생산에 실행하고 있습니다. 당신은 수십 번 변경했습니다. 당신은 준비가되어 있습니다. 거기에서 최신과 가장 큰 것을 시도하십시오. - 기계 학습을 전문으로하는 회사에서 자신을 롤링하는 것에서부터. 당신은 생산에 큰 개선을 얻을 수 있습니다. 또는 당신은하지 않을 수 있습니다. 최악의 경우, 당신은 새로운 방법을 배우고, 그들과 함께 의견을 개발하고, 당신의 투자자와 당신의 AI 노력에 MVPs, Agile, Lean 및 그 모든 것에 대해 어떻게 생각하십니까? 전통적인 MVP (최소한 실현 가능한 제품)를 구축할 때와 마찬가지로, 당신은 당신의 제품의 작은, 수직 섹션으로 시작하여 그것을 끝에서 끝까지 잘 작동시킬 수 있습니다.당신은 피라미드를 구축 한 다음 수평으로 성장시킬 수 있습니다.예를 들어, Jawbone에서 우리는 수면 데이터로 시작하고 피라미드를 구축했습니다 : 도구, ETL, 청소 및 조직, 라벨 캡처 및 정의, 지표 (사람들이 매일 밤 수면하는 시간의 평균 #는 무엇입니까? 기계 학습 기반 데이터 제품 (자동 잠 탐지) 이것은 단계별로, 음식, 날씨, 운동, 소셜 네트워크 및 커뮤니케이션 - 한 번에 하나. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. 데이터 스토리 확장 올바른 질문을하고 올바른 제품을 만들기 이것은 단지 당신이 어떻게 아니면 당신이 (정치적 또는 윤리적 이유로) could should 기계 학습 도구의 약속 ‘ ’ Amazon API 또는 TensorFlow 또는 다른 오픈소스 라이브러리에 대해 어떻게 생각하십니까? 이 모든 것은 훌륭하고 매우 유용합니다. (일부 회사는 작업을 보여줄 수 있도록 전체 피라미드를 고무적으로 사용자 정의 할 수 있습니다. 그들은 영웅입니다.) 그러나 현재의 AI 하이프의 강력한 영향 아래 사람들은 더러운 데이터와 빈곤으로 가득 찬 데이터를 연결하려고합니다. 형식과 의미를 변경하면서 수년간 지속되며 아직 이해되지 않았습니다.이 방법은 의미가없는 방식으로 구성되어 있으며 마법으로 처리 할 수있는 도구를 기대합니다. 그리고 어쩌면 언젠가 곧 그것이 일어날 것입니다.