通常、急速に進歩するテクノロジーと同様に、AIは大規模なインスピレーションを与えました。 で、 そして 一部はそれに値するもので、 隠れたハードウェアのスタートアップからフィンテックの巨人まで、公共機関まで、チームは彼らのAI戦略に熱狂的に取り組んでいます。 FOMO フード フェイス いくつかはNot 「私たちはどのようにAIと機械学習を使用して、私たちがやっていることをよりよくするか?」 「私たちはどのようにAIと機械学習を使用して、私たちがやっていることをよりよくするか?」 しばしば、企業は、 たぶん、雇われたのかも知れません。 星より少ない結果、あるいは、 しかし、最も一般的なシナリオは、彼らが最も基本的なインフラを実装するためのインフラストラクチャをまだ構築していないことである(そしてその利点を収穫している)。 アルゴリズムと操作、それ以上に . not 初のデータサイエンティスト データ文学 データ科学 機械学習 データサイエンス・AIコンサルタントとして、このメッセージを数え切れないほど何度も伝えなければならなかったが、特に過去2年間にわたって。 自分のフィールドのすべての興奮の中で濡れた毛布になるのは難しい、特にあなたがその興奮を共有している場合です。そして、AIの準備ができていない企業は、エリート主義者(自分自身が指名したゲートウォーター)であることなく、どのように言いますか? 同意 以下は、最も共鳴した説明です。 Think of AI as the top of a ニーズのピラミッド . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). ニーズのピラミッド 基本要望:数えることはできますか? ピラミッドの底には、私たちが 必要なデータは何ですか? 利用可能なデータは何ですか? ユーザー向けの製品であれば、関連するすべてのユーザーインタラクションを記録していますか? センサーの場合は、どのようなデータが送信され、どのように送信されますか? まだ楽器化されていないインタラクションを記録することはどれほど簡単ですか? 結局のところ、正しい方法です。 これは、最近の機械学習の進歩を可能にしたものです。 data collection データ 次に、どのようにして システムを通じて? あなたは信頼できるストリーム / ETL を持っていますか? どこでそれを保存し、アクセスし、分析することはどれほど簡単ですか? 信頼性の高いデータフローは、データで何でもするための鍵であると(約10年間)言っています。 data flow ジェイ・クレプス [Aside: I was looking for an exact quote and found it in his’] I LOVE LOGS 次に、ある段落で、彼はこのマスローのニーズの等級比較を正確にしていることに気付いたが、そこに「明らかなことに注目する価値がある」が良い措置のために投げ込まれている(Jayに感謝!) ポスト データサイエンティストがやっていることについて 数日前 ショーン・テイラー オープン 彼自身のデータサイエンスのニーズのピラミッド(皮肉なことにデータサイエンスの未結合の三角と呼ばれています)は、もちろん、まったく異なります。 I LOVE LOGS ポスト オープン データが利用可能であれば、 これは、あなたが多くのデータを欠いていることを発見したとき、あなたのセンサーは信頼できない、バージョンの変更はあなたのイベントが落とされ、あなたは旗を誤解していることを意味し、あなたはピラミッドの基盤が堅固であることを確認するために戻ります。 explore and transform データを信頼できるように探索し、クリーンにすることができれば、伝統的にBIやBIとして考えられるものを構築し始めることができます。 : 追跡するメトリクスを定義し、それらの季節性とさまざまな要因への敏感性を定義します。おそらく、いくつかの粗大なユーザーセグメントを行い、何かが飛び出しているかどうかを確認します。 機械学習モデルに組み込むために、この段階で、あなたが予測または学びたいことを知り、あなたの準備を開始することができます。 ラベルを生成することによって、自動的に(どの顧客がクルアーンしたか?)または、ループにいる人々によって。 analytics features training data これはまた、あなたがあなたの最もエキサイティングで説得力のあるものを見つける時でもあります。 これもまた別のメディアのテーマです。 data stories 数えられるんだけど、どうする? 私たちはトレーニングデータを持っています - 確かに、今は機械学習ができるのですか? もしかしたら、あなたが内部で churn を予測しようとしている場合? いいえ、結果が顧客向けになる場合。 われわれは、災害を避けるために段階的に展開し、変化がすべての人に影響を与える前に変化の影響を粗大に推定できるようにする。 現地(推奨システムの場合、これはたとえば「最も人気のある」、「あなたのユーザーセグメントにとって最も人気のある」──非常に不快だが効果的な「パーソナライズ化前のステレオタイプ」です)。 experimentation simple baseline シンプルなヒューリスティクスは驚くほど打ち負かすのが難しいので、中間にあるハイパーパラメーターを超えた謎のMLブラックボックスなしでシステムのエンド-to-エンドデバッグを可能にします。 この時点で、あなたは非常に単純なMLアルゴリズム(物流回帰や、はい、分割などの)を展開し、その後、あなたの結果に影響を与える可能性のある新しいシグナルや機能を考えることができます。天気と統計データは私のゴトスです。そしてノー - それほど強力なほど、深い学習は自動的にあなたのためにこれを行うことはありません。新しいシグナル(機能の作成ではなく、機能エンジニアリング)を導入することは、あなたのパフォーマンスを飛躍的に向上させることができます。 AIを持ち込んでください! あなたはそれを作りました。 あなたは機械化されています。 あなたのETLはハムアップしています。 あなたのデータは組織化され、クリーン化されています。 あなたはダッシュボード、ラベル、そして良い機能を持っています。 あなたは正しいものを測定しています。 あなたは毎日実験することができます。 あなたは端から端にデバッグされたベースラインアルゴリズムを持っており、生産中に実行されています - あなたは何十回もそれを変更しました。 あなたは準備ができています。 あなたは、あなた自身をロールして機械学習に特化している企業を使用するまで、そこに最新で最高のものを試してみてください。 あなたは生産にいくつかの大きな改善を得るかもしれません、またはあなたはそうでないかもしれません。 最悪の場合、あなたは新しい方法を学び、それらと意見 MVPs、Agile、Lean、その他はどうでしょうか? 伝統的なMVP(最低限実行可能な製品)を構築するときと同じように、あなたはあなたの製品の小さな垂直セクションから始まり、端から端までうまく動作させます。あなたはピラミッドを構築し、それから横向きに成長することができます。例えば、Jawboneでは、睡眠データから始まり、ピラミッドを構築しました:ツール、ETL、クリーニング&組織、ラベルキャプチャと定義、メトリクス(人々が毎晩眠る時間の平均値は何ですか?睡眠時間についてどうですか?睡眠時間は何ですか?)、クロスセグメント分析はすべての道を通じて 機械学習によるデータ製品(自動睡眠検出) 次に、食料、天候、トレーニング、ソーシャルネットワーク、コミュニケーションを一つずつ行います。 The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. データストーリー 拡張 正しい質問をし、正しい製品を構築する これはあなたがどのように あなたがたが (倫理的・実践的な理由から) could should 機械学習ツールの約束 ‘ ’ Amazon API または TensorFlow またはその他のオープンソースライブラリについてはどうでしょうか? ML ツールを販売している企業、または情報や機能を自動的に抽出している企業はどうでしょうか? 彼らはヒーローです.) しかし、現在のAIハイプの強力な影響下で、人々は汚れたデータと空白に満ちたデータを接続しようとします、それは数年間にわたってフォーマットと意味を変更しながら、まだ理解されていません、それは意味を持たない方法で構成されています、そしてそれらのツールが魔法で処理することを期待しています。