Brains Byte Back ポッドキャストの今日のエピソードでは、組織がデータの力を高速かつ簡単に活用できるようにすることで、AI と機械学習の使用を民主化する会社dotDataのマーケティング担当副社長、 Walter Paliska氏に話を聞きます。ユニークで使いやすいツール。
このエピソードでは、会社がどのようにして設立され、どのように成長し、現在提供しているソリューションについて説明します。また、予測データマイニングと、それが企業が過去のデータを活用して将来の行動や結果について正確に予測するのにどのように役立つかについても調査します。
パリスカ氏はマーケティングの例を引き合いに出し、企業は予測データマイニングを利用してWebサイト訪問者の行動を予測し、パーソナライズされたターゲティングを実現できると主張した。
さらにパリスカ氏は、dotData の CEO 兼創設者である藤巻良平氏がデータ サイエンティストのチームが特徴エンジニアリング プロセスに膨大な時間を費やしていることに気づいた後、どのようにして dotData が設立されたのかについても語ります。
これはデータ サイエンス プロセスの中で最も時間がかかり、手作業で行われる部分であったため、藤巻氏はこの問題を解決するために自動化を利用することに決め、こうして dotData が誕生しました。
また、パリスカ氏は、クライアントがデータ サイエンス プロジェクトにかかる時間とコストを節約し、データ サイエンティスト以外のデータ サイエンスを民主化し、機械学習モデルの精度と速度を向上させるのに同社がどのように貢献しているかを共有します。
これらは dotData が競合他社との差別化を図る方法のほんの一部にすぎないと彼は主張します。しかし、パリスカ氏は、最大の差別化要因の 1 つは、機能エンジニアリング プロセスを自動化する dotData のコア エンジンであると主張します。
特徴量エンジニアリングは、効果的な機械学習モデルを構築する上で重要なステップですが、非常に時間がかかる複雑なプロセスでもあります。通常、データ サイエンティストは数か月かけて特徴テーブルを構築し、それを機械学習アルゴリズムに手動で入力します。
ただし、dotData はこのプロセスを自動化し、さまざまなテーブル間の接続を識別し、機能テーブルを自動的に構築します。 Paliska 氏によると、このアプローチにより dotData は傑出した存在となり、これが同社が市場でこれほど高いレベルの成功を収めた主な理由の 1 つとなっています。
Spotify 、 Anchor 、 Apple Podcasts 、 Breaker 、Google Podcasts 、 Stitcher 、 Overcast 、 Listen Notes 、 PodBean 、およびRadio Public で聴くことができます。
ウォルター:私の名前はウォルター、ウォルター・パリスカです。私は dotData のマーケティング担当副社長です。私は 2019 年 5 月から dotData を利用しています。つまり、ほぼ 4 年になります。また、dotData は大手プロバイダーまたはデータ サイエンス自動化ソリューションであり、主に業務の機能エンジニアリング部分の自動化を検討している大規模な組織で、当社がターゲットとする傾向にある顧客タイプ、経験豊富な担当チームに幅広く対応しています。もう 1 つは、予測分析の世界とデータ サイエンスの世界に参入したばかりで、機械学習モデルとデータの構築プロセスにおいてデータ サイエンティスト以外の人々に力を与えるための自動化ソリューションを探している企業です。予測分析を行うために統合された科学プロセス。
サム:すごい、素晴らしい。さて、今日はご参加いただきまして誠にありがとうございます。お越しいただき光栄です。そして、dotData をいつ、どのように最初に停止するかについて知りたいと思っています。
ウォルター:ええ、とても素晴らしい質問ですね。実は、dotData の話はかなり昔に遡ります。 dotData の CEO 兼創設者である藤巻良平は、日本の NEC の元従業員です。実は彼はいわゆるNECの研究員だったんですね。現在、会社の歴史の中でそれほど多くはありませんが、彼はかなり古い会社が100年をはるかに超えていると見ています。正確な数字は忘れましたが、嘘はつきたくないのです。しかし、ご存知のとおり、NEC の研究員は会社の歴史の中で非常に少数であり、彼は会社の歴史の中で最年少でした。そして、彼はデータ サイエンス チームの一員であり、サービスの観点から見たデータ サイエンス組織であるトレンド データの一員でした。そのため、彼らはアカウントに対してプロジェクトベースの作業を行うことになります。そして、dotData の背後にあるアイデアは実際に生まれました。 NEC での経験を通じて、彼が一貫して気づき続けていたことの 1 つは、彼のデータ チーム、科学者が常にデータ サイエンス プロセスの特定の部分に膨大な時間を費やしているということでした。ここで技術的な雑草の話に少し触れます。しかし、特徴量エンジニアリングとして知られる専門分野が 1 つあり、これはプロセスの中で実際に最も時間がかかり、最も手動で行われる部分です。そして彼は、彼らが文字通り特徴エンジニアリングのプロセスに何か月も費やすことになるだろうと考え続けました。そして、彼らはまだ、モデルがどのようなものであるべきかを理解するために、機械学習アルゴリズムをまだ試していない段階にあるでしょう。そしてご存知のとおり、それは明らかに「なるほど」という瞬間であり、ある時点でそこに何かがあることを知らせます。したがって、ここにはニーズがあり、自動化がおそらくその問題を解決できる可能性があります。そして、そこに dotData の背後にあるアイデアが生まれ、2018 年に NEC Corporation から独立して設立された会社が設立されました。日本では、つまり元々は日本で生まれましたが、完全に本社は米国にあり、本社はすべて米国にあります。スタッフがいて、かなり分散した会社です。私たちは世界中にいて、ヨーロッパにも人がいますし、日本にも人がいますし、米国にも人がいます。そしてそれが私たちを今日の状況に導きます。
サム:すごいね。素晴らしい成功事例ですね。また、dotData という名前の背後にあるストーリーを知りたいと思っています。リスナーにとって、この名前は dot dot のように綴られますが、小文字の d があり、その直後に大文字の D が続くデータだからです。それはどこから来ましたか?
ウォルター:素晴らしい質問ですね。 dotData という名前の背後にある最初のインスピレーションは、ご存知のとおり、企業がもてあそんでいたことを発見した人々のグループだったアイデアの 1 つから来ています。最初に開始されたのは 2016 年から 2017 年頃でした。そのため、データとデータの量、世界中で毎日どれだけのデータが生成されているかについて、世界中で多くの会話が行われていました。そして、それは、ご存知のとおり、1990 年代と 2000 年代に、いわばインターネットの以前の反復に始まりました。すべてはドットネットに関するものでした。右?そしてネットワーク、そして彼らは、次の世界の反復は本当にデータに関するものになるだろうと考えました。そのデータは、.net ドット データの代わりに。それが dotData 名の背後にある本来の意図でした。
サム:分かった、そうだね、それはもっと明確に意味が分かるね。それを念頭に置いて。 DD、ドットデータの頭韻も本当に大好きです。こう言うと本当に素敵な響きになります。
Walter:ああ、それは思い出に残る名前だし、それをマークするのは簡単だよ。
サム:はい、はい、それはよくわかります。また、昨年 11 月に dotData の皆さんが予測データ マイニングとは何ですか? という記事を公開したことも知りたいです。もちろん、リスナーにはぜひチェックしていただくことをお勧めします。ここにいらっしゃる間に、予測データ マイニングとは何かについて簡単に概要を説明していただけますか?
ウォルター:もちろん、そのとおりです。当然のことですが、聴衆の観点から見ると、これに詳しくない人は、別の用語でそれを聞いたことがあるかもしれませんが、予測分析、予測データ マイニング、データ マイニング自体と呼ばれていることを聞いたことがあるかもしれません。技術的には、これらは完全に同じものではありません。本当に分割したい場合は、ご存知のとおり、ある種の広範な対象者にとって、予測データ マイニングと予測分析は、実際には組織内にある履歴データを活用することを目的としています。 。たとえば、マーケティングでの優れた使用例として、Web サイトの訪問者のショッピング カートの行動を予測したい場合がありますよね?そして、特定の人が特定の製品を購入する前にどのような行動をとるかについての履歴データがあります。そして、そのデータを使用し、そのデータをマイニングし、デシジョン ツリー分析やルール誘導、クラスタリング、外れ値検出、その他の種類のデータ マイニング手法などの非常に特殊な手法やアルゴリズムを使用して、パターンを決定し、予測分析の一部であるインサイトにアクセスして、それらのインサイトを構築するようなものです。これらは機械学習の世界では機能と呼ばれることもありますが、大丈夫、これはよくあることだ、という洞察を見つけてください。先ほどの例で誰かが特定の製品を購入するたびに、さらに一歩進んで「よし、今度は特定の機械学習アルゴリズムを使用して、誰かが特定の製品を購入したときにその製品を購入する確率を予測してみよう」と言うのです。行動。先ほど挙げた例において、マーケターとしてのあなたが重要である理由は、誰かが特定の行動をとったときに何が起こるかをある程度の精度で予測できれば、人々をその行動に向けて駆り立てることができるからです。その情報を活用してマーケティング キャンペーンを最適化します。これは簡単に言うと予測データ マイニングですが、すぐに非常に複雑になり、さらに話すべきことがたくさんあります。そこで、文字通りマーケティング担当者に第 32 バージョンを提供しました。当社の Web サイトで入手できるさらに多くの情報を提供しました。これについて明らかに知りたいと思っている人なら誰でも喜んで会います。私たちはこれについてできる限り市場に啓蒙することに非常に熱心です。
Sam:そうですね、すぐにかなり複雑になることは想像できます。ですから、その簡単な概要を教えていただき、本当に感謝しています。非常に複雑に見えるトピックをうまく要約できたと思います。さて、私も知りたいのですが、このスペースを運営している他の会社はありますか?もしそうなら、dotData の皆さんは競合他社とどのように差別化を図っているのでしょうか?
ウォルター:素晴らしい質問ですね。したがって、簡単な答えは「はい」です。もちろん、この分野で事業を展開している企業は他にもたくさんあります。そして、そうは言っても、機械学習スラッシュ予測分析分野についておそらく自明のことの 1 つは、それが信じられないほど速いペースで発展し、変化しているということです。たとえば、私が dotData に初めて参加した 3 年か 4 年前と、同じ企業が現在どのように自社を位置づけているか、製品が今日どのように構築され、現在どこで事業を行っているかなど、企業の位置付けを見ると、会話は根本的に異なります。 。そしてそれは、市場の発展の速さが主な要因です。ただし、これらすべてを通じて、そのデータの 1 つの大きな差別化要因は、実際には dotData のコア エンジンと dotData の動作方法に帰着します。私がまだ話していないことの 1 つは、これはこの会話の少し技術的な深みになりますが、重要なのは、予測分析の世界では、そう、いつ、どこに行くかということです。これらの機械学習アルゴリズムを使用して予測モデルを構築しますが、これらの機械学習アルゴリズムはフラット テーブルのようなもので、本質的には満足できません。エンタープライズ データについてどれだけ知っているかはわかりませんが、特にエンタープライズ データの世界では、たとえば salesforce.com のようなものについて、salesforce.com のユーザーとして考えてみると、次のようになります。見込み客画面を見ると、見込み客情報が表示されます。そして、リードに対する私のアクティビティはすべて 1 つの場所にあります。しかし、そのカバーを外して、このシステムがどのように動作するかをいわば内部で見てみると、基本的にはリレーショナル データベースと呼ばれるものです。つまり、私が目にしているこれらのフィールドの多くは、実際には営業担当者のさまざまな部分に提供されるさまざまなテーブルの一部であり、それらはすべて一緒に接続されています。そうですね、機械学習アルゴリズムはそういったものを好みません。機械学習アルゴリズムはフラット テーブルのようなもので、機械学習アルゴリズムは CSV のように見えるものがスプレッドシートのように見えるのを好みます。したがって、機械学習の大部分は、特徴エンジニアリングと呼ばれるものです。これは本質的に、これらの複雑なリレーショナル データ テーブルを取得し、機械学習アルゴリズムにとって意味のあるパターンを見つけ出し、基本的にこれらのフラット テーブルを構築するプロセスです。機械学習アルゴリズムにフィードします。 dotData の最大の核となる差別化要因は、その部分が自動的に行われることです。これは伝統的に非常に実践的なプロセスです。最初の質問に戻ると、そのデータがどのように発生したのかがわかります。それは、当社の CEO が見ていた「なるほど」の瞬間でした。これらのデータ サイエンティストは、文字どおり数か月を費やしてこれらの特徴テーブルを構築し、その後手動で機械学習アルゴリズムに組み込む必要がありました。そして、もっと良い方法があるはずだと気づき、これらのテーブル間の接続を自動的に見つけ、関連性と目的のあるパターンを自動的に特定し、これらの特徴テーブルを自動的に構築するシステムを構築できなければなりません。それが私たちの最大の差別化要因です。そして現在、その機能を提供しているのは市場で当社だけです。
サム:なるほど、それは理にかなっていますね。うん。そして、私が人々にインタビューするたびに、私が話をするすべての企業の根底には、ある種の「なるほど」と思う瞬間があるように思えるという事実がいつも気に入っています。そして、そのコアドライブに到達するのは私の仕事の本当に楽しい部分なので、それは絶対に理にかなっていると思います。それで、知りたいのですが、dotData の皆さんにとって、次に何が起こるのでしょうか?
Walter : そうですね、私はいくつかの視点から考えています。 1 つは、明らかに、ビジネスの成長が当社にとって最大の関心分野であるためです。そして実際、私たちが考えていることの 1 つは、特に現在起こっている経済的不確実性を考慮すると、そのようなデータのようなシステムは組織にとって実際にさらに有益になるということです。お金が投資に回ったとき、資本は潤沢で、組織は人員を気にする必要も、問題を解決するために雇用するだけで済みました。物事をより迅速に行う必要があり、より多くのデータ サイエンティストを雇用し、製品をより迅速に構築する必要があり、より多くのデータ エンジニアを雇用する必要がありました。そうですね、経済が今どうなっているのかというと、実際に需要が高まっていて、「私にはチームを拡大する能力がない、許可がない」と言っている企業が実際に増えています。いわば経済的に言えば、1015 20 人以上のデータ サイエンティストを雇用することになります。では、既存のチームの生産性を高めるにはどうすればよいでしょうか。そこで dotData が大きな助けとなります。したがって、その観点からは、短期的にも長期的にも多くの機会があると考えています。そして明らかに、製品の観点からは、たくさんのアイデアとたくさんの新しいことが予定されており、そのほとんどについてはまだ詳しく話すことができませんが、2番目に非常にエキサイティングなものがいくつか登場します。今年の半分は、引き続き製品の機能を拡張し、これまでに行ったことのない新しい領域にも私たちを導くことになります。
サム:素晴らしいですね。そうですね、皆さん色々なことが起こっているようですね。そして、その幸運を祈ります。そして、人々が耳を傾けていて、個人的に、Walter や dotData の最新情報を知りたいと思っている場合、どこに行けばよいでしょうか?
ウォルター:素晴らしい質問ですね。 dotData が最も簡単なのは、dotdata.com にアクセスすることです。私と個人的に連絡を取るには、リーダーシップ ページで私を見つけることができます。私たちの概要ページにアクセスしてから、リーダーシップにアクセスすると、私の写真と略歴が表示され、直接クリックして私の LinkedIn プロフィールに移動することもできます。または、私の LinkedIn プロフィールは非常にシンプルです。 https://www.linkedin.com/in/walterpaliska/ 私の LinkedIn プロフィールにアクセスして、私に連絡してください。
サム:素晴らしいですね。このエピソードの説明にもリンクを含めますので、リスナーはそこにアクセスできます。それ以外は、ウォルター、今日はご参加いただき、誠にありがとうございます。
ウォルター:この機会をいただきましてありがとうございます、そしてリスナーの皆さんもありがとうございました。
この記事は元々、Sam Brake Guia によってThe Sociableに掲載されたものです
この記事のリード画像は、HackerNoon のAI 画像ジェネレーターによって、「夜間にインターネット カフェでコンピューターを操作する人々」というプロンプトを介して生成されました。