ChatGPT の背後にあるテクノロジーである Pre-trained Transformer 3 ( GPT-3 ) と、分散 SQL データベースである TiDB を搭載した革新的な自然言語クエリ ジェネレーターであるChat2Query (ベータ版) を紹介できることを嬉しく思います。
Chat2Query を使用すると、SQL の専門家でなくてもデータから洞察を引き出すことができます。質問をするだけで、あとは AI ツールが処理し、洞察を取得するための強力な SQL クエリを生成します。 OpenAIと TiDB を組み合わせることで、AI を利用してデータベースを革新し、データ探索を支援し、ビジネス上の意思決定を即座に行うためのリアルタイムで実用的な洞察を提供します。
この投稿では、AI を利用した Chat2Query の使用を開始し、サンプル データセットと独自のデータセットを通じて分析情報を探索する方法を紹介します。
はい。SQL 言語に関する広範な知識がなくても、ユーザーが SQL クエリを生成するのに役立つ AI を利用した SQL ジェネレーターがいくつか利用可能です。ただし、これらの AI ツールは単純なクエリの生成に最適です。つまり、より複雑なタスクや本番環境での使用には適していない可能性があります。
Chat2Query は以下によって提供されます。
これら 2 つのテクノロジを使用することで、 Chat2Query は最も複雑なクエリを処理し、動的データセットにリアルタイムの洞察を提供できます。
次の例では、Chat2Query を使用して、異なるデータセットに対して 2 つのクエリを生成します。
Chat2Query は、TiDB Cloud Serverless Tier に統合された機能です。開始するには、次の手順を実行できます。
メール、Google アカウント、または GitHub アカウントを使用して、TiDB Cloud アカウントにサインアップします。 Serverless Tier クラスターは 20 秒以内に自動的に作成され、Chat2Query インターフェイスに移動します。
サンプル データセットを使用して、Chat2Query をすばやく探索するか、独自のデータセットで分析情報を探索することができます。
サンプル データセットの使用
デフォルトでは、4 つのプリセット データセット ( github_events
、 global_fortune_500
、 imdb_movie_ratings
、およびsold_car_orders
を使用して、 sample_data
テーブルに対してクエリを実行します。
データセットの使用
まず、ターゲット データセットを準備します。持っていない場合は、 Kaggleなどの無料のデータセット ホスティング Web サイトから入手できます。
[スキーマ]タブで、ターゲット データベースの右側にある...
をクリックし、 [データのインポート]をクリックして、ローカルの CSV 形式または Amazon S3 からデータセットのインポートを開始します。この場合、CSV の Ethereum/Tether 暗号価格データセットであるeth-usdt
を使用します。
プロンプトに従ってインポート ソースとターゲットを構成し、インポートを開始します。かかる時間は、データのサイズによって異なります。インポートが完了すると、インポートの詳細ウィンドウが表示されます。
ユーザーデータのプライバシーとセキュリティは、私たちの最優先事項です。私たちは、ユーザーが自分の情報を保護するために私たちを信頼していることを理解しており、その責任を真剣に受け止めています。 TiDB クラウドのクエリ サービスとして、Chat2Query はデータベース スキーマにアクセスして SQL を生成するだけでよく、実際のデータにはアクセスしません。
ベータ プロジェクトとして、Chat2Query はまだ開発中であり、改善の余地がたくさんあります。
したがって、次の 2 つの制限事項に注意してください。
CREATE TABLE
やDROP TABLE
などの DDL ステートメントはまだサポートされていません。早期アクセスはこちらから入手できます。このクエリ ツールをさらに改善するために、フィードバックをお待ちしております。
それまでの間、Chat2Query は急速に開発されています。進行状況の最新情報を入手するには、 Twitterでフォローしてください。
記事について質問やコメントがありますか? TiDB フォーラムにアクセス
こちらにも掲載