paint-brush
Giới thiệu về Chat2Query: Trình tạo SQL do AI cung cấptừ tác giả@tidbcommunity
7,482 lượt đọc
7,482 lượt đọc

Giới thiệu về Chat2Query: Trình tạo SQL do AI cung cấp

từ tác giả TiDB Community Tech Portal4m2023/03/22
Read on Terminal Reader

dài quá đọc không nổi

Chat2Query là trình tạo truy vấn ngôn ngữ tự nhiên mang tính cách mạng được hỗ trợ bởi GPT3 của OpenAI và công nghệ đằng sau ChatGPT. Chat2Query cung cấp thông tin chuyên sâu theo thời gian thực và có thể hành động để đưa ra các quyết định kinh doanh tức thì. Trong bài đăng này, chúng tôi sẽ chỉ cho bạn cách bắt đầu với truy vấn Chat2 do AI cung cấp và khám phá thông tin chi tiết thông qua bộ dữ liệu mẫu.
featured image - Giới thiệu về Chat2Query: Trình tạo SQL do AI cung cấp
TiDB Community Tech Portal HackerNoon profile picture
0-item
1-item


Chúng tôi rất vui mừng được giới thiệu Chat2Query (beta), một trình tạo truy vấn ngôn ngữ tự nhiên mang tính cách mạng được hỗ trợ bởi Pre-training Transformer 3 ( GPT-3 ), công nghệ đằng sau ChatGPT và TiDB, cơ sở dữ liệu SQL phân tán.


Với Chat2Query, bạn không cần phải là chuyên gia SQL để trích xuất thông tin chi tiết từ dữ liệu của mình. Chỉ cần đặt một câu hỏi và công cụ AI sẽ thực hiện phần còn lại, tạo ra một truy vấn SQL mạnh mẽ để truy xuất thông tin chi tiết. Bằng cách kết hợp OpenAI và TiDB, chúng tôi sử dụng AI để đổi mới cơ sở dữ liệu và hỗ trợ khám phá dữ liệu, cung cấp thông tin chi tiết theo thời gian thực và có thể thực hiện được cho các quyết định kinh doanh tức thì .


Trong bài đăng này, chúng tôi sẽ chỉ cho bạn cách bắt đầu với Chat2Query do AI cung cấp và khám phá thông tin chi tiết thông qua bộ dữ liệu mẫu và bộ dữ liệu của riêng bạn.


Không chỉ là một trình tạo SQL do AI hỗ trợ khác

Có, hiện có một số trình tạo SQL do AI hỗ trợ có thể giúp người dùng tạo các truy vấn SQL mà không cần phải có kiến thức sâu rộng về ngôn ngữ SQL. Tuy nhiên, những công cụ AI này phù hợp nhất để tạo các truy vấn đơn giản. Điều này có nghĩa là chúng có thể không phù hợp với các nhiệm vụ phức tạp hơn hoặc sử dụng sản xuất.


Chat2Query được cung cấp bởi:

  • OpenAI's GPT3, mô hình xử lý ngôn ngữ tự nhiên thành mã hàng đầu trong ngành và công nghệ đằng sau ChatGPT lan truyền.
  • Tầng TiDB Cloud Serverless, dịch vụ cơ sở dữ liệu Kết hợp Giao dịch và Xử lý Phân tích (HTAP) cho phép các nhà phát triển triển khai cơ sở hạ tầng của họ trên quy mô lớn theo cách tiết kiệm chi phí nhất mà không cần quản lý cơ sở hạ tầng máy chủ.


Bằng cách sử dụng hai công nghệ này, Chat2Query có thể xử lý ngay cả những truy vấn phức tạp nhất và cung cấp thông tin chi tiết theo thời gian thực về bộ dữ liệu động .

Khám phá các trường hợp sử dụng mẫu

Trong các ví dụ sau, chúng tôi sử dụng Chat2Query để tạo hai truy vấn đối với các bộ dữ liệu khác nhau:

Truy vấn trên bộ dữ liệu Netflix – cho tôi biết 10 tựa phim Netflix hay nhất.

Truy vấn trên tập dữ liệu Web3 – tháng nào của năm ngoái có khối lượng lớn nhất xảy ra

Bắt đầu với Chat2Query

Chat2Query là một tính năng tích hợp trong TiDB Cloud Serverless TiDB. Bạn có thể thực hiện các bước sau để bắt đầu:

Bước 1: Đăng nhập vào cụm Serverless Tier của bạn.

Đăng ký tài khoản TiDB Cloud bằng email, tài khoản Google hoặc tài khoản GitHub của bạn. Cụm Serverless Tier của bạn sẽ được tạo tự động trong vòng chưa đầy 20 giây và bạn sẽ được chuyển hướng đến giao diện Chat2Query.


Bước 2: Chuẩn bị bộ dữ liệu của bạn.

Bạn có thể sử dụng bộ dữ liệu mẫu để nhanh chóng khám phá Chat2Query hoặc khám phá thông tin chi tiết về bộ dữ liệu của riêng bạn.


Sử dụng bộ dữ liệu mẫu

Theo mặc định, bạn sẽ truy vấn bảng sample_data với bốn bộ dữ liệu đặt trước – github_events , global_fortune_500 , imdb_movie_ratingssold_car_orders .


Sử dụng bộ dữ liệu của bạn

  1. Để bắt đầu, hãy chuẩn bị sẵn bộ dữ liệu mục tiêu của bạn. Nếu không có, bạn có thể lấy một cái từ các trang web lưu trữ tập dữ liệu miễn phí, chẳng hạn như Kaggle .


  2. Trong tab Lược đồ , hãy nhấp vào ... ở bên phải cơ sở dữ liệu đích và nhấp vào Nhập dữ liệu để bắt đầu nhập tập dữ liệu của bạn ở định dạng CSV cục bộ hoặc từ Amazon S3. Trong trường hợp của chúng tôi, chúng tôi sử dụng eth-usdt , bộ dữ liệu giá tiền điện tử Ethereum/Tether trong CSV.


  3. Làm theo lời nhắc để định cấu hình nguồn và đích nhập rồi bắt đầu nhập. Thời gian cần thiết khác nhau tùy thuộc vào kích thước của dữ liệu. Khi nhập xong, cửa sổ chi tiết nhập sẽ hiển thị.


Bước 3: Khám phá thông tin chi tiết với Chat2Query.

  1. Tạo truy vấn. Trong trình chỉnh sửa Chat2Query, hãy nhập “– câu hỏi của bạn” và nhấp Enter để AI tạo truy vấn bằng SQL.
  2. Xem lại truy vấn. Nhấn phím Tab để chấp nhận SQL hoặc chỉnh sửa nếu cần trước khi chấp nhận.
  3. Chạy truy vấn của bạn. Ở góc trên cùng bên phải của màn hình, nhấp vào nút phát. Kết quả truy vấn được hiển thị ở cuối trang.
  4. Bạn sẽ thấy nhật ký truy vấn và kết quả ngay lập tức ở cuối trang. Đối với đầu ra mẫu, xem Khám phá cách sử dụng mẫu.

Được xây dựng với bảo mật và quyền riêng tư

Quyền riêng tư và bảo mật dữ liệu người dùng là ưu tiên hàng đầu của chúng tôi. Chúng tôi hiểu rằng người dùng của chúng tôi tin tưởng chúng tôi để bảo vệ thông tin của họ và chúng tôi thực hiện trách nhiệm đó một cách nghiêm túc. Là một dịch vụ truy vấn trên TiDB Cloud, Chat2Query chỉ cần truy cập lược đồ cơ sở dữ liệu của bạn để tạo SQL chứ không phải dữ liệu thực tế của bạn.

Hạn chế

Là một dự án thử nghiệm, Chat2Query vẫn đang trong quá trình phát triển với rất nhiều điểm cần cải thiện.


Do đó, có hai hạn chế cần lưu ý:

  1. SQL do AI tạo ra không phải lúc nào cũng đúng 100% và vẫn có thể cần điều chỉnh thêm.
  2. Chat2Query hỗ trợ hạn chế cho các câu lệnh SQL. Các câu lệnh DDL như CREATE TABLEDROP TABLE chưa được hỗ trợ.

Bắt đầu với Chat2Query ngay hôm nay

Bạn có thể truy cập sớm tại đây . Chúng tôi muốn nghe phản hồi của bạn để chúng tôi có thể làm cho công cụ truy vấn này trở nên tốt hơn nữa.


Trong khi đó, Chat2Query đang phát triển nhanh chóng. Vui lòng theo dõi chúng tôi trên Twitter để cập nhật thông tin về tiến độ của nó.


Có một câu hỏi hoặc nhận xét về bài viết? Truy cập Diễn đàn TiDB


Cũng được xuất bản ở đây