Chúng tôi rất vui mừng được giới thiệu Chat2Query (beta), một trình tạo truy vấn ngôn ngữ tự nhiên mang tính cách mạng được hỗ trợ bởi Pre-training Transformer 3 ( GPT-3 ), công nghệ đằng sau ChatGPT và TiDB, cơ sở dữ liệu SQL phân tán.
Với Chat2Query, bạn không cần phải là chuyên gia SQL để trích xuất thông tin chi tiết từ dữ liệu của mình. Chỉ cần đặt một câu hỏi và công cụ AI sẽ thực hiện phần còn lại, tạo ra một truy vấn SQL mạnh mẽ để truy xuất thông tin chi tiết. Bằng cách kết hợp OpenAI và TiDB, chúng tôi sử dụng AI để đổi mới cơ sở dữ liệu và hỗ trợ khám phá dữ liệu, cung cấp thông tin chi tiết theo thời gian thực và có thể thực hiện được cho các quyết định kinh doanh tức thì .
Trong bài đăng này, chúng tôi sẽ chỉ cho bạn cách bắt đầu với Chat2Query do AI cung cấp và khám phá thông tin chi tiết thông qua bộ dữ liệu mẫu và bộ dữ liệu của riêng bạn.
Có, hiện có một số trình tạo SQL do AI hỗ trợ có thể giúp người dùng tạo các truy vấn SQL mà không cần phải có kiến thức sâu rộng về ngôn ngữ SQL. Tuy nhiên, những công cụ AI này phù hợp nhất để tạo các truy vấn đơn giản. Điều này có nghĩa là chúng có thể không phù hợp với các nhiệm vụ phức tạp hơn hoặc sử dụng sản xuất.
Chat2Query được cung cấp bởi:
Bằng cách sử dụng hai công nghệ này, Chat2Query có thể xử lý ngay cả những truy vấn phức tạp nhất và cung cấp thông tin chi tiết theo thời gian thực về bộ dữ liệu động .
Trong các ví dụ sau, chúng tôi sử dụng Chat2Query để tạo hai truy vấn đối với các bộ dữ liệu khác nhau:
Chat2Query là một tính năng tích hợp trong TiDB Cloud Serverless TiDB. Bạn có thể thực hiện các bước sau để bắt đầu:
Đăng ký tài khoản TiDB Cloud bằng email, tài khoản Google hoặc tài khoản GitHub của bạn. Cụm Serverless Tier của bạn sẽ được tạo tự động trong vòng chưa đầy 20 giây và bạn sẽ được chuyển hướng đến giao diện Chat2Query.
Bạn có thể sử dụng bộ dữ liệu mẫu để nhanh chóng khám phá Chat2Query hoặc khám phá thông tin chi tiết về bộ dữ liệu của riêng bạn.
Sử dụng bộ dữ liệu mẫu
Theo mặc định, bạn sẽ truy vấn bảng sample_data
với bốn bộ dữ liệu đặt trước – github_events
, global_fortune_500
, imdb_movie_ratings
và sold_car_orders
.
Sử dụng bộ dữ liệu của bạn
Để bắt đầu, hãy chuẩn bị sẵn bộ dữ liệu mục tiêu của bạn. Nếu không có, bạn có thể lấy một cái từ các trang web lưu trữ tập dữ liệu miễn phí, chẳng hạn như Kaggle .
Trong tab Lược đồ , hãy nhấp vào ...
ở bên phải cơ sở dữ liệu đích và nhấp vào Nhập dữ liệu để bắt đầu nhập tập dữ liệu của bạn ở định dạng CSV cục bộ hoặc từ Amazon S3. Trong trường hợp của chúng tôi, chúng tôi sử dụng eth-usdt
, bộ dữ liệu giá tiền điện tử Ethereum/Tether trong CSV.
Làm theo lời nhắc để định cấu hình nguồn và đích nhập rồi bắt đầu nhập. Thời gian cần thiết khác nhau tùy thuộc vào kích thước của dữ liệu. Khi nhập xong, cửa sổ chi tiết nhập sẽ hiển thị.
Quyền riêng tư và bảo mật dữ liệu người dùng là ưu tiên hàng đầu của chúng tôi. Chúng tôi hiểu rằng người dùng của chúng tôi tin tưởng chúng tôi để bảo vệ thông tin của họ và chúng tôi thực hiện trách nhiệm đó một cách nghiêm túc. Là một dịch vụ truy vấn trên TiDB Cloud, Chat2Query chỉ cần truy cập lược đồ cơ sở dữ liệu của bạn để tạo SQL chứ không phải dữ liệu thực tế của bạn.
Là một dự án thử nghiệm, Chat2Query vẫn đang trong quá trình phát triển với rất nhiều điểm cần cải thiện.
Do đó, có hai hạn chế cần lưu ý:
CREATE TABLE
và DROP TABLE
chưa được hỗ trợ.Bạn có thể truy cập sớm tại đây . Chúng tôi muốn nghe phản hồi của bạn để chúng tôi có thể làm cho công cụ truy vấn này trở nên tốt hơn nữa.
Trong khi đó, Chat2Query đang phát triển nhanh chóng. Vui lòng theo dõi chúng tôi trên Twitter để cập nhật thông tin về tiến độ của nó.
Có một câu hỏi hoặc nhận xét về bài viết? Truy cập Diễn đàn TiDB
Cũng được xuất bản ở đây