DataStax is the real-time data company for building production GenAI applications.
Hiện tại có rất nhiều câu hỏi đang xoay quanh tình trạng của AI. Các công ty đã tiến được bao xa với những nỗ lực GenAI riêng của mình? Các tổ chức có thực sự xây dựng các ứng dụng AI bằng cách sử dụng dữ liệu độc quyền của riêng họ theo cách dễ dàng không? Những loại kiến trúc được yêu cầu?
Những câu hỏi này không có gì đáng ngạc nhiên - có rất nhiều ý kiến về AI ngoài kia, từ sự lạc quan không nao núng đến thái độ hoài nghi mệt mỏi, xen lẫn với rất nhiều sự cường điệu.
Tôi nhận thấy rằng điều này giúp làm rõ tình hình thị trường GenAI trên ba lĩnh vực: thị trường muốn thấy gì, lo ngại về những gì có thể xảy ra và điều gì sẽ xảy ra (và như thế nào) vào năm 2024.
GenAI bùng nổ vào cuối năm 2022 khi OpenAI phát hành ChatGPT và cho thấy loại công nghệ này có thể mạnh mẽ và dễ tiếp cận như thế nào. Sự phấn khích về tiềm năng phát triển của AI có ở khắp mọi nơi. Trong thời gian ngắn, GenAI sẽ được đưa vào mọi ứng dụng ở mọi doanh nghiệp. Các nhà đầu tư đã hình dung ra một đường cong tăng trưởng giống như cây gậy khúc côn cầu dành cho các công ty cung cấp cơ sở hạ tầng để hỗ trợ GenAI.
Mặt khác, những người phản đối đã hình dung ra một tương lai AI đen tối là sự giao thoa giữa “Westworld” và “Black Mirror”. Những người khác cảnh báo về bong bóng AI. Từ góc độ đầu tư, một số người nói rằng nó giống như tiền điện tử một lần nữa – rất nhiều hứng thú và cường điệu, và sau đó là một miệng núi lửa bốc khói.
Tôi nghĩ cả hai nỗi sợ hãi này đều không có cơ sở. Chắc chắn, với mỗi làn sóng công nghệ mới, sẽ có những kẻ xấu sử dụng GenAI vì những lý do sai trái. Và sự phấn khích về khả năng của GenAI có ở khắp mọi nơi; nó thực sự mang lại cảm giác “sôi sục” và thậm chí có thể còn chói tai hơn cả tiếng vang của tiền điện tử.
Nhưng sự khác biệt lớn giữa GenAI và tiền điện tử là thực tế là có rất nhiều trường hợp sử dụng thực tế cho GenAI, giữa các tổ chức và giữa các ngành. Trong tiền điện tử, có một trường hợp sử dụng mạnh mẽ: giao dịch tài chính giữa các bên không đáng tin cậy (hay còn gọi là rửa tiền). Đó là điều mà dòng chính không mấy quan tâm.
Hiện tại, tình trạng của các ứng dụng GenAI khiến tôi nhớ đến thương mại điện tử vào cuối những năm 1990 , khi các công ty đang cố gắng tìm ra cách đảm bảo an toàn khi sử dụng thẻ tín dụng qua Internet. Các tổ chức phải mất một thời gian mới tìm ra cách thực hiện điều đó một cách an toàn, nhưng một khi họ đã làm được điều đó thì đột nhiên mọi người đều có một trang web thương mại điện tử.
Điều tương tự mà tôi thấy trong GenAI hiện nay: làm thế nào để đảm bảo rằng các mô hình ngôn ngữ không trả về phản hồi không chính xác bằng ảo giác . Tin tốt? Điều đó đã được tìm ra (nhờ vào thế hệ tăng cường truy xuất hoặc RAG; thông tin thêm về điều đó bên dưới).
Phần lớn những gì chúng ta thấy năm ngoái là các dự án GenAI đã được chứng minh khái niệm: các ứng dụng để chứng minh cho lãnh đạo công ty những gì có thể thực hiện được. Nhưng rất ít công ty đã vượt qua được điều đó để xây dựng các ứng dụng đang được sản xuất hoàn chỉnh. Khi nói “sản xuất”, ý tôi là một tổ chức có ứng dụng AI đang được khách hàng hoặc nhân viên sử dụng theo cách không phải nguyên mẫu.
Nói cách khác, nó có sẵn như một phần hoạt động thường lệ trong một số phân đoạn hoạt động kinh doanh. Đó có thể là bộ phận lễ tân, có thể là bộ phận thực hiện cuộc gọi tới bộ phận dịch vụ khách hàng, nhưng nó ở đâu đó gần với phần chủ đạo của hoạt động kinh doanh.
Walmart là một ví dụ điển hình ban đầu về điều này. Nhà bán lẻ này đã thông báo vào tháng 1 rằng họ đã bổ sung tính năng tìm kiếm do GenAI cung cấp vào ứng dụng mua sắm của mình. Apple được cho là đang thử nghiệm công cụ GenAI để giúp nhân viên của mình hỗ trợ kỹ thuật nhanh hơn. Cho đến khi chúng ta bắt đầu thấy nhiều ví dụ như thế này hơn, GenAI sẽ tồn tại lâu hơn một chút trong giai đoạn đầu của cái mà Gartner gọi là “ chu kỳ cường điệu ”.
Volkswagen vừa công bố một phòng thí nghiệm nội bộ để phát triển các ứng dụng GenAI cho các ứng dụng điều hướng và thông tin giải trí cho ô tô của mình.
Điều đó có nghĩa là chúng ta không còn xa để đạt được “bình nguyên về năng suất” như một số người nghĩ. Như tôi đã đề cập trước đó, kết quả đầu ra của các mô hình đáng tin cậy đã là một trở ngại đối với các tổ chức vẫn đang vật lộn với cách tạo ra phản hồi mô hình ngôn ngữ lớn (LLM) chính xác và phù hợp bằng cách giảm ảo giác.
RAG, cung cấp cho các mô hình dữ liệu hoặc bối cảnh bổ sung trong thời gian thực từ các nguồn khác - thông thường nhất là cơ sở dữ liệu có thể lưu trữ vectơ - hiện đang được sử dụng để giúp giải quyết vấn đề này. Tiến bộ công nghệ này là chìa khóa để phát triển các ứng dụng GenAI dành riêng cho từng miền cụ thể, được xây dựng trên tài sản quý giá nhất của tổ chức: dữ liệu của chính họ.
Mặc dù RAG đã nổi lên như một phương pháp thực tế để đưa bối cảnh doanh nghiệp vào các ứng dụng GenAI, nhưng việc tinh chỉnh - khi một mô hình được đào tạo trước được đào tạo thêm về một tập hợp con dữ liệu - cũng thường được đề cập. Đôi khi phương pháp này có thể hữu ích nhưng RAG là lựa chọn phù hợp nếu có bất kỳ mối lo ngại nào về quyền riêng tư, bảo mật hoặc tốc độ.
Bất kể bối cảnh được thêm vào ứng dụng như thế nào, câu hỏi lớn mà tôi thường nhận được từ các nhà đầu tư mà tôi từng nói chuyện là khi nào các công ty sẽ bắt đầu kiếm tiền từ ứng dụng GenAI?
Câu trả lời của tôi: Hầu hết các doanh nghiệp bạn theo dõi đều là doanh nghiệp hoạt động dựa trên tiêu dùng. Nhiều người hiện đang hỗ trợ các thử nghiệm, bằng chứng về khái niệm (POC) và các ứng dụng thích hợp mà khách hàng của họ đã xây dựng; những thứ đó không ảnh hưởng nhiều đến cách tiêu dùng.
Nhưng điều này đang bắt đầu thay đổi khi các ứng dụng AI chính bắt đầu chuyển từ POC sang sản xuất thực sự. Tôi dự đoán điều này sẽ diễn ra một cách đáng kể vào cuối năm 2024. Nó sẽ thành hiện thực vào nửa cuối năm 2024 bắt đầu ở hai nơi.
Đầu tiên, nó đang chiếm ưu thế trong lĩnh vực bán lẻ (xem ví dụ về Walmart đã đề cập trước đó). Bạn cũng sẽ thấy sự áp dụng rộng rãi trong khu vực mà tôi gọi là “Mạng nội bộ AI”: Trò chuyện bằng PDF, cơ sở kiến thức và trung tâm cuộc gọi nội bộ.
Với mức tiêu thụ mà các loại ứng dụng này thúc đẩy, các công ty như Microsoft , Google và thậm chí cả Oracle đang bắt đầu báo cáo kết quả từ AI. Ngoài lĩnh vực siêu quy mô, các công ty cơ sở hạ tầng AI khác có thể sẽ bắt đầu nêu bật mức tăng trong báo cáo thu nhập mà họ công bố vào tháng 1, tháng 2 và tháng 3 năm sau.
Nền tảng đã được đặt ra cho các công ty cơ sở hạ tầng AI dựa trên tiêu dùng. Chúng tôi đã thấy các bằng chứng thương mại mạnh mẽ cho thấy những gì có thể làm được đối với một lượng lớn các ứng dụng dành riêng cho từng miền cụ thể. Ví dụ: từ các ứng dụng AI sáng tạo — Midjourney, Adobe Firefly và các trình tạo hình ảnh khác — đến các ứng dụng kiến thức như GitHub Copilot ( hơn 1 triệu nhà phát triển sử dụng nó ), Glean và các ứng dụng khác, những ứng dụng này đã được đón nhận nồng nhiệt và mang lại năng suất đáng kể lợi ích.
Tiến trình trên các ứng dụng riêng biệt là tiên tiến nhất trong các ngành và trường hợp sử dụng cần tạo điều kiện thuận lợi để đưa kiến thức đến điểm tương tác. Kiến thức sẽ đến từ dữ liệu của chính họ, sử dụng các mô hình sẵn có (nguồn mở hoặc độc quyền), RAG và nhà cung cấp đám mây mà họ lựa chọn.
Ba yếu tố cần thiết để doanh nghiệp xây dựng các ứng dụng GenAI riêng biệt sẵn sàng cho hoạt động khắc nghiệt ở quy mô sản xuất: bối cảnh thông minh, mức độ phù hợp và khả năng mở rộng.
Chúng ta hãy xem nhanh cách sử dụng dữ liệu độc quyền để tạo ra phản hồi hữu ích, phù hợp và chính xác trong các ứng dụng GenAI.
Các ứng dụng lấy đầu vào của người dùng dưới dạng tất cả các loại dữ liệu và đưa tất cả vào một công cụ nhúng, về cơ bản lấy ý nghĩa từ dữ liệu, truy xuất thông tin từ cơ sở dữ liệu vectơ bằng RAG và xây dựng “bối cảnh thông minh” mà LLM có thể sử dụng để tạo ra phản hồi theo ngữ cảnh, không gây ảo giác và hiển thị cho người dùng trong thời gian thực.
Đây không phải là chủ đề bạn được nghe nhiều ở các công ty cơ sở dữ liệu vận hành. Nhưng trong lĩnh vực cơ sở dữ liệu AI và vectơ, mức độ liên quan là sự kết hợp giữa khả năng thu hồi và độ chính xác, điều này rất quan trọng để tạo ra các phản hồi hữu ích, chính xác và không gây ảo giác.
Không giống như các hoạt động cơ sở dữ liệu truyền thống, cơ sở dữ liệu vectơ cho phép tìm kiếm ngữ nghĩa hoặc tương tự, về bản chất là không xác định. Do đó, kết quả trả về cho cùng một truy vấn có thể khác nhau tùy thuộc vào ngữ cảnh và cách thực hiện quá trình tìm kiếm. Đây là lúc độ chính xác và mức độ liên quan đóng vai trò quan trọng trong cách cơ sở dữ liệu vectơ hoạt động trong các ứng dụng trong thế giới thực. Tương tác tự nhiên yêu cầu kết quả trả về khi tìm kiếm sự tương đồng phải chính xác VÀ phù hợp với truy vấn được yêu cầu.
Các ứng dụng GenAI vượt ra ngoài POC và được đưa vào sản xuất đòi hỏi thông lượng cao. Thông lượng về cơ bản là lượng dữ liệu có thể được lưu trữ, truy cập hoặc truy xuất trong một khoảng thời gian nhất định. Thông lượng cao là yếu tố quan trọng để cung cấp các tính năng sử dụng nhiều dữ liệu, tương tác, theo thời gian thực trên quy mô lớn; việc ghi thường liên quan đến hàng tỷ vectơ từ nhiều nguồn và các ứng dụng GenAI có thể tạo ra số lượng lớn yêu cầu mỗi giây.
Giống như các làn sóng đổi mới công nghệ trước đây, GenAI đang đi theo một mô hình đã được thiết lập sẵn và tất cả các dấu hiệu đều cho thấy nó thậm chí còn phát triển nhanh hơn các cuộc cách mạng công nghệ trước đây. Nếu bạn loại bỏ tất cả những lời cường điệu tiêu cực và tích cực về nó, thì rõ ràng là các công ty đang nỗ lực chuyển ứng dụng POC GenAI của họ sang sản xuất để đạt được những tiến bộ đầy hứa hẹn.
Và các công ty như công ty DataStax của tôi, nơi cung cấp nền tảng có thể mở rộng, dễ xây dựng cho các ứng dụng này, sẽ bắt đầu nhận thấy lợi ích từ việc tiêu dùng của khách hàng sớm hơn một số người nghĩ.
Bởi Ed Anuff, DataStax
Tìm hiểu thêm về cách DataStax cho phép khách hàng đưa ứng dụng GenAI của họ vào sản xuất .