Được OpenAI ra mắt vào ngày 30 tháng 11 năm 2022, ChatGPT đã thu hút được 1 triệu người dùng với tư cách là nền tảng công nghệ phát triển nhanh nhất mọi thời đại, đốt cháy internet với AI thế hệ tiếp theo thu hút trí tưởng tượng của các kỹ sư, nhà ngôn ngữ học, nhà tiếp thị, sinh viên , và hơn thế nữa.
Về cốt lõi, ChatGPT là chatbot đa năng tiên tiến nhất thế giới, được tạo ra từ mô hình ngôn ngữ lớn (LLM) GPT-3.5. Nó đại diện cho một phiên bản lặp lại của InstructGPT, được phát hành vào tháng 1 năm 2022 và tạo ra những làn sóng tương tự nhưng nhỏ hơn trong không gian AI đàm thoại. GPT-3.5 là một biến thể của mô hình GPT-3, được đào tạo trên một loạt các đoạn trích và mã được chọn, theo giai điệu của 175 tỷ tham số, vào cuối năm 2021. Cho đến nay, kết quả thật ấn tượng.
ChatGPT có thể khai thác sức mạnh của Shakespeare để viết sonnet,
Nó được quảng cáo là quả bóng phá hủy AI đối với khối nhà văn và công cụ tìm kiếm mới xuất sắc. Không còn nghi ngờ gì nữa, khả năng tạo nội dung bắt mắt của ChatGPT và khả năng duy trì ngữ cảnh diễn ra trong suốt các cuộc trò chuyện là vô song. Tuy nhiên, trong khi các trường hợp sử dụng hướng tới người tiêu dùng đã rõ ràng, vẫn còn nhiều điều đáng mong đợi với điều kỳ diệu mới nhất của OpenAI vì nó liên quan đến các doanh nghiệp và B2B, hoặc B2B2C, triển khai trong thế giới thực.
ChatGPT (và/hoặc bất kỳ chatbot dựa trên LLM nào khác) là một thành phần chính trong công thức, không phải toàn bộ món ăn. Mặc dù các rào cản về khả năng hiểu ngôn ngữ tự nhiên (NLU) chắc chắn đã bị phá vỡ, nhưng năng lực đàm thoại của ChatGPT chỉ có thể tiến xa đến vậy. Chính xác về mặt thống kê là chưa đủ – gần chính xác, đối với các ngành dọc nhạy cảm như chăm sóc sức khỏe và chính phủ, không phải là điểm khởi đầu cho việc triển khai doanh nghiệp.
Nửa còn lại của công thức, dành cho các trường hợp sử dụng kinh doanh, sẽ phù hợp với quyền truy cập thời gian thực vào kiến thức tổ chức chuyên biệt (dữ liệu độc quyền của họ) với logic kinh doanh động (các quy trình bên trong và bên ngoài luôn thay đổi của họ), để đảm bảo độ chính xác trong khi điều hướng người dùng của họ để đạt được mục tiêu của họ. Nếu không có thành phần quan trọng bổ sung trong hỗn hợp, việc sử dụng ChatGPT hoặc bất kỳ chatbot dựa trên LLM nào khác không phải là một lựa chọn– vì vậy, trong thời gian chờ đợi, hãy mong các tổ chức đặt hàng các giải pháp doanh nghiệp khác nhau trên menu.
Nhập: các công ty AI đàm thoại hiện có.
Các đầu bếp của Sao Michelin không tự trồng cà chua, nhưng họ chắc chắn biết cách tìm ra những thứ tốt nhất xung quanh – tương tự như cách hầu hết các giải pháp AI đàm thoại không phát minh lại bánh xe với STT (Chuyển giọng nói thành văn bản) và TTS (Văn bản -to-Speech), thay vì chọn nguồn mạnh nhất hiện có từ Google hoặc Microsoft, thì các công ty AI đàm thoại cũng sẽ nhúng GPT-3.5, hiện là mô hình ngôn ngữ lớn hàng đầu trên thế giới, vào ngăn xếp đàm thoại của họ.
Những công ty sẽ thực hiện điều này một cách liền mạch—đồng thời ưu tiên tính bảo mật và độ chính xác cho khách hàng của họ—sẽ nổi lên như những người chiến thắng trong thời đại mới của trí tuệ nhân tạo đàm thoại và tạo ra. Đây là nơi điều kỳ diệu thực sự xảy ra cho các doanh nghiệp.
Hãy khám phá sự cùng tồn tại giữa các giải pháp AI đàm thoại hiện tại và ChatGPT trông như thế nào. Trước tiên, chúng tôi sẽ đề cập đến AI đàm thoại cấp doanh nghiệp cần những gì để triển khai thành công. Để khả thi đối với các doanh nghiệp và các tổ chức “nặng về thông tin” khác, AI đàm thoại cần đánh dấu vào 5 hộp chính:
Kiến thức tùy chỉnh theo thời gian thực — Để đưa ra quyết định dựa trên dữ liệu, bao gồm lên lịch hẹn với bác sĩ hoặc tìm thông tin sản phẩm kỹ thuật, người dùng yêu cầu thông tin sản phẩm và doanh nghiệp được cập nhật ngay lập tức và chính xác, thường được thu thập qua API. Các bộ dữ liệu và quy tắc kinh doanh đó vốn là duy nhất đối với từng tổ chức riêng lẻ và ngoài việc hiểu kiến thức “thông thường” như ChatGPT làm rất hiệu quả, lý tưởng nhất là các bản thể luận động của chúng sẽ cần được hấp thụ bởi biểu đồ tri thức. Đối với ChatGPT, quyền truy cập vào thông tin dành riêng cho miền đó và thậm chí dành riêng cho tổ chức là không tồn tại – và thông tin mà nó có thể cung cấp, như đã lưu ý trước đó, dựa trên một mô hình ngôn ngữ lớn đã được đào tạo về các tham số từ năm 2021, thường hiển thị tốt nhất là dữ liệu không liên quan. Tự động cập nhật cơ sở tri thức của một tổ chức, một kỹ năng chỉ có ở một số công ty AI đàm thoại dành cho doanh nghiệp được chọn, là bắt buộc để cung cấp các dịch vụ kỹ thuật số từng phút một.
Đối với những tổ chức đã ưu tiên các trường hợp sử dụng dịch vụ khách hàng và cá nhân hóa trong phạm vi triển khai của họ, điều đó bổ sung thêm một lớp kiến thức còn thiếu – dữ liệu chung cần được tích hợp dễ dàng với cả bối cảnh hội thoại đang diễn ra và tùy chọn khách hàng cá nhân được đăng nhập, giả sử, một CRM như Salesforce. Khi chỉ sử dụng thông tin chung chung và lỗi thời của LLM, đó là một trở ngại được ghi chép rõ ràng, vì các trợ lý AI đang hoạt động sẽ không thể học hoặc được đào tạo lại khi gặp phải các điểm dữ liệu mới và các kịch bản đang phát triển.
Khả năng giải thích — Trở lại năm 2021, chúng tôi đã đề cập đến GPT-3 và giống như hầu hết các mạng thần kinh, nó đại diện cho một hộp đen khiến người dùng khó có thể hiểu được lý do đằng sau các đầu ra đàm thoại thực tế. GPT-3.5—mà ChatGPT dựa trên đó—cũng có tình trạng thiếu khả năng hiển thị tương tự. Chắc chắn, con người xây dựng ChatGPT có thể kiểm soát đầu vào (dữ liệu được nhập) và chứng kiến kết quả đầu ra được tạo ra, nhưng thật không may, chúng tôi không thể hiểu cách các biến và tham số khác nhau được kết hợp để tạo ra những đầu ra đó.
ChatGPT và LLM mà nó dựa trên, thực sự ấn tượng nhờ khả năng trả lời chính xác hàng loạt câu hỏi phức tạp, nhưng nó cũng tạo ra vô số câu trả lời không chính xác do dữ liệu lỗi thời và khả năng bị đánh lừa để đưa ra các câu trả lời sai lệch. Khi trợ lý không thành công, không có trách nhiệm giải trình – không có cách nào để gỡ lỗi hoặc truy tìm/xác định nguồn gốc của kết quả đầu ra không chính xác. Theo thuật ngữ của giáo dân, ChatGPT không biết những gì nó không biết và ngoài ra, không thể tranh chấp các giả định do người dùng đề xuất.
Một lý do chính khiến các doanh nghiệp bắt đầu khám phá các công nghệ đồ thị tri thức là để tránh sự thiếu minh bạch và khả năng giải thích của dữ liệu. Bất kỳ giao diện hướng tới người dùng nào không thể lặp lại và sửa đổi đều không bền vững hoặc có thể mở rộng trong môi trường kinh doanh, đặc biệt là khi những ngành đó được coi là rất nhạy cảm.
Đây là một khía cạnh khác mà các giải pháp AI đàm thoại hiện có vượt trội hơn so với LLM. Ngay cả các chatbot tự chế dưới cùng cũng cho phép người dùng của họ thay đổi và cải thiện luồng hội thoại của họ khi cần. Trong trường hợp giao diện AI đàm thoại tinh vi hơn, người dùng không chỉ có ảnh chụp nhanh rõ ràng về lỗi mà còn có thể theo dõi, chẩn đoán và khắc phục sự cố ngay lập tức.
Tính bảo mật và khả năng dự đoán – Đặc biệt là trong các ngành nhạy cảm với dữ liệu, chẳng hạn như chăm sóc sức khỏe, chính phủ và ngân hàng, các phản hồi chung chung và tổng quát đặt ra trách nhiệm pháp lý và rủi ro mà chúng tôi hiện không biết. Nhập dữ liệu có độ nhạy cao, như EMR (Hồ sơ y tế điện tử) trong chăm sóc sức khỏe, có thể tạo ra kết quả gây nguy hiểm cho niềm tin của khách hàng vào doanh nghiệp và đặt ra câu hỏi về tính hợp lệ của toàn bộ giải pháp.
Lấy ví dụ toán học đơn giản dưới đây. 2 là một số tự nhiên và số nguyên, phải không? Sẽ không nếu bạn thiên vị ChatGPT để nghĩ khác:
Ví dụ này cho thấy rằng:
Bây giờ, hãy thực hiện các trường hợp sử dụng nhạy cảm và phức tạp hơn nhiều, chẳng hạn như kiểm tra triệu chứng hoặc truy vấn cổng thông tin bệnh nhân, những điều không thể để xảy ra ngẫu nhiên. Hiện tại, các trường hợp sử dụng và đảm bảo bảo mật liên quan đến thông tin nhận dạng cá nhân (PII) tuân thủ HIPAA phải mất nhiều năm nữa ChatGPT mới có thể trở thành một giải pháp độc lập, trừ khi nó được bảo vệ bằng các giao thức được tích hợp sẵn trong nền tảng AI đàm thoại hiện có.
Mặc dù ban đầu mở rộng từ trò chuyện qua trang web sang giọng nói qua trung tâm cuộc gọi, chúng tôi đã phải trải qua những thay đổi lớn – tối ưu hóa thời lượng, thêm ngữ cảnh và đảm bảo rằng chúng tôi đã giảm tối đa thời gian đến mục tiêu hoặc thời gian đến giá trị . Đây là một ví dụ về những gì sẽ xảy ra khi bạn không điều chỉnh:
Mặc dù điều đó có vẻ không dài về mặt văn bản, nhưng đoạn trích trên thực sự là một đoạn độc thoại dài 45 giây khi được chuyển sang tạo giọng nói AI thuần túy. Đó là UX kém thông qua các trung tâm cuộc gọi và khác xa với AI đàm thoại lấy con người làm trung tâm giống như bóng bàn mà ngành công nghiệp đang hướng tới.
Ví dụ: khi một bệnh nhân yêu cầu đặt lịch hẹn với bác sĩ, trải nghiệm phụ sẽ là truyền đạt độc quyền rằng cuộc hẹn đó tồn tại mà không có các bước tiếp theo. Điều mà người tiêu dùng của các doanh nghiệp hoạt động hiệu quả nhất thực sự cần và hiện đang mong đợi là các hành động chủ động được thực hiện để hoàn thành mục tiêu của họ từ đầu đến cuối, tức là tiếp tục và lên lịch cuộc hẹn với bác sĩ, có thể bao gồm việc cập nhật nhiều cơ sở dữ liệu hoặc API.
Các tích hợp, đặc biệt là các tích hợp dành riêng cho ngành dọc, ngày càng trở nên quan trọng khi các hành động phức tạp được cân nhắc – nếu không có chúng, ChatGPT không thể thực hiện tự động hóa thực sự ở cấp doanh nghiệp.
Độ linh hoạt của ngữ cảnh – Khả năng ChatGPT giữ ngữ cảnh, đặc biệt là trong các chuỗi phát biểu dài và duy trì một cuộc trò chuyện mang tính nhân văn xuyên suốt, là một thành tựu phi thường.
Các chabot và trợ lý giọng nói điển hình được biết là dễ bị hỏng do tính chất cứng nhắc của luồng hội thoại và ý định được xác định trước; với ChatGPT, không có bối cảnh nào bị mất trong suốt cuộc trò chuyện, nghĩa là khách hàng, những người tất nhiên dễ mắc lỗi do con người, có thể chuyển hướng, thay đổi đầu vào, diễn đạt lại, v.v. mà không bị lạc nhịp. Việc kết hợp bối cảnh và tham khảo các phần trước của cuộc trò chuyện sẽ trở thành một lợi ích không chỉ giúp nâng cao trải nghiệm của khách hàng mà còn hỗ trợ nâng cao kỹ năng cho các trường hợp sử dụng của nhân viên.
Quyền tối cao về dữ liệu – ChatGPT đại diện cho một bước tiến quan trọng đối với những người không theo chủ nghĩa tượng trưng (xem:
Ví dụ: xem đủ ảnh về đại dương và AI có thể tự tin suy luận rằng nó có màu xanh lam. Khối lượng dữ liệu khổng lồ cho phép các doanh nghiệp bỏ qua quy trình đào tạo mô hình của riêng họ chậm chạp và tốn kém thông qua máy học (ML) và vượt ra ngoài ranh giới giới hạn dữ liệu đào tạo của chính họ. Những người tượng trưng (xem:
Kết hợp các yếu tố của ChatGPT để cải thiện trải nghiệm đàm thoại, đồng thời chọn một công cụ có tính bảo mật cao hơn và được kiểm soát chặt chẽ hơn chạy trên dữ liệu doanh nghiệp, sẽ là con đường cuối cùng phía trước khi chúng ta bước vào làn sóng AI đàm thoại và sáng tạo tiếp theo này. Khi được cập nhật, kiến thức chuyên ngành có thể kết hợp nhuần nhuyễn với mô hình ngôn ngữ lớn mạnh nhất thế giới, khả năng tự động hóa hội thoại thực sự là vô tận.
Cũng được xuất bản ở đây .