Đây là một công ty khởi nghiệp ra đời từ sự bất mãn, phá vỡ sự phù hợp giữa sản phẩm và thị trường chủ yếu thông qua công việc từ xa. Đây là công ty đã định nghĩa lại giải trí—biến nó thành một hoạt động cá nhân và di động hơn—bằng cách đưa nó vào túi của hàng triệu người trên toàn thế giới, bắt đầu từ Ấn Độ, nơi công ty bắt đầu hành trình của mình vào năm 2018.
Pocket FM đã cách mạng hóa ngành giải trí bằng cách đưa giải trí âm thanh trở nên phổ biến trên toàn thế giới. Được thành lập bởi Rohan Nayak, Prateek Dixit và Nishanth KS, Pocket FM nổi tiếng với loạt phim âm thanh hàng đầu của mình—các bộ phim truyền thanh được trình bày theo từng tập—mà mọi người trên toàn cầu trả tiền để nghe.
Pocket FM không chỉ là một trình phát giải trí over-the-top (OTT) khác với âm thanh là cốt lõi. Công ty khởi nghiệp này được biết đến là một kẻ phá vỡ thường được so sánh với các công ty OTT hàng đầu toàn cầu như Netflix và Spotify. Đó là bởi vì ba nhà sáng lập của nó đã xây dựng Pocket FM dựa trên công nghệ, đặc biệt là trí tuệ nhân tạo (AI) và các cải tiến, thay vì chỉ dựa trên nội dung.
Hãy xem xét điều này: Nếu bạn nghe các chương trình âm thanh được sản xuất bởi
Các công ty giải trí hàng đầu thế giới như Netflix và Spotify nổi tiếng với việc sử dụng AI để đề xuất và cá nhân hóa. Pocket FM đã tiến thêm một bước nữa bằng cách đưa AI vào cốt lõi để nâng cao trải nghiệm người dùng, mở rộng phạm vi tiếp cận và thậm chí tự động hóa việc tạo nội dung chất lượng cao cho người nghe trên toàn thế giới.
Những người sáng lập Pocket FM luôn trên hành trình xây dựng một nền tảng giải trí toàn cầu được hỗ trợ bởi AI ở mức tối ưu. Để đảm bảo các tiêu chuẩn toàn cầu và tuân thủ các thông lệ tốt nhất, công ty khởi nghiệp Ấn Độ này thậm chí đã lôi kéo Pannagadatta K Shivaswamy từ Netflix, công ty nổi tiếng với các đề xuất được cá nhân hóa. Trước khi gia nhập Pocket FM, Shivaswamy đã làm việc với tư cách là nhà khoa học nghiên cứu máy học (ML) tại công ty.
Một trong những sáng kiến AI gần đây của Pocket FM là quan hệ đối tác với công ty khởi nghiệp nghiên cứu công nghệ giọng nói có trụ sở tại New York là ElevenLabs. Với quan hệ đối tác này, các biên kịch của Pocket FM giờ đây có thể tạo ra loạt âm thanh của riêng họ—hay còn gọi là chương trình âm thanh theo từng tập—bằng cách sử dụng các công cụ AI do ElevenLabs cung cấp, bao gồm tính năng chuyển văn bản thành giọng nói. Theo Pocket FM, các công cụ này sẽ cho phép các biên kịch chuyển đổi câu chuyện của họ thành loạt âm thanh nhập vai bằng nhiều ngôn ngữ để tiếp cận được nhiều đối tượng khán giả hơn.
Mặc dù Pocket FM hướng đến mục tiêu dân chủ hóa cách tiếp cận hiện đại đối với kể chuyện bằng âm thanh, nhưng liên minh của họ với ElevenLabs cũng sẽ giúp nhóm của họ được trang bị những đổi mới cần thiết cho kế hoạch mở rộng toàn cầu. Trong vài năm tới, Pocket FM có kế hoạch mở rộng nền tảng loạt phim âm thanh của mình sang các thị trường tiêu dùng chính mới, bắt đầu từ Châu Âu và Châu Mỹ Latinh. Hiện tại, Pocket FM là đơn vị dẫn đầu tại Ấn Độ và Hoa Kỳ.
Nhu cầu sử dụng AI rộng rãi trở nên phổ biến ngay khi Pocket FM bước vào giai đoạn tăng trưởng. Đối mặt với lượng tiêu thụ nội dung ngày càng tăng và sở thích đa dạng của người nghe, công ty khởi nghiệp Ấn Độ nhận ra rằng các quy trình thủ công truyền thống không đủ để duy trì chất lượng và khả năng mở rộng.
Với AI, Pocket FM đã tự động hóa và hợp lý hóa các hoạt động, tăng cường tính cá nhân hóa thông qua hồ sơ người nghe tinh vi và duy trì nội dung chất lượng cao trên nhiều tệp âm thanh—nhưng đó không phải là tất cả. Pocket FM là sức mạnh của AI cho rất nhiều thứ. Chúng ta hãy cùng xem:
Nội dung do AI tạo ra : Pocket FM sử dụng xử lý ngôn ngữ tự nhiên (NLP) và mạng đối nghịch tạo sinh (GAN) để tạo và tối ưu hóa nội dung. Điều này bao gồm tạo cốt truyện, phát triển nhân vật phức tạp và giọng nói chân thực thông qua công nghệ chuyển văn bản thành giọng nói (TTS) tiên tiến. Điều này giúp giảm đáng kể thời gian và chi phí sản xuất trong khi vẫn đảm bảo đầu ra chất lượng cao.
Bản địa hóa : Pocket FM sử dụng các công cụ dịch máy thần kinh (NMT) do AI điều khiển để điều chỉnh nội dung trên nhiều ngôn ngữ và khu vực, phục vụ cho đối tượng khán giả trên toàn thế giới. Bản địa hóa tự động này đảm bảo người nghe Pocket FM trên toàn thế giới có được nội dung chính xác về mặt ngôn ngữ và phù hợp về mặt văn hóa với khu vực của họ.
Thuật toán hỗ trợ AI: Pocket FM sử dụng thuật toán AI, bao gồm lọc cộng tác và mô hình học sâu, để phân tích hành vi, sở thích và kiểu nghe của người dùng. Phương pháp tiếp cận dựa trên dữ liệu này nhằm mục đích điều chỉnh việc phân phối nội dung cho mọi người dùng theo sở thích của họ để tăng mức độ tương tác trung bình.
Quảng cáo có mục tiêu: Phân tích dự đoán do AI thúc đẩy và các mô hình ML giúp công ty nhắm mục tiêu người tiêu dùng một cách siêu chính xác bằng các quảng cáo dựa trên sở thích của người dùng và thói quen nghe. Đổi lại, điều này làm tăng hiệu quả của chiến dịch và tối đa hóa các luồng doanh thu, giảm các quảng cáo gây khó chịu cho người nghe. Ngoài ra, AI sử dụng các thuật toán phân cụm để xác định các phân khúc người dùng nhằm mục đích chuyển đổi thành người dùng trả phí.
Cơ sở hạ tầng học sâu : Pocket FM sử dụng AI để xử lý khối lượng lớn tệp âm thanh, đảm bảo nội dung chất lượng cao và tự động hóa quy trình gắn thẻ và phân loại. Điều này đảm bảo điều hướng mượt mà và giúp người nghe dễ dàng khám phá nội dung.
Đảm bảo chất lượng: Công nghệ AI đảm bảo chất lượng âm thanh nhất quán bằng cách tự động kiểm tra chất lượng và đánh dấu mọi vấn đề cần con người xem xét.
Quản lý nội dung tự động: Tự động hóa do AI điều khiển, bao gồm tự động hóa quy trình bằng rô-bốt (RPA) và quản lý nội dung dựa trên AI, hợp lý hóa các tác vụ quản lý nội dung. Điều này cho phép Pocket FM mở rộng quy mô hoạt động hiệu quả khi mở rộng thư viện nội dung và cơ sở người dùng.
Tối ưu hóa chi phí: Bằng cách tận dụng AI để nâng cao hiệu quả hoạt động, bao gồm giảm nhu cầu can thiệp của con người vào các nhiệm vụ lặp đi lặp lại, Pocket FM cắt giảm đáng kể chi phí hoạt động, nâng cao khả năng cạnh tranh trên thị trường**.**
Hơn nữa, Pocket FM thường xuyên thử nghiệm các định dạng nội dung mới và các kỹ thuật kể chuyện tương tác được thúc đẩy bởi thông tin chi tiết có được từ phân tích AI.
Mặc dù AI tự hào có một số khả năng thú vị, việc triển khai AI ở quy mô lớn trên khắp các chức năng của công ty cũng đi kèm với những thách thức riêng. Để tránh bị choáng ngợp, Pocket FM đã áp dụng cách tiếp cận theo từng giai đoạn đối với việc triển khai AI, bắt đầu bằng việc tích hợp các công cụ AI vào các dự án nhỏ hơn và dần dần mở rộng việc sử dụng chúng trên các quy trình làm việc, cung cấp cho nó đủ phạm vi để xác định và giải quyết mọi vấn đề ngay từ đầu để đảm bảo quá trình chuyển đổi diễn ra suôn sẻ hơn.
Tuy nhiên, đảm bảo tính nhất quán của dữ liệu chất lượng cao là một trong những thách thức quan trọng nhất mà công ty khởi nghiệp có trụ sở tại Ấn Độ phải đối mặt khi tích hợp AI vào hoạt động của mình. "Đào tạo các mô hình AI trên dữ liệu chất lượng kém có thể dẫn đến kết quả thiên vị, điều mà chúng tôi muốn tránh", Prateek Dixit, đồng sáng lập và giám đốc công nghệ, cho biết trong một
Theo Dixit, Pocket FM cũng gặp phải những thách thức trong việc hiểu công nghệ mới lạ này và quá trình ra quyết định của nó. Để quản lý điều đó, công ty đã phát triển các hệ thống con người trong vòng lặp hoạt động cùng với các công cụ AI để giảm thiểu tối đa các lỗi có thể xảy ra.
“Tại Pocket FM, chúng tôi coi AI là một công cụ mạnh mẽ không chỉ giúp nâng cao hoạt động của mình mà còn định nghĩa lại cơ bản trải nghiệm giải trí âm thanh”, Dixit cho biết trong
Dixit hướng đến mục tiêu đảm bảo các hoạt động AI có đạo đức trong lĩnh vực giải trí âm thanh, tập trung vào quyền riêng tư dữ liệu, tính công bằng và sự giám sát của con người thông qua quá trình phát triển có trách nhiệm. Cho đến nay, việc tích hợp AI của Pocket FM đã tạo nên bước ngoặt.
Tương lai chắc chắn sẽ tươi sáng cho AI trong âm thanh, với ngày càng nhiều sự hợp tác có thể mang lại sự đổi mới. Như Dixit nói, “Mục tiêu của Pocket FM là tận dụng sức mạnh của AI để tạo ra một thế giới nơi giải trí âm thanh không chỉ thú vị mà còn thực sự đắm chìm, cá nhân hóa và dễ tiếp cận với tất cả mọi người”.