हे हैकर्स 👋 मैं फ़्लुएंटली का संस्थापक हूँ, और मैं एक ऐसा टूल बनाने की अपनी यात्रा साझा करना चाहता हूँ जो गैर-देशी पेशेवरों को AI के साथ अपने अंग्रेजी बोलने के कौशल को बेहतर बनाने में मदद करता है। ग्रामरली के बारे में सोचें, लेकिन वीडियो कॉन्फ्रेंस के लिए।
मैं एक साल से ज़्यादा समय तक अमेरिका में रहा, जहाँ मैंने अपनी अंग्रेज़ी को उन्नत स्तर तक सुधारा। मैं लगभग सभी जानकारी, जिसमें अंग्रेज़ी में किताबें भी शामिल हैं, का उपभोग करता हूँ।
लेकिन इसके बावजूद, लंदन में रहने के पिछले 4 महीनों में एंटरप्रेन्योर फर्स्ट एक्सेलरेटर में भाग लेने के दौरान, मैंने देखा कि कभी-कभी लोग मुझसे वही दोहराने के लिए कहते थे जो मैंने कहा था। मैंने उनके चेहरों से देखा कि उन्हें कुछ भी समझ में नहीं आया। इसे छिपाना मुश्किल है।
सबसे मजेदार स्थिति तब हुई जब लातविया के एक व्यक्ति ने मुझे धीरे से बताया: "आप 'अस्पष्ट' को 'वाग्यू' बोलते हैं।" पहले शब्द का अर्थ है अस्पष्ट या अस्पष्ट, जबकि दूसरे का अर्थ है जापानी बीफ 😅
संक्षेप में, मुझे एक बार फिर अपनी अंग्रेजी सुधारने की इच्छा हुई। "ओह ठीक है, वे वैसे भी समझ जाएंगे, मैं स्थानीय नहीं हूं" का विकल्प मुझे बिल्कुल भी पसंद नहीं है। हालांकि, ट्यूटर्स के पास जाना मुश्किल है। सबसे पहले, आपको पाठों के लिए समय आवंटित करने की आवश्यकता है। दूसरे, अच्छे ट्यूटर महंगे होते हैं। तीसरे, एक घंटे के पाठ के बाद फीडबैक की मात्रा एक सप्ताह के लिए बहुत अधिक नहीं होती है।
एक एमएल इंजीनियर के रूप में मेरी पृष्ठभूमि ने मुझे सोचने पर मजबूर कर दिया: क्या होगा अगर एआई मेरी सामान्य गलतियों को ट्रैक और हाइलाइट कर सके, और उन्हें सुधारने में मेरी सहायता कर सके? एक वर्चुअल ट्यूटर की तरह जो मेरी दैनिक दिनचर्या में सहज रूप से फिट हो और मेरी अंग्रेजी को एक नए स्तर पर ले जाए। इस तरह से फ़्लुएंटली की शुरुआत हुई।
सबसे पहले, मैंने यह देखने के लिए एक सप्ताह बिताने का फैसला किया कि क्या कोई और भी इसमें दिलचस्पी रखता है। इसलिए मैंने एक लैंडिंग पेज बनाया जहाँ आप प्रतीक्षा सूची के लिए साइन अप कर सकते हैं, और साइट पर ही, मैंने बस उत्पाद के मुख्य मूल्यों को रेखांकित किया। साइट अभी तक नहीं बदली है।
फिर मैंने अपने दोस्तों को यह लैंडिंग पेज दिखाया और पूछा "अरे, देखो मुझे क्या मिला" ताकि वे देख सकें कि वे इस पर क्या प्रतिक्रिया देंगे। आश्चर्यजनक रूप से, 2/3 ने ऐप में रुचि दिखाई और साइट पर प्रतीक्षा सूची के लिए साइन अप किया। बाकी लोगों के पास या तो अच्छी अंग्रेजी है या उन्हें इसकी परवाह नहीं है।
इसके अलावा मैंने अपने टेलीग्राम चैनल पर फ़्लुएंटली का एक छोटा डेमो वीडियो शेयर किया, और कुछ दोस्तों ने इसे फिर से पोस्ट किया। परिणामस्वरूप, 200 से ज़्यादा लोग प्रतीक्षा सूची में शामिल हो गए। यह मेरे लिए निर्माण शुरू करने का एक बड़ा संकेत था!
फ़्लुएंटली एक मैक ऐप है जिसे गैर-देशी पेशेवरों को ऑनलाइन कॉल के बाद तुरंत फ़ीडबैक देकर उनकी अंग्रेज़ी सुधारने में मदद करने के लिए डिज़ाइन किया गया है, जैसे कि Google Meet या Zoom पर। कल्पना करें कि आपके पास एक निजी कोच है जो प्रत्येक कॉल के तुरंत बाद टिप्स देता है।
फ़्लुएंटली को आज़माने के लिए, एक ऐप डाउनलोड करें और इन आसान चरणों का पालन करें:
यहाँ फ़्लुएंटली फीडबैक का एक उदाहरण दिया गया है:
फ़्लुएंटली के कुछ प्रमुख लाभ और विशेषताएं:
चूंकि ऐप MacOS के लिए है, इसलिए मैंने स्विफ्ट में क्लाइंट लिखने का फैसला किया। हम इलेक्ट्रॉन पर विचार कर सकते थे, लेकिन मूल ऐप हमेशा बेहतर महसूस करते हैं। और अगर हमें किसी निम्न-स्तर पर जाना है, तो स्विफ्ट में समस्याओं को हल करना तेज़ होगा।
वर्तमान में, ऐप कॉल की शुरुआत का पता लगाता है और उपयोगकर्ता के ऑडियो का छोटे-छोटे हिस्सों में विश्लेषण करना शुरू करता है, उन्हें सर्वर पर प्रोसेस करता है। केवल उपयोगकर्ता के भाषण का विश्लेषण किया जाता है, और बातचीत करने वाले व्यक्ति का भाषण ऐप द्वारा सुना भी नहीं जाता है (हेडफ़ोन के बिना ज़ोर से बातचीत के कुछ मामलों को छोड़कर)।
बैकएंड पायथन में लिखा गया है, और एमएल मॉडल PyTorch पर हैं। सर्वर ऑडियो प्राप्त करता है और उच्चारण त्रुटियों का पता लगाता है, जिन्हें ऐप पर वापस भेजा जाता है।
मैं पाइपलाइन के कार्यान्वयन विवरण में नहीं जाऊंगा, क्योंकि यह एक अलग पोस्ट का विषय है। सरल बनाने के लिए, सब कुछ इस प्रकार व्यवस्थित किया गया है: ऑडियो को टेक्स्ट में पहचाना जाता है, टेक्स्ट को ध्वनियों में अनुवादित किया जाता है, और एक अलग मॉडल यह जांचता है कि वे ऑडियो रिकॉर्डिंग में बोली जाने वाली ध्वनियों से कितनी अच्छी तरह मेल खाते हैं।
गोपनीयता: बेशक हम रिकॉर्डिंग खुद नहीं इकट्ठा करते, सिर्फ़ त्रुटियों के आँकड़े रखते हैं। इसके अलावा, हमें मजबूत उच्चारण के साथ अंग्रेजी बोलने की ज़रूरत नहीं है। मैं इसे खुद घंटों तक रिकॉर्ड कर सकता हूँ 😅
मैं फ़्लुएंटली को बेहतर बनाने के लिए लगातार काम कर रहा हूँ। सबसे पहले, हम वेब और मोबाइल ऐप बना रहे हैं। फ़्लुएंटली के संभावित दर्शकों को महत्वपूर्ण रूप से बढ़ाने के लिए। और आपकी सबसे आम गलतियों के आधार पर डुओलिंगो जैसे दैनिक अभ्यास बनाना। यह सीखने को मज़ेदार और दैनिक दिनचर्या के लिए उपयोगी बनाने के बारे में है।
क्या आपके पास कोई प्रश्न या प्रतिक्रिया है? मैं आपसे सुनने के लिए यहाँ हूँ!