मोज़िला का 'कॉमन वॉयस' - वॉयस रिकॉग्निशन इंप्रूवमेंट के लिए क्राउडसोर्स्ड डेटाबेस
मुझे अपने गहन स्कॉटिश लहजे के बारे में बहुत सारी प्रशंसा मिल रही है, लेकिन जब सिरी और एलेक्सा जैसे वॉयस ऐप की बात आती है, तो मेरी आवाज़ एक परिसंपत्ति से अधिक एक देयता है। जब ऐप्पल और अमेज़ॅन अपनी आवाज सहायक बना रहे थे, तो उन्हें गति-डायल पर एक स्कॉटिश उच्चारण सलाहकार नहीं लगता था।
यदि आवाज मान्यता को भविष्य का तरीका माना जाता है - और माना जाता है कि जहाँ हम शीर्षासन करने के लिए होते हैं - तब खोज इंजन और आवाज सहायकों को कठिन लहजे को समझने का एक बेहतर काम शुरू करने की आवश्यकता होती है। हम सभी के पास सार्वजनिक अंग्रेजी स्कूली लहजे नहीं हैं।
<आंकड़ा वर्ग = "आलसी एलाइनकेंटर">figure / div>
मोज़िला (फ़ायरफ़ॉक्स ब्राउज़र के निर्माता) लोगों को अपनी आवाज़ स्वेच्छा से "डेटाबेस के लिए पूछकर हल करने का प्रयास कर रहे हैं, जिसे" आम आवाज कहा जाता है। वाक्यांश सेट करने के लिए आवाज़ों का मिलान करके, मोज़िला उम्मीद कर रही है कि उनका डेटाबेस भविष्य में किसी भी ऐप के लिए आवाज पहचान के आधार पर भविष्य में एक अमूल्य उपकरण होगा।
'कॉमन वॉइस' के लिए साइन अप
इससे पहले कि हम आगे बढ़ते हैं, चलो गोपनीयता के मुद्दों को पहले से बाहर कर दें, जैसा कि मैं उन्हें पहले से ही सुन सकता हूं।
<आंकड़ा वर्ग = "आलसी संरेखण ">
जबकि आपके लिए अपने फ़ायरफ़ॉक्स खाते, जीथब खाते या Google खाते का उपयोग करके साइन अप करना संभव है, आप इसके बजाय ईमेल के माध्यम से साइन अप कर सकते हैं। । बस एक गुमनाम थ्रोअवे ईमेल खाता खोलें और कोई भी ऐसा कोई भी समझदार नहीं होगा जिसे आप बोल रहे हैं।
एक बार जब आप एक खाता बना लेते हैं और लॉग इन कर लेते हैं, तो आप अपना डैशबोर्ड देखें । / p>
<आंकड़ा वर्ग = "lazy aligncenter">
दो खंड हैं - बोलेंऔर सुनें। बोलेंअनुभाग वह जगह है जहां आपको अपनी स्वयं की आवाज का योगदान देने के लिए कहा जाता है। सुनोवह स्थान है जहां आप अन्य लोगों की आवाज़ सुनते हैं और उनकी तुलना उस वाक्यांश से करते हैं, जो उन्हें बोलना था। फिर आप इंगित करेंगे कि क्या यह सही था।
बोलें
बोलने वाले भाग में भाग लेने के लिए, आपको एक कामकाजी माइक्रोफोन की आवश्यकता होगी जो आपकी आवाज़ को स्पष्ट रूप से उठाएगा। आपको मोज़िला साइट को उस माइक्रोफोन तक पहुँच प्रदान करने की आवश्यकता है।
<आंकड़ा वर्ग = "आलसी संरेखण">11 11 >
जब आप बोलेंअनुभाग पर क्लिक करते हैं, तो आपको बोलने के लिए पांच यादृच्छिक वाक्यांशों का एक सेट दिया जाएगा। निर्देश स्क्रीन पर बहुत स्पष्ट रूप से और आसानी से अनुसरण कर रहे हैं।
<आंकड़ा वर्ग = "आलसी संरेखण">on >
आप बस नीचे दिए गए माइक्रोफ़ोन आइकन पर क्लिक करें और फिर अपनी सामान्य आवाज़ में वाक्य पढ़ें। अप्राकृतिक उच्चारण पर न डालें या वास्तव में धीरे-धीरे बोलें।
अभ्यास का पूरा बिंदु यह है कि डेटाबेस लोगों को समझने के लिए सीखता है कि वे जिस तरह से सामान्य रूप से बोले जाते हैं। दूसरे तरीके से बोलना पूरी बात को व्यर्थ कर देता है।
जब पहला वाक्यांश हो चुका है, तो आप शीर्ष-दाएं कोने में क्लिप को प्लेबैक करने या क्लिप को फिर से रिकॉर्ड करने के विकल्प देखेंगे आप इससे खुश नहीं हैं।
<आंकड़ा वर्ग = "lazy aligncenter">
यदि आप इससे खुश हैं, तो यह आगे बढ़ता है। अगले एक पर और तब तक जारी रहता है जब तक कि सभी पांच वाक्यांश पूरे नहीं हो जाते। फिर चेक करने के लिए अपनी क्लिप को मोज़िला भेजने के लिए ब्लू सबमिट बटन पर क्लिक करें।
<आंकड़ा वर्ग = "आलसी एलाइनकेंटर">आंकड़ा>
यदि आप अब वापस जाते हैं, तो आप देखेंगे कि आपको उन वाक्यांशों के लिए श्रेय दिया गया है।
<आंकड़ा वर्ग =" आलसी संरेखण ">आकृति>
फिर यह कुल्ला और दोहराने का एक सरल मामला है। मोज़िला को अपने डेटाबेस में जितना अधिक योगदान और विभिन्न लहजे मिल सकते हैं, उतनी ही सफल परियोजना होगी।
सुनो
एक बार जब लोग मोज़िला को अपने वाक्यांश प्रस्तुत कर देते हैं, तो उन्हें जांचने की आवश्यकता होती है। यह सुनिश्चित करने के लिए कि वॉइस क्लिप वाक्यांश से मेल खाती है। यह कुछ ऐसा है जो स्वयंसेवकों के लिए भी भीड़ हो रहा है।
पीछे डैशबोर्ड पर, आपको दाईं ओर सुनोअनुभाग दिखाई देगा। आप शीर्ष योगदानकर्ताओंअनुभाग से देख सकते हैं कि कुछ गंभीर आँकड़े ऊपर उठाए गए हैं।
<आंकड़ा वर्ग = "आलसी एलाइनकेंटर">
ध्वनि वाक्यांशों को मान्य करने के लिए, बात सुनोपर जाएं। अनुभाग और आपको एक वाक्यांश और एक प्ले बटन दिया जाएगा।
<आंकड़ा वर्ग = "lazy aligncenter">यदि आप तय करते हैं कि वाक्यांश सही ढंग से बोला गया था, तो हांक्लिक करें। यदि कुप्रबंधन था, तो कुछ और कहा गया था, या कोई अन्य त्रुटि, NOक्लिक करें।
निष्कर्ष
18 azy है, जो इस समय चल रही कई परियोजनाओं में से एक है, जो फिलहाल मोज़िला के पास हैऔर शीर्ष पर प्रोजेक्ट्सक्लिक करें - यह हर समय बदलता रहता है)। क्राउडसोर्सिंग योग्य परियोजनाओं के होने का एक शानदार तरीका है और यह हमेशा भविष्य के लिए उपयोगी कुछ बनाने में मदद करने के लिए अपना समय दान करने के लायक है।
मोज़िला & # 39; रों DeepSpeech और आम आवाज परियोजनाओं हर के लिए खुला है और ऑफ़लाइन-सक्षम आवाज की पहचान ...