पाठ उपकरणों के लिए भाषण
स्पीच-टू-टेक्स्ट डिवाइस ऑडियो रिकॉर्डिंग को ऑन-स्क्रीन टेक्स्ट में अनुवाद करके उपयोगकर्ताओं का समय बचाते हैं। यद्यपि यह उपकरण कंप्यूटर से संबंधित हार्डवेयर है, वाक् पहचान और अनुवाद प्रक्रिया को वाक् पहचान सॉफ्टवेयर द्वारा पूरा किया जाता है। कई अलग-अलग डिजिटल-वॉयस रिकॉर्डर हैं जिनमें से चुनना है, और कुछ प्रकार के वाक् पहचान कार्यक्रम हैं।
गो पर आवाज
इस पे-एज़-यू-गो सब्सक्रिप्शन सॉफ़्टवेयर में कई प्रकार की सुविधाएँ हैं जो किसी भी सेल फ़ोन पर काम करती हैं। उपयोगकर्ता अपनी आवाज का उपयोग करके 15-सेकंड के टेक्स्ट संदेश बना और भेज सकते हैं। इसका उपयोग सोशल नेटवर्किंग स्टेटस को अपडेट करने के लिए भी किया जा सकता है, और यहां तक कि छोटे "ट्विटर" -स्टाइल कैप्शन भी बना सकते हैं, जो तब वायरलेस या जीपीएस (ग्लोबल पोजिशनिंग सिस्टम) के माध्यम से आपके व्यक्तिगत इंटरनेट खातों के साथ समन्वयित होते हैं।
व्लिंगो प्लस
Vlingo Plus ब्लैकबेरी यूजर्स के लिए स्पीच-रिकग्निशन सॉफ्टवेयर है। पे-एज़-यू-गो सिस्टम के बजाय, इसके लिए एक बुनियादी ऑन-ऑफ़ खरीदारी की आवश्यकता होती है। यह प्रोग्राम उपयोगकर्ताओं को अपने ब्लैकबेरी फोन को टेक्स्ट, ईमेल, कॉल और अपडेट स्टेटस को साइड की के माध्यम से टेक्स्ट के छोटे टुकड़ों के साथ बताने की अनुमति देता है। जब आप डिवाइस को ठीक से नहीं देख पा रहे हों, जैसे कि अंधेरे में या जब आप जॉगिंग कर रहे हों, तब भी स्पर्श द्वारा इस कुंजी का पता लगाना आसान है।
बड़ा हाथ
बिगहैंड एक भाषण-से-पाठ कार्यक्रम है जिसे यूनाइटेड किंगडम स्थित कंपनी बिगहैंड द्वारा डिजाइन और कार्यान्वित किया गया है। उपयोगकर्ता मोबाइल संचार उपकरण (जैसे स्मार्ट फोन या ब्लैकबेरी) के अंदर मूल रूप से एक तानाशाही फोन का उपयोग करके अपनी आवाज रिकॉर्ड करते हैं। फिर ध्वनि रिकॉर्डिंग को वाक् पहचान कार्यप्रवाह में भेजा जाता है और ध्वनियों (शब्दों) को वैकल्पिक रूप से अशुद्धि जाँच के साथ पाठ में प्रतिलेखित किया जाता है, जो सटीकता और पठनीयता जोड़ता है। यह विस्तृत पाठ के लिए उपयोगी है, जैसे कानून प्रलेखन और नोटबंदी। उपयोगकर्ता द्वारा किसी भी गलती को ठीक किया जा सकता है, जैसा कि BigHand द्वारा वर्णित है।
ड्रैगन स्वाभाविक रूप से बोल रहा है
ड्रैगन एक बहुमुखी श्रुतलेख कार्यक्रम है, जिसे Nuance द्वारा बनाया गया है, जो विभिन्न व्यवसायों में उपयोगकर्ताओं को टाइप किए बिना दस्तावेज़ीकरण और ईमेल में डेटा बनाने और संपादित करने की अनुमति देता है - वे केवल वॉयस कमांड का उपयोग करके परिवर्तन करते हैं। साथ ही, प्रोग्राम को चालू करके और रिकॉर्ड के रूप में माइक्रोफ़ोन में बोलकर, टाइपिंग के बजाय श्रुतलेख का उपयोग करके काम के पूर्ण टुकड़े विकसित किए जा सकते हैं। ड्रैगन स्वास्थ्य सेवा उद्योग के लिए भाषण-संचालित नैदानिक दस्तावेज़ीकरण और संचार प्रदान करता है। विभिन्न संचार कंपनियों और कॉल सेंटरों के लिए ग्राहकों की बातचीत को बेहतर बनाने के लिए ड्रैगन का भी उपयोग किया जा रहा है।
सर्वश्रेष्ठ प्रणालियां
किसी भी वाक् पहचान उपकरण या सॉफ्टवेयर प्रोग्राम से अधिक से अधिक प्राप्त करने के लिए, प्रोग्राम को कम से कम वास्तविक आवाजों को पहचानने के लिए प्रशिक्षित किया जाना चाहिए। ऐसा इसलिए है क्योंकि सॉफ़्टवेयर के भीतर एल्गोरिदम समय के साथ व्यक्ति की आवाज़ और उच्चारण की बारीकियों को सीखकर काम करते हैं। यदि डिवाइस का उपयोग एक व्यक्ति या लोगों के एक छोटे समूह द्वारा किया जाता है, तो इसकी सटीकता 85 प्रतिशत हो सकती है, लेकिन यह बड़ी संख्या में उपयोगकर्ताओं के लिए तेजी से गिरती है। पहचान सॉफ्टवेयर भी अपनी गलतियों से सीखकर काम करता है, इसलिए अनुवाद के बाद मैन्युअल सुधार करना हमेशा बुद्धिमानी है।